跳过正文

文章

2024

使用 TiDB Vector 构建 LightRAG 知识库
·2505 字·5 分钟
RAG LLM AI TiDB 工程实践
梳理了 LightRAG 之后,发现 LightRAG 对持久化支持的还不够多,缺少了最重要的 TiDB (不是)。故抽空贡献之,顺便写个软文。
从论文到源码:详解 RAG 算法
·11763 字·24 分钟
RAG LLM AI 论文笔记 算法原理
本文旨在通过论文+源码的解读,探究 RAG 算法的架构设计和具体的代码实现。本文主要讨论了 GraphRAG、LightRAG 和 RAPTOR RAG,除此之外还提及了 Anthropic 提出的 Contextual Retrieval 上下文检索和 RAG 算法的评估方法。最后在实践中,建议还是根据知识库文档的规模来选择不同的方法。
云南之行——游在大理食在昆明
·3666 字·8 分钟
旅游 随笔闲谈 美食
十一和女友去了云南玩,梳理一些令人印象深刻的美食和风景。
浅入浅出 Rerank 模型
·4341 字·9 分钟
检索 AI RAG 论文笔记
随着 Transformer 架构的流行,目前很多 Embedding 和 Rerank 模型都逐渐基于这个架构。借此机会梳理一下研究的过程和历史,盘点一下目前几个知名的 Rerank 模型的组织和公司所采用的架构。最后回归正题浅谈目前 RAG 场景到底要不要用 Rerank。
一年同行:我的TiDB社区之旅
·1305 字·3 分钟
随笔闲谈
加入 TiDB 社区快一年了,回顾一下这一年和 TiDB 有关的经历 👀
读书笔记《大语言模型》
·19143 字·39 分钟
书籍阅读 大模型 AI
本文是《大语言模型》的阅读笔记,详细介绍了大语言模型的发展历程、训练优化方法、数据处理技术、解码策略、模型量化、模型压缩、提示学习、评测指标和方法,以及知识图谱在大语言模型中的应用,特别关注了扩展法则、涌现能力、人类对齐和多智能体系统等关键概念和技术。
TiDB Vector + Dify 快速构建 AI Agent
·1996 字·4 分钟
向量库 LlmOps 大模型 AI
本文介绍了如何使用 Dify 和 TiDB Vector 快速构建 AI Agent,包括前期准备、部署 Dify、配置知识库和创建 Agent 的详细步骤,以及源码分析和表结构设计。文章提供了 Dify 接入 TiDB Vector 后的表结构设计和 SQL 查询语句,帮助开发者更好地理解和使用这一集成方案。
基于 LLM 推动游戏叙事
·2039 字·5 分钟
论文阅读 大模型 AI 论文笔记
本文介绍了论文《Player-Driven Emergence in LLM-Driven Game Narrative》,探讨了如何利用 GPT-4 在游戏中实现更灵活和丰富的对话和叙事结构,并发现玩家创造了新的叙事节点,这被称为叙事的涌现。
HTTP/2 和 CONTINUATION Flood
·3573 字·8 分钟
网络 安全漏洞 HTTP/2
本文主要介绍了 HTTP/2 协议及其 CONTINUATION Flood 问题。文章通过 golang.org/x/net 源码展示了如何在 Http2 相关代码中解析 Frame 结构,并详细分析了 CONTINUATION Flood 攻击的三种安全风险,以及相应的解决办法。
混合专家模型 (MoE) 笔记
·2438 字·5 分钟
MoE 大模型 AI 论文阅读 论文笔记
本文主要梳理了混合专家模型 (MoE) 的相关概念,并介绍了几种开源 MoE 模型的架构和优化方法,如 GShard、Switch Transformers、DeepSeek-MoE 和 LLaMA-MoE 等模型的特点和优化方法。
报告分享: IMF第四次磋商报告 和 美联储研究笔记
·2806 字·6 分钟
报告阅读 宏观经济
本文简要分析了IMF 2 月份发布的对中国 2023 年经济的第四次磋商报告和美联储关于中国‘自力更生’政策的研究笔记,探讨了中国的经济增长模式、房地产市场、进口依赖度下降、汽车行业和外商直接投资(FDI)的变化及其对中国经济的影响。
使用 Coze 搭建 TiDB 助手
·3109 字·7 分钟
大模型 RAG LlmOps
本文详细介绍了使用 Coze 平台搭建 TiDB 文档助手的全过程。此外,文章介绍了 TiDB Help Bot 的设计和实现,并明确了机器人的角色和使用限制。
2023年总结
·4878 字·10 分钟
随笔闲谈
今年不管是自己还是社会都有很多变化,想尝试用文字记录下来。

2023

读书笔记《大规模语言模型:从理论到实践》
·16129 字·33 分钟
大模型 书籍阅读 AI
本文是《大规模模型语言》一书的笔记。详细探讨了语言模型的发展历程、基本概念和概率分布建模方法,随后重点讨论了大模型的发展历程和构建流程。文章也详细描述了Transformer模型、GPT和LLaMA模型的特点和优化方法。此外,文章还介绍了分布式训练技术、并行策略、强化学习的基本概念和应用,以及语言模型的评估指标和方法。
TiDB知识点梳理 (PCTA 笔记)
·8899 字·18 分钟
TiDB 数据库 学习笔记
之前对看了TiDB 数据库核心原理与架构(101),但笔记比较潦草,索性写个完整笔记,顺便追源码
向量相似性检索方法
·5606 字·12 分钟
检索算法 RAG 向量数据库 算法原理
本文详细介绍了多种向量相似性检索方法,如 KD 树、IVF 倒排索引、HNSW 和 LSH。通过分析 Annoy、Faiss、PGVector 和 FALCONN 源码中的具体实现,从数据结构到算法实现进行了详细的介绍。
Java & Go 线程模式对比
·8149 字·17 分钟
Java 语言 Go 语言 线程管理 源码解析 编程框架
本文详细对比了 Java 和 Go 两种编程语言中的线程模型和调度机制,从源码角度分析了它们的具体实现和设计思想,特别是 Java 中的 Thread 与操作系统线程的 1:1 对应关系,以及 Go 中的 goroutine 通过 GPM 模型进行管理的 n:m 关系。
Hugo + umami 博客统计面板
·2277 字·5 分钟
博客搭建 Hugo Umami
本文详细描述了多种 Umami 部署方案的具体配置步骤,并对每种方案的优缺点和适用场景也进行了简要说明。文章重点介绍了在 Hugo 框架下配置 Umami 的方法,包括在不同主题中添加 Umami 跟踪代码的具体步骤,以及一些高级配置选项,如 TrackEvent 和 Tracker 参数。
资产配置 101
·4510 字·10 分钟
金融理财 投资 学习笔记
介绍长短期资产配置的原理和方法,和一些知名投资策略的机构
探究 Spring-Boot 内置Server
·3736 字·8 分钟
Spring Framework Java 语言 源码解析 编程框架
本文详细探讨了 Spring Boot 内置的 Web 服务器(包括 Tomcat、Jetty、Undertow 和 Netty)的原理和使用,特别关注了 Servlet 和 Reactive 框架的区别及其在 Spring Framework 5.0 中的实现,包括 WebServer 接口和 WebServerFactory 的具体实现