RAG
使用 TiDB Vector 构建 LightRAG 知识库
·2505 字·5 分钟
RAG
LLM
AI
TiDB
工程实践
梳理了 LightRAG 之后,发现 LightRAG 对持久化支持的还不够多,缺少了最重要的 TiDB (不是)。故抽空贡献之,顺便写个软文。
从论文到源码:详解 RAG 算法
·11763 字·24 分钟
RAG
LLM
AI
论文笔记
算法原理
本文旨在通过论文+源码的解读,探究 RAG 算法的架构设计和具体的代码实现。本文主要讨论了 GraphRAG、LightRAG 和 RAPTOR RAG,除此之外还提及了 Anthropic 提出的 Contextual Retrieval 上下文检索和 RAG 算法的评估方法。最后在实践中,建议还是根据知识库文档的规模来选择不同的方法。
浅入浅出 Rerank 模型
·4341 字·9 分钟
检索
AI
RAG
论文笔记
随着 Transformer 架构的流行,目前很多 Embedding 和 Rerank 模型都逐渐基于这个架构。借此机会梳理一下研究的过程和历史,盘点一下目前几个知名的 Rerank 模型的组织和公司所采用的架构。最后回归正题浅谈目前 RAG 场景到底要不要用 Rerank。
使用 Coze 搭建 TiDB 助手
·3109 字·7 分钟
大模型
RAG
LlmOps
本文详细介绍了使用 Coze 平台搭建 TiDB 文档助手的全过程。此外,文章介绍了 TiDB Help Bot 的设计和实现,并明确了机器人的角色和使用限制。
向量相似性检索方法
·5606 字·12 分钟
检索算法
RAG
向量数据库
算法原理
本文详细介绍了多种向量相似性检索方法,如 KD 树、IVF 倒排索引、HNSW 和 LSH。通过分析 Annoy、Faiss、PGVector 和 FALCONN 源码中的具体实现,从数据结构到算法实现进行了详细的介绍。