跳过正文

AI

浅入浅出 Rerank 模型
·4290 字·9 分钟
检索 AI RAG
随着 Transformer 架构的流行,目前很多 Embedding 和 Rerank 模型都逐渐基于这个架构。借此机会梳理一下研究的过程和历史,盘点一下目前几个知名的 Rerank 模型的组织和公司所采用的架构。最后回归正题浅谈目前 RAG 场景到底要不要用 Rerank。
读书笔记《大语言模型》
·19143 字·39 分钟
书籍阅读 大模型 AI
《大语言模型》的阅读笔记,相对于《大规模语言模型》,这本更偏向于相关的理论结合实践和应用。
TiDB Vector + Dify 快速构建 AI Agent
·1996 字·4 分钟
向量库 LlmOps 大模型 AI
申请到了TiDB Vector试用,顺便尝试用它来支持 Dify 的知识库。
基于 LLM 推动游戏叙事
·2039 字·5 分钟
论文阅读 大模型 AI
5月初看到一篇基于 LLM 开发文本游戏的论文感觉挺有意思,但是拖延症一直到现在才发
混合专家模型 (MoE) 笔记
·2438 字·5 分钟
MoE 大模型 AI 论文阅读
梳理 MoE 模型概念和架构,简述了 GShard、Switch Transformer、DeepSeek-MoE、LLaMA-MoE 模型中的特点。
读书笔记《大规模语言模型:从理论到实践》
·16129 字·33 分钟
大模型 书籍阅读 AI
《大规模语言模型:从理论到实践》的阅读笔记,简要地记录一些知识点