最近的文章
多模态模型是如何处理和理解图片的?
·6721 字·14 分钟
AI
多模态
机器学习
ViT
CLIP
视觉编码
从Vision Transformer到图文对齐,探索多模态模型背后的核心技术原理与实现方法,包括CLIP、SigLIP以及主流多模态大模型的视觉编码策略。
从配料表出发:便秘的猫应该怎么选主食
·3496 字·7 分钟
猫咪健康
便秘
猫粮推荐
高纤维
主食罐头
配料表分析
宠物营养
结合实际养猫经验,梳理适合便秘及肠胃敏感猫咪的主食猫粮和罐头选择标准,重点分析市售易消化、高膳食纤维产品的配料表和成分,帮助科学挑选有助于猫咪肠道健康的主食。
盘点开源的 DeepResearch 实现方案
·6702 字·14 分钟
DeepResearch
DeepSearch
Agent
LLM
Dify
LangChain
HuggingFace
Zilliz
智能体
大模型应用
基于源码分析开源的 DeepResearch 实现,包括 Dify、LangChain、HuggingFace 和 Zilliz Cloud 等方案的工程架构、Agent 设计、提示词和核心流程。
浅谈 DeepSeek-R1 和 Kimi k1.5 论文中的思维链 + 强化学习
·2588 字·6 分钟
AI
LLM
CoT
强化学习
DeepSeek
Kimi
模型蒸馏
思维链
浅谈 DeepSeek-R1 和 Kimi k1.5 两个模型在推理能力上的技术特点:DeepSeek 采用 GRPO 算法和模型蒸馏提升推理表现,Kimi 则探索长文本思维链和强化学习的结合方案。
使用 TiDB Vector 构建 LightRAG 知识库
·2505 字·5 分钟
RAG
LLM
AI
TiDB
工程实践
梳理了 LightRAG 之后,发现 LightRAG 对持久化支持的还不够多,缺少了最重要的 TiDB (不是)。故抽空贡献之,顺便写个软文。
从论文到源码:详解 RAG 算法
·11763 字·24 分钟
RAG
LLM
AI
论文笔记
算法原理
本文旨在通过论文+源码的解读,探究 RAG 算法的架构设计和具体的代码实现。本文主要讨论了 GraphRAG、LightRAG 和 RAPTOR RAG,除此之外还提及了 Anthropic 提出的 Contextual Retrieval 上下文检索和 RAG 算法的评估方法。最后在实践中,建议还是根据知识库文档的规模来选择不同的方法。
云南之行——游在大理食在昆明
·3666 字·8 分钟
旅游
随笔闲谈
美食
十一和女友去了云南玩,梳理一些令人印象深刻的美食和风景。
浅入浅出 Rerank 模型
·4341 字·9 分钟
检索
AI
RAG
论文笔记
随着 Transformer 架构的流行,目前很多 Embedding 和 Rerank 模型都逐渐基于这个架构。借此机会梳理一下研究的过程和历史,盘点一下目前几个知名的 Rerank 模型的组织和公司所采用的架构。最后回归正题浅谈目前 RAG 场景到底要不要用 Rerank。
一年同行:我的TiDB社区之旅
·1305 字·3 分钟
随笔闲谈
加入 TiDB 社区快一年了,回顾一下这一年和 TiDB 有关的经历 👀