跳过正文

大模型

读书笔记《大语言模型》
·19143 字·39 分钟
书籍阅读 大模型 AI
本文是《大语言模型》的阅读笔记,详细介绍了大语言模型的发展历程、训练优化方法、数据处理技术、解码策略、模型量化、模型压缩、提示学习、评测指标和方法,以及知识图谱在大语言模型中的应用,特别关注了扩展法则、涌现能力、人类对齐和多智能体系统等关键概念和技术。
TiDB Vector + Dify 快速构建 AI Agent
·1996 字·4 分钟
向量库 LlmOps 大模型 AI
本文介绍了如何使用 Dify 和 TiDB Vector 快速构建 AI Agent,包括前期准备、部署 Dify、配置知识库和创建 Agent 的详细步骤,以及源码分析和表结构设计。文章提供了 Dify 接入 TiDB Vector 后的表结构设计和 SQL 查询语句,帮助开发者更好地理解和使用这一集成方案。
基于 LLM 推动游戏叙事
·2039 字·5 分钟
论文阅读 大模型 AI 论文笔记
本文介绍了论文《Player-Driven Emergence in LLM-Driven Game Narrative》,探讨了如何利用 GPT-4 在游戏中实现更灵活和丰富的对话和叙事结构,并发现玩家创造了新的叙事节点,这被称为叙事的涌现。
混合专家模型 (MoE) 笔记
·2438 字·5 分钟
MoE 大模型 AI 论文阅读 论文笔记
本文主要梳理了混合专家模型 (MoE) 的相关概念,并介绍了几种开源 MoE 模型的架构和优化方法,如 GShard、Switch Transformers、DeepSeek-MoE 和 LLaMA-MoE 等模型的特点和优化方法。
使用 Coze 搭建 TiDB 助手
·3109 字·7 分钟
大模型 RAG LlmOps
本文详细介绍了使用 Coze 平台搭建 TiDB 文档助手的全过程。此外,文章介绍了 TiDB Help Bot 的设计和实现,并明确了机器人的角色和使用限制。
读书笔记《大规模语言模型:从理论到实践》
·16129 字·33 分钟
大模型 书籍阅读 AI
本文是《大规模模型语言》一书的笔记。详细探讨了语言模型的发展历程、基本概念和概率分布建模方法,随后重点讨论了大模型的发展历程和构建流程。文章也详细描述了Transformer模型、GPT和LLaMA模型的特点和优化方法。此外,文章还介绍了分布式训练技术、并行策略、强化学习的基本概念和应用,以及语言模型的评估指标和方法。