跳过正文

算法原理

2024

混合专家模型 (MoE) 笔记
·2438 字·5 分钟
算法原理
梳理 MoE 模型概念和架构,简述了 GShard、Switch Transformer、DeepSeek-MoE、LLaMA-MoE 模型中的特点。

2023

读书笔记《大规模语言模型:从理论到实践》
·16154 字·33 分钟
算法原理 阅读笔记
《大规模语言模型:从理论到实践》的阅读笔记,简要地记录一些知识点
TiDB知识点梳理 (PCTA 笔记)
·8886 字·18 分钟
算法原理
之前对看了TiDB 数据库核心原理与架构(101),但笔记比较潦草,索性写个完整笔记,顺便追源码
向量相似性检索方法
·5665 字·12 分钟
算法原理
kNN/ANN近邻算法梳理,简单介绍了基于KD-tree/IVF/HNSW/LSH的ANN实现