LLM 24

代码阅读与运行1 2025年09月28日
大模型入门（6）——Agent、MCP、FunctionCall 2025年09月28日
代码阅读与运行2 2025年09月28日
MCP(1)——MCP概述 2025年09月28日
LangChain框架学习 2025年09月28日
大模型入门（8）——vLLM框架 2025年09月28日
n8n和Agent 2025年09月28日
Ray 2025年09月28日
Qwen2.5-3B（GRPO）的复现实验记录 2025年09月28日
MiniMind项目复现记录 2025年09月28日
增强SLMs的Tool use能力 2025年09月28日
大模型入门（7）——RAG 2025年09月3日
强化学习数学基础学习 2025年08月11日
论文阅读（5）——LLM-EPSP 2025年08月5日
阶段性总结（2）——论文分类 2025年07月21日
论文阅读（4）——知识蒸馏/GRPO/DPO 2025年07月21日
论文阅读（3）——技术报告 2025年07月21日
大模型入门（5）——阶段性小结 2025年07月21日
论文阅读（2）——微调及相关技术 2025年07月21日
大模型入门（4）——冷启动数据、推理类与非推理类SFT数据 2025年07月21日
论文阅读（1）——奖励替代/无监督/半监督强化学习 2025年07月21日
大模型入门（3）——学习OpenRLHF框架 2025年07月21日
大模型入门（2）——初读两篇论文后的感悟 2025年07月21日
大模型入门（1）——“人人都能看懂的RL-PPO理论知识” 2025年07月21日