git指令

因为现在做项目需要连接远程仓库与同学配合，列一下常用的指令初始化本地仓库 git init 连接远程仓库 git remote add origin git@github.com:PeachMooch/SBQY-Digital-Museum-.git origin是默认的远程仓库名称 git@gi

2025-09-28 宇宙机

n8n和Agent

n8n 是 “node” 和 “automation” 的组合缩写（“nodemation”，首尾之间有 8 个字母），代表它是一个基于节点（node）的工作流自动化平台。 Agent介绍 Agent更像是一个动态的、灵活的、有自主推理能力的数字员工 Agent三大组件 1.大脑为Agent提供智

2025-09-28 LLM

Ray

Ray的介绍 Hello,Ray import ray import time # Start Ray. ray.init() @ray.remote def f(x): time.sleep(1) return x # Start 4 tasks in parallel. r

2025-09-28 LLM

Qwen2.5-3B（GRPO）的复现实验记录

github链接：hkust-nlp/simpleRL-reason: Simple RL training for reasoning 训练脚本主要参数含义 1.MAX_PROMPT_LENGTH=1024 含义：模型能处理的输入文本（提示词/Prompt）的最大长度 2.MAX_RESPONSE

2025-09-28 LLM

MiniMind项目复现记录

写在最前面在跑OpenRLHF库下的Simple-Reason项目的时候，遭遇了很多挫折，并且很多工作仅停留在应用层面，局限于调参和修改路径，对语言模型的底层认知还是非常匮乏。因此在跑Simple-Reason项目的过程中，我尝试开始复现MiniMind项目，旨在在国庆假期结束前，完成项目的复现

2025-09-28 LLM

增强SLMs的Tool use能力

附录主要记录自己在阅读论文、技术博客过程中见到的概念、现象。

2025-09-28 LLM

大模型入门（7）——RAG

初步认识RAG 技术栈选择与架构设计 - Jimmy Song RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合了信息检索技术与语言生成模型的人工智能技术。该技术通过从外部知识库中检索相关信息，并将其作为提示（Prompt）输入给大型语言模型（LLMs

2025-09-03 LLM

强化学习数学基础学习

学习的是b站上西湖大学WindyLab的课程，以下是链接：【【强化学习的数学原理】课程：从零开始到透彻理解（完结）】https://www.bilibili.com/video/BV1sd4y167NS?vd_source=a704063646d181fb265230f6b49cca81 笔记整理

2025-08-11 LLM 数理基础

论文阅读（5）——LLM-EPSP

Sparking words: In-context learning（情景学习ICL）通过ICL技术，大模型可以直接利用提示中包含的少量标注实例进行学习。与需要昂贵参数更新且可能导致已知任务性能下降的微调方法不同，ICL在推理阶段直接利用提示中的标注实例生成文本，完全绕过了传统训练流程。这种方法

2025-08-05 LLM

阶段性总结（2）——论文分类

LLM领域论文主题分类汇总 📋 概述本文档对当前LLM（大型语言模型）领域的重要研究进行主题分类，涵盖强化学习优化、知识蒸馏、推理能力提升、统一训练框架、专项应用及安全对齐等六大核心方向。 🔧 一、强化学习优

2025-07-21 LLM