LangChat.cn 个人 AI 技术分享

AI Notes / 2026

记录大模型时代的技术细节与实践思考

这里暂时作为个人技术分享页,记录我对 AI 模型、智能体、检索增强、多模态理解和工程落地的阅读笔记。 内容以学习、复盘和观点整理为主,尽量写清楚一个问题背后的方法、边界与取舍。

大模型观察 AI 编程 智能体实践 检索增强 多模态理解
模型能力

关注 GPT-5、Claude 4 系列、Gemini 系列等模型在推理、代码、长上下文和多模态任务上的变化。

智能体

整理工具调用、记忆、任务拆解、结果校验和人机协作流程,关注稳定性而不是概念堆叠。

检索增强

记录向量检索、重排、知识切片、引用溯源和回答可信度方面的实践经验。

模型观察

不做排行榜,只记录这些模型在日常使用中的差异:推理是否稳、写代码是否能闭环、长材料是否会漏细节。

GPT-5

重点观察复杂任务拆解、代码生成、工具调用和事实可靠性。使用时会特别关注它是否能主动检查前后矛盾。

推理 代码 工具调用
Claude 4 系列

适合观察长文阅读、代码审阅和多步骤任务。我的记录重点是它如何保留上下文,以及如何解释取舍。

长文本 代码审阅 任务规划
Gemini 系列

重点关注多模态理解、资料整理和跨格式输入。尤其适合观察图片、文档与文本问题混合时的表现。

多模态 资料整理 长上下文
写作原则

少写热闹结论,多写可复现的观察;少追概念,多看模型在真实任务里有没有把事情做完。

实践笔记

这些内容会更偏实操:怎么拆任务、怎么准备上下文、怎么判断输出是否可信。

提示词不是咒语

好的提示词更像任务说明:目标、输入、约束、判断标准和输出格式都要清楚,模型才容易稳定发挥。

智能体要有刹车

自动执行很有吸引力,但每一步都需要可观察、可回退、可验证,否则流程越长,错误越难定位。

检索要看答案来源

检索增强不是把资料塞给模型,而是让答案能回到原文,能解释依据,也能暴露不确定的地方。

学习路线

给自己留一条持续更新的路线,从基础概念到真实任务,逐步沉淀成可复用的方法。

Step 1

读懂模型

关注上下文、推理、工具调用、多模态和安全边界,不只看宣传亮点。

Step 2

整理任务

把模糊需求拆成输入、过程、约束和验收标准,先把问题讲清楚。

Step 3

动手验证

用代表性样例测试,记录失败原因,不把一次成功当成稳定能力。

Step 4

复盘沉淀

把有效流程写成清单,把常见错误写成提醒,下一次少走弯路。

文章计划

后续会把零散记录整理成系列文章,先从能被实际验证的主题开始。

怎样评价一个 AI 助手是否好用

从理解需求、保持上下文、执行动作、发现错误和说明结果五个角度拆开看。

把资料库做成可靠问答

记录切片、召回、重排、引用和拒答策略,重点看回答能否回到资料本身。

AI 写代码时我会检查什么

不只看代码是否生成,还要看是否理解原有结构、是否跑过验证、是否影响已有功能。