关注 GPT-5、Claude 4 系列、Gemini 系列等模型在推理、代码、长上下文和多模态任务上的变化。
AI Notes / 2026
记录大模型时代的技术细节与实践思考
这里暂时作为个人技术分享页,记录我对 AI 模型、智能体、检索增强、多模态理解和工程落地的阅读笔记。 内容以学习、复盘和观点整理为主,尽量写清楚一个问题背后的方法、边界与取舍。
整理工具调用、记忆、任务拆解、结果校验和人机协作流程,关注稳定性而不是概念堆叠。
记录向量检索、重排、知识切片、引用溯源和回答可信度方面的实践经验。
模型观察
不做排行榜,只记录这些模型在日常使用中的差异:推理是否稳、写代码是否能闭环、长材料是否会漏细节。
重点观察复杂任务拆解、代码生成、工具调用和事实可靠性。使用时会特别关注它是否能主动检查前后矛盾。
适合观察长文阅读、代码审阅和多步骤任务。我的记录重点是它如何保留上下文,以及如何解释取舍。
重点关注多模态理解、资料整理和跨格式输入。尤其适合观察图片、文档与文本问题混合时的表现。
少写热闹结论,多写可复现的观察;少追概念,多看模型在真实任务里有没有把事情做完。
实践笔记
这些内容会更偏实操:怎么拆任务、怎么准备上下文、怎么判断输出是否可信。
好的提示词更像任务说明:目标、输入、约束、判断标准和输出格式都要清楚,模型才容易稳定发挥。
自动执行很有吸引力,但每一步都需要可观察、可回退、可验证,否则流程越长,错误越难定位。
检索增强不是把资料塞给模型,而是让答案能回到原文,能解释依据,也能暴露不确定的地方。
学习路线
给自己留一条持续更新的路线,从基础概念到真实任务,逐步沉淀成可复用的方法。
读懂模型
关注上下文、推理、工具调用、多模态和安全边界,不只看宣传亮点。
整理任务
把模糊需求拆成输入、过程、约束和验收标准,先把问题讲清楚。
动手验证
用代表性样例测试,记录失败原因,不把一次成功当成稳定能力。
复盘沉淀
把有效流程写成清单,把常见错误写成提醒,下一次少走弯路。
文章计划
后续会把零散记录整理成系列文章,先从能被实际验证的主题开始。
从理解需求、保持上下文、执行动作、发现错误和说明结果五个角度拆开看。
记录切片、召回、重排、引用和拒答策略,重点看回答能否回到资料本身。
不只看代码是否生成,还要看是否理解原有结构、是否跑过验证、是否影响已有功能。