2026.5 期
2026.5 期
5.30
- Claude Dynamic Workflows解析,迎接全新的AI编程生态:解析 Anthropic 发布的 Claude Code Dynamic Workflows 能力——Claude 不再只是对话对象,而是像一个真正的工程团队:先理解目标,再自编写 JavaScript 编排脚本,在后台启动数十到上千个 Subagent 并行工作,从不同角度分析问题、互相审查、迭代修正;计划写进代码而非塞进上下文窗口,思考过程存入运行时而非堆积在聊天记录,系统性解决上下文污染、逻辑漂移、复杂任务失控三大瓶颈;Bun 作者用此完成 Zig→Rust 迁移:生成约 75 万行 Rust 代码、测试通过率 99.8%、11 天完成;与 MCP(让 AI 接入世界)、Skills(让 AI 复用经验)并列为 AI 编程三大基础设施。
5.29
OpenClaw与Hermes:源码里的 AI Agent 架构知识大复盘:以开发 QQBot 插件为契机深入源码,完整经历「看山三境」——初见惊艳(24/7 常驻、跨 IM 通道、有人格长期记忆),用久发现痛点(费 token、健忘、复杂任务交付度低),踩坑后反而看懂每个不完美背后的工程取舍;OpenClaw 用 4 个设计回答 4 个问题:多协议可插拔 Channel 25+ Adapter、可插拔 Context Engine + 多级 Compaction、Dreaming 三阶段加权晋升记忆沉淀、凭证与业务失败分治;Hermes 补充另一组启示:技能自创建改进闭环、Smart Approval 三态安全审批、8 种沙箱后端执行隔离;Part III 正面对比并以 Google《Agentic Design Patterns》21 个模式为坐标系审视两套架构的覆盖与空白。
从第一性原理思考 Agentic Engineering:从第一性原理推导 Agentic Engineering 六条最佳实践——AI 双面效应分析(信息损耗:降低旧损耗引入新损耗;知识孤岛:通用知识丰富但私有知识缺失;重复性劳动:生成成本骤降但验证成为新瓶颈),生成能力爆炸与验证能力停滞的张力是 AI 时代核心矛盾;六条递进实践:Context Engineering 构建高信噪比上下文供给(Spec-First + Docs as Code)、基于知识不对称定义人机分工、AI 介入扩展到全 SDLC 链条、小任务多层次验证控制错误累积、工程化治理团队共有知识、从错误提取经验形成自下而上反馈闭环;配套开源框架含完整 SDLC Workflow、Best Practices、Self-Refinement 机制。
5.28
让项目管理也 AI Native —— 两个 Git 仓库干掉了周报、洞察和效能报表:用两个 Git 仓库加 AI 编码助手和 Shell 脚本替代传统项目管理中约 80% 的人工操作(催周报、搬数据、画图表、写汇报)——第一个仓库负责业务进展跟踪,采用三层架构(原始 Markdown 自由输入 → AI 语义整合为结构化文档 → 生成静态 Dashboard 可视化),配备问题挖掘 Skill 自动识别跨团队阻塞和基建依赖热点;第二个仓库负责效能度量,通过大数据平台 CLI 拉取数据生成交互式报表;核心理念是降低填写门槛、让 AI 做信息搬运工、人只做输入和决策。
大模型的Agent Skill功能,在LLM HTTP底层交互流中是怎么承载的?:从 OpenAI 兼容协议的底层视角拆解 AI IDE 中 Agent Skill 的工作原理——Skill 并非协议层概念,而是纯粹的应用层抽象,最终被"编译"为三种协议原语的组合:System/Developer Message(注入 system prompt)、Tools Definition(注册工具 schema)、Multi-turn Tool Calling Loop(LLM 自主决策发起 tool_calls);以 mp-read skill 为例展示渐进式加载流程:先注入名称与描述摘要,用户触发后再读取完整 SKILL.md 正文。
Claude code云端部署 & 魔改sdk实现http流式调用保姆级教程:将 Claude Code 从本地部署到云端并提供 HTTP 服务的完整实践——通过 npm pack 离线打包解决无外网服务器安装问题,基于 FastAPI + SSE 魔改 claude-agent-sdk 将单次查询和多轮会话封装为流式 HTTP 接口,通过 Docker 基础镜像和沙箱平台实现多用户实例隔离(每用户独占独立实例,记忆与配置完全隔离,文件版本化存储),涵盖离线部署、HTTP 服务化、镜像构建、沙箱隔离四层架构。
Harness 的尽头不是缰绳,是镜子:AI 时代最沉默的那场革命:以 James C. Scott 的"可读性"理论为框架,提出 AI 正在引发人类第三次"显形运动"——将工程师脑中不可言说的隐性知识(编码偏好、架构直觉、踩坑经验)强制文本化;写 Spec、Rule、project.md 的本质不是控制 AI,而是一面镜子迫使我们看清自己从未清晰表达过的判断;从意图层、执行层、判断层三个维度论证 AI 改变了写文档的 ROI 经济学,最终指向 Goodhart 定律:被显形的指标一旦成为目标就会失去度量价值。
5.27
万字入门AI Infra:深入理解大模型中的数学与Infra优化:以通俗方式拆解大模型核心操作(RMSNorm、Softmax、Causal Mask、Sampling)的数学原理与 Infra 优化逻辑——从统计学基础出发推导 LayerNorm 和 RMSNorm 公式,从 GPU 计算视角分析工程优化思路,RMSNorm 通过砍掉均值计算将两次全局规约简化为一次,显著降低访存开销;核心观点:Infra 优化本质是用数学等价变换或精度妥协换取更高硬件利用率和极致推理速度。
verify-data:一个端到端的数据验数 Agent Skill:面向数据开发团队的端到端数据验证 Agent Skill——通过自然语言交互自动完成表结构获取、基准表发现、代码逻辑分析、验数 SQL 生成、执行及报告发布,将传统手工验数升级为"一句话触发 + 评审级证据输出";10 类标准化 SQL 模板保障验证覆盖度,血缘 + 维度/指标精排的两阶段策略自动发现基准表,4 种降级策略兜底。
从语言涌现到协作涌现:如何让 AI 产生高质量决策:探讨 AI 智能体协作中的"涌现"现象——大模型智能是第一层涌现,多 Agent 共享上下文互相修正产生第二层协作涌现;以"Agent Room"协作模式展示产品、架构、开发、QA 在同一上下文场中交互形成超越单一角色的集体判断,对比 DAG、Planner-Executor、Router 等传统编排与"上下文编排"的本质区别,阐述 Memory、DAG、任务账本、产出物系统如何协同使系统从"流程自动化"走向"业务自迭代"。
5.26
- 平平无奇的源码,竟藏着Agent的核心秘密?:以开源项目 OpenClaw 为例深度拆解 AI Agent 核心架构——Agent 由"三件套"组成:System Prompt(岗前培训手册)、运行循环(执行引擎)、Skill 机制(按需注入的专业知识扩展包);重点剖析 System Prompt 的分层组装方式(工具清单、安全规则、Skill 注入点、记忆召回等十余个模块拼接,支持 full/minimal/none 三种模式),以及 Skill 机制通过 XML 标签将技能描述注入 System Prompt、Agent 自动扫描匹配并按需加载 SKILL.md 实现专业知识即插即用的精巧设计。
5.25
- AI Infra入门干货总结:大模型是如何高效推理的:通过深入阅读 vLLM 源码,以 Llama 3 为例系统梳理大模型推理核心原理——围绕 Continuous Batching(调度粒度从 request 级下沉到 token 级,解决输出长度不可预测的矛盾)和 Paged Attention(虚拟页表机制管理 KV Cache 显存,消除内存碎片)两大关键概念,详细追踪推理各环节(Tokenize、Embedding Lookup、RMSNorm、QKV 投影、RoPE、FlashAttention)的张量维度变化,以及 vLLM 中 Flattened 布局、slot_mapping 寻址、cu_seqlens 请求隔离等工程实现细节。
5.23
Agent核心技术概念与范式发生了哪些演变以及背后的思考:按 Agentic Workflow、Tool Use、CLI / Script、Skill、Workflow、Workspace、Memory 等维度重梳 Agent 技术演进——旧范式不是被简单淘汰,而是从硬编码流程、无状态函数调用和堆 Prompt,逐步转向 Skill 封装、动态编排、持久运行现场与可恢复记忆。
腾讯云Agent Memory节省61% Token提升52%成功率的诀窍:Mermaid无限画布×上下文卸载:腾讯云 Agent Memory 的短期记忆压缩实践——完整原文卸载到外部文件,工具调用压成 JSONL,任务状态写入 Mermaid 无限画布,历史入口放进 metadata,在 SWEbench / Toolathlon / WideSearch / AA-LCR 连续长 Session 中同时降低 Token 与上下文噪音,WideSearch 最高节省 61.38% Token、通过率相对提升 51.52%。
OpenAI Codex Plugin for Claude Code 源码剖析:逐层拆解 OpenAI 官方
codex-plugin-cc的桥接架构——Claude Code 侧提供/codex:review、/codex:adversarial-review、/codex:rescue等命令,底层复用本机 Codex CLI / App Server,通过 Broker 协议、后台任务、状态持久化与 Review Gate,把 Codex 变成 Claude Code 工作流里的第二审阅者和异步 worker。
5.21
从0到1搭建 Agent :Agent 原理分析及个人助手实践(长文干货):面向开发者的 Agent 从零搭建长文——先解释 Agent 与普通对话模型的差异,再把 LLM、Prompt、Planning、Tools、Memory、Execution 串成执行闭环,最后落到个人助手实践中的任务拆解、工具接入、上下文管理、调试评估和低成本工程化落地。
QQ音乐Harness Engineering实践:QQ 音乐商业化团队的 Harness Engineering 复盘——在 50+ 微服务、业务仓 / IDL 契约仓 / Harness 规范仓协同的复杂拓扑里,不重造 IDE 或通用 Agent Runtime,而是补齐 L5 工程治理层,用服务矩阵、五阶段流程、四道门禁、三层知识体系和 Self-Refinement,把 AI 协作升级为可审计、可复用、可治理的团队级过程。
5.20
Claude Code Harness 工程:数仓侧落地方案|得物技术:得物离线数仓的 Claude Code Harness 方案——针对 compact 后约束丢失、规范靠记忆、血缘 / 自测 / 数据比对撑爆 context 等痛点,用 CLAUDE.md 持久化迭代状态,hooks 强制 SQL 规范与危险 DDL 检查,subagents 隔离高 token 读操作,再把需求分析、技术设计、ETL、自测、数据比对、SR 导入、性能优化、SLA/DQC 收敛成 8 步 SKILL 工作流。
从Prompt、Context到Harness,工程的三次进化与终局之战:梳理 AI 工程从 Prompt 到 Context 再到 Harness 的递进关系——Prompt Engineering 回答“该说什么”,Context Engineering 回答“模型该知道什么”,Harness Engineering 回答“怎样让系统稳定可靠”,工程师的价值也从手写代码转向判断模型边界、设计合适厚度的 Harness、让 AI 持续高质量产出。
5.19
- 让Skill自己训练自己:8阶段Loop、3层评测、5维AND门控,从此实现自进化:借鉴 Karpathy autoresearch 与深度学习训练循环思路,构建一套 Skill 自进化框架——以 8 阶段 Loop 驱动迭代、3 层评测(结构检查 + 逐条打分 + 对比评选)衡量质量、5 维 AND 门控决定是否保留 checkpoint,解决了人工反复调 SKILL.md 效率低、边界盲区难自查的问题,19 轮自动迭代后实现从"能跑"到"真的好"的质量收敛。
5.18
从0开发大模型的17种Agent架构演进详细拆解:以
all-agentic-architectures项目为蓝本,用 agno 框架重实现 17 种 Agent 控制流架构,揭示 Agent 演进的本质是控制流设计而非 prompt engineering——从 Reflection(generator+critic+refiner 三段式质量闭环)、Tool Use、ReAct(Thought→Action→Observation 循环)、Planning(先生成可审计步骤清单再执行)、多 Agent 编排、Blackboard 共享黑板,直到 Cellular Automata 涌现计算,逐层分析每种架构新增的 State 字段、路由逻辑、失败模式与升级时机。RAG 全链路技术详解:系统拆解 RAG 全链路工程实践——涵盖多格式文档加载与元数据提取、基于 PPL 困惑度的 Meta-Chunking 语义切分、embedding 模型选型与向量索引构建、Query 改写 / HyDE / 重排序等检索优化手段、Prompt 设计与 SFT 生成调优、Graph RAG 多跳推理,最终以 Ragas 评估体系(Context Precision/Recall、Faithfulness、Answer Relevancy)形成可测可调的工程化 RAG 闭环。
5.16
串讲 LLM 和 Agent 的核心原理以及各种术语:面向入门者的 LLM / Agent 全景串讲——从 token 概率预测、Instruct 微调、CoT 思维链、System Prompt、Function Calling / Tool Use 到 MCP 协议,厘清"模型能力"与"Agent 工程实现"的关系:两者都够强才有最好效果。
深度解析腾讯云 Agent-Memory:4 层渐进式记忆管道如何实现 61% 的 Token 节省与 76% 长期记忆准确率:深入源码拆解 TencentDB Agent Memory 的双支柱架构——4 层渐进式记忆管道(L0 对话捕获 → L1 原子事实 → L2 场景归纳 → L3 用户画像)+ 符号化上下文卸载(Mermaid 图编码),配合混合检索(向量 + BM25 + RRF 融合)与三级递进压缩,实现 61% Token 缩减与 76% 长期记忆准确率。
5.14
- 别让 AI 瞎猜了:用 Harness Engineering 终结无限返工:爱奇艺数据库团队的 Harness Engineering 实践——返工根因不是模型不会写代码,而是任务入口、执行依据、边界、验证、回写没提前备好;最小 harness 由五类组件组成,协作链固化为「任务入口 → 计划冻结 → agent 执行 → 验证评审 → 回写收口」,落地分三阶段(找到入口 → 可复盘 → 机械化为 lint/script/CI)。
5.12
深度解析LLM Wiki / Obsidian-Wiki / GBrain:Agent时代知识的”自组织”与”自进化”:从 Knowledge Engineering 角度解析 LLM Wiki 与 GBrain,提出用 LLM 增量构建持久化结构化 Wiki(Skillify / 渐进式披露)替代传统 RAG 的”每次从头检索”模式,实现”一次学习、永久可用”——知识不再是每次查询时临场检索的死水,而是随交互持续累积的活体。
从零设计生产级 Multi-Agent Harness:架构、评估、记忆、成本与 MCP 工具接入全拆解:系统拆解生产级 Multi-Agent Harness 五大核心模块——架构编排(Agent 出主意、Harness 拿决定)、Tool Registry 工具治理、分层状态与记忆(含遗忘机制)、四层评估体系(轨迹评估是 Multi-Agent 最大创新点)、Token Budget 成本控制,以及 MCP 工具安全接入实践。
当我把 AI 变成一个”算法”:Skill 工程化设计的心路历程:将 Agent 当”算法”用——通过 CLI 接管一切确定性工作(API 调用、状态管理、上下文按需加载),让 Agent 只做理解与决策;工具信息三层分离(索引 / 元数据 / 规则)解决工具数量膨胀问题,Workflow 以文件系统驱动实现”扩展能力 ≠ 修改代码”的热插拔。
Agent从一问一答到自主执行面临哪些挑战?:梳理开源 Agent(OpenClaw / Hermes Agent)定时任务在高可用、统一管理、权限、可观测与资源利用率上的痛点,提出将调度能力从 Agent 内部抽离到统一平台的思路,涵盖弹性伸缩、会话级记忆隔离与基于执行历史的自进化机制。
5.11
Spring AI Session API:大多数人用 ChatMemory 用错了场景:Spring AI 1.1+ 记忆双层架构梳理——短期走 Session API(把 UserMessage + 后续 AssistantMessage / ToolCall / ToolResult 视为原子 Turn,配 SlidingWindow / TurnWindow / TokenCount / RecursiveSummarization 四种压缩策略 + Recall Storage 兜底,解决 MessageWindowChatMemory 切断工具调用-结果链的硬伤),长期走 AutoMemoryTools(仿 Claude Code,6 个沙箱化文件工具 + MEMORY.md 索引 + user/feedback/project/reference 四类记忆,由 LLM 自主决定何时写入);AutoMemoryToolsAdvisor 必须排在 SessionMemoryAdvisor 之前,文件后端百条级、Redis 向量后端万条级,按数据量与运维成本选型。
Harness 不是目的,知识才是护城河——一个 AI 工程交付团队的知识沉淀实践:腾讯团队对 Harness Engineering 的再审视——Skill / Agent / 工具链会随模型迭代过期,私域知识才是护城河;知识体系按「五层存储 × 五种类型(model / decision / guideline / pitfall / process)× 三级成熟度(draft → verified → proven,配自动衰减 Lint)」三维正交组织,团队知识库走独立 Git 仓库 + 区块链思路(log.md 追加、evidence.contributors 溯源、maturity 共识);工作流即知识载体(16 阶段状态机配 /flow-import 冷启动与 /flow-run 运行时,ARCHIVE 自动提取并提升成熟度),上下文用三级渐进式索引(全景 → 分类清单 → 完整条目)替代一次性塞 5000-10000 行,叠加 Hapi 内网版把碎片时间转化为远程接管 AI 编程会话的产能。
缓存使用实践总结:以淘宝交易结算场景为例:淘宝汇金团队的缓存选型方法论——先用「不要求强一致 / 高读频 / 低写频 / 高性能要求」四条缓存条件筛选,再按「存储端(本地 vs 分布式)× 存储介质(内存型 vs 持久型)× 存储时机(静态 / 旁路 / 直写)」三维正交组合得最终方案;五类场景配方落地(费率配置走分布式+内存+静态、CAE 代扣协议走分布式+内存+旁路、收单网关配置走本地+内存+静态、分布式锁走分布式+持久+直写、库存扣减走分布式+持久+直写并分桶路由),配缓存穿透 / 击穿 / 雪崩 / 一致性 / 序列化兼容 / 本地缓存对象原地修改六类风险的治理清单。
5.9
5 人 7 天干完 20 人数周的活:Spec-Driven Development 如何重新定义 AI 编程:阿里 Qoder 团队 5 人 7 天交付 QoderWork 的 SDD 实战复盘——四阶段流程 Specify → Plan → Implement → Validate 配 Spec Kit 三件套(spec.md / plan.md / tasks.md)+ constitution.md,DAY 0 不写一行代码先固化需求边界与成功指标,DAY 1-6 由 Quest 并行驱动 AI 实现;并提出 L1 Spec-First → L2 Spec-Anchored → L3 Spec-as-Source 三级演进光谱,核心论点:SDD 不让 AI 变聪明,而让 AI 变可控。
MySQL 索引优化填坑实录:从 1 秒到 50ms,再到 28ms 的踩坑与填坑:一次生产慢 SQL(
channel_company_id IN + report_status = + debt_amount/overdue_amount OR)的三段式优化——从全表扫描 1s 起步,加channel_company_id单列索引降到 50ms 但filtered仅 5.56%,换成(channel_company_id, report_status, debt_amount, overdue_amount)复合索引把filtered拉到 55.55%、耗时压到 28ms;要点是别只看耗时要盯filtered,复合索引遵循「等值在前、范围在后」,OR + 双范围列的残留瓶颈用 UNION ALL 拆分或覆盖索引消除回表。AI 记忆的 Git 版本控制:Memoir 如何用分层路径替代向量数据库,让 Agent 告别上下文污染:把 Agent 记忆当作版本控制问题而非向量搜索问题——Memoir 用 ProllyTree(概率性 Merkle 树)+ 层级化语义路径(如
profile.professional.skills.python)替代 UUID 与向量近似检索,做到 O(log n) 前缀查找;上层用 Prompt Caching 友好的 LLM 分类器复用静态前缀,单次记忆更新 Token 成本降 90%;并把 Git 的 branch / commit / merge / rollback / blame 与 SHA-256 完整性证明搬进记忆层,正面解决上下文污染、Token 租金、记忆漂移三大痛点。
5.8
AI Native 时代 —— 研发组织何去何从:阿里许晓斌从「两千年组织协调问题史」切入的 AI Native 组织转型长文——AI 是新协作主体而非工具,组织从 Org Chart 演化为 Execution Graph,新瓶颈是「信息形态的人形偏置」(员工沦为人肉中间件);解法是结构化 Harness 层 + 松散 Hive Mind 层的双层架构,叠加 Agent Platform / Domain Teams / Risk and Oversight 三柱治理,并区分执行 / 优化 / 创新三类工作——Death of ego 不能一刀切,创新节点需保护生产性 ego。
高可用架构的工程智慧:京东张宝森的电商存储层高可用方法论——按数据特征区分流水型(订单 / 支付 / 物流,新增为主)与状态型(用户 / 商品 / 库存,读多写少),流水型通过「统一单据号生成规则 + 基于单据号路由数据库」实现业务无感知扩容与容灾;多机房场景下将新增流水路由至全新库,规避跨城同步延迟,保障切流期间业务不停、数据不丢。
5.7
Harness Engineering:耗时一周,我是如何将应用的AI Coding率提升至90%的:阿里工程师在 10 万行 Java 存量应用中从零搭建 Harness 体系的完整复盘——以
.harness/目录承载 Rules / Skills / Wiki / Changes 四要素,由 Application Owner Agent 编排「需求→评审→编码→单测→CI→部署」10 阶段流程,把 AI 代码率从 24.86% 拉升到 90.54%。告别"氛围编程":基于 Harness 治理和 SDD 的团队级 AI 研发范式演进与实践:高德团队的范式反思——出码率从 53% 涨到 90% 但项目周期没缩短,根因是研发全链路、存量风险、超长上下文三大问题;解法是 SDD(Specify→Plan→Implement→Validate)+ Harness 四支柱(上下文 / 架构约束 / 反馈回路 / 人类监督),配合 Qoder 知识库三层结构与专家团模式打通需求到部署。
5.6
一个文件让 AI Coding 效率翻倍:AGENTS.md 实践指南:怎么写好一份「给 AI 看的 README」——遵循「地图,而非手册」原则,配合仓库聚合、验证闭环、lint 自动化、参考项目源码引入,让 AI「打开即理解、改完即验证」。
基于 Harness + SDD + 多仓管理模式的 AI 全栈开发实践|得物技术:得物团队的 AI 全栈方法论——用 Harness 思维让 AI「照着已有实现模仿」而非凭空创造,多仓工作区 + SDD 双文档对齐接口契约 + 多 Agent 前后端并行 + 三阶段分离验证,实测提效 50%+。
