2026.1 期
2026.1 期
1.30
AI Agent 记忆系统:从短期到长期的技术架构与实践:把 Agent 记忆划为短期(会话内)与长期(跨会话),短期靠上下文工程的缩减 / 卸载 / 隔离三策略(ADK 的 events_compaction_config、LangChain 的 SummarizationMiddleware、AgentScope 的 AutoContextMemory 六级压缩),长期走 LLM 事实抽取 + Embedder + VectorStore + GraphStore + Reranker + SQLite 审计的 Record/Retrieve 闭环,以 Mem0、Zep、ReMe 等独立组件 API 接入 Agent 框架。
1篇搞懂AI通识:大白话拆解核心点:按「基础 → 核心 → 优化 → 落地 → 工具 → 术语」六层串讲——机器学习/深度学习/强化学习三圈关系、Transformer 并行计算 + 自注意力 + 位置编码、MOE 门控只激活相关专家(DeepSeek-V3 6710 亿参数仅激活 370 亿)、量化/蒸馏/剪枝/LoRA 瘦身、RAG/KAG/RLHF/对齐补能力,落到 Prompt、CoT、ToT 与 Token、Context Window、Agent、MCP、A2A 等高频术语。
货拉拉待办中心架构设计:打造高效可靠的任务中枢:把原本依赖 12+ 服务实时调用、P99 2 秒的待办查询,改造为本地 DB + 缓存的标准化待办中心,按常规 / 限时 / 阻塞三级策略统一生命周期;用标准化、异步化、协同三种管理模式,叠加场景控流 → 节点过滤 → 静默期控制三层限流(峰值 ↓80%、无效调用 ↓50%、调用频次 ↓60%),工厂 + 模板模式扩展场景,落地 50+ 场景日均 2 亿查询、P99 控制在 100ms 内。
1.29
自建一个 Agent 很难吗?一语道破,万语难明:用 Next.js + LangGraph + Claude-4.5-haiku 给奥德赛 TQL 平台搭 BFF Agent「小 D」,宿主页面 iframe 嵌入并双向暴露脚本/调试/执行工具;上下文工程围绕角色设定 + XML 提示词 + 少量正例(Anthropic 官方技巧)、Rag 知识库分三类(top 100 热门脚本、清洗后高频 TQL 指令与字段、deepwiki 服务端源码)、本地工具(editScript/editVariables/executeScript)+ 白名单 MCP(kbase、deepwiki)节约注意力。
Claude 总是泛泛而谈?试试用 Skills 沉淀团队最佳实践:Claude Skills 用 Progressive Disclosure 三层加载——Level 1 元数据约 100 tokens、Level 2 SKILL.md 触发时加载 1500-3000 tokens、Level 3 reference/scripts 引用时才消耗——50 个 Skill 启动仅占 5000 tokens;Skills 给 Claude「说明书 / 知识」,MCP 给「钥匙 / 工具」,二者协同;放在 ~/.claude/skills/ 或项目 .claude/skills/,靠 description 关键词自动激活,把团队规范、踩坑、专业领域沉淀为可复用 Markdown。
Context Is All You Need:快手后端AI Coding的实践与思考:快手主站 Java 后端 AI 采纳率提至 60%-90% 的「码图」框架,分两阶段——Context 阶段把字节码解析成代码元素依赖图谱存 Neo4j、用 Cypher 让 AI 查上下游与影响范围;Control 阶段放弃单 Agent 转 Multi-Agent,主控 Agent 拆解、SubAgent 专注图/代码/语义检索,最终代码由 Kwaipilot 生成;引入 PRD → 概要设计(人)、概要设计 → 编码计划(SubAgent)两个中间层,工程师从写代码转为「设计执行」。
1.28
- Agentic Coding场景下基于职责分离的上下文管理思路分享:从长上下文退化与 read/write 重复返回值膨胀切入,提出将 Agentic Coding 工具拆为「行为」与「影响」两类职责,用结构化
<ide>块动态承载文件最新内容,配合「延迟卸载」(保留最近 50-250 次操作)、事实与行为记忆区分等策略,替代 read_full_file 直塞上下文,缓解注意力稀释与幻觉。
1.27
万字详解大模型推理加速核心原理:分形规律与资源计算公式:借分形几何自相似性,提出大模型推理在宏观集群、中观框架、微观算子各层级统一遵循「看清楚 → 避免浪费 → 提升利用率 → 节约资源」逻辑,聚焦算力 / 显存 / 显存带宽 / 通信带宽四大资源,以 DeepSeek R1/V3(671B MoE、激活 37B、MLA dc=512)为例给出 Prefill/Decode 测算公式与 TP/EP/DP/PP 选型方法。
腾讯混元AI Infra核心技术重磅开源:推理吞吐提升30%!:腾讯混元开源面向 H20 等推理卡的 LLM 算子库 HPC-Ops,用 CUDA + CuTe 重写 FusedMoE、Attention、GroupGEMM 等核心 kernel,通过 SwapAB 对齐 wgmma、Interleave 重排、persistent kernel 隐藏 prologue/epilogue,实现混元 QPM 提升 30%、DeepSeek 17%,Attention 较 FlashAttention 最高 2.22 倍。
1.26
如何设计一个AI Agent系统:从工程视角拆解 AI Agent = LLM + Planning + Memory + Tool Use 全栈框架,对比 Software 1.0/2.0/3.0 范式与传统研发差异,覆盖 Prompt Engineering(角色设定、Few-Shot、输出 Schema 约束、工具模板)、规划 / 记忆 / 工具 / Action 闭环及 Claude Skills 等新趋势,并以电商资损防控落地为案例呈现实践体会。
AI编程实践:从Claude Code实践到团队协作的优化思考|得物技术:得物团队总结 Claude Code 实践方法论,强调单对话单模块的精准对话流、用 Plan 模式按 WBS 拆 M1-M12 模块并排 P0-P3 优先级、CLAUDE.md 压到 200 字内只做「护栏」、用 SKILL 沉淀 ES/Redis 等可复用 Prompt、用 MCP 接飞书审批/日历/多维表,构建子代理协作的人机开发范式。
1.25
- LangChain Blog: Tool Calling with LangChain:LangChain 推出跨供应商统一的 Tool Calling 标准接口,核心 API 为
ChatModel.bind_tools()绑定工具、AIMessage.tool_calls读取标准化调用结果、create_tool_calling_agent()构建通用 Agent,覆盖 OpenAI、Anthropic、Gemini、Mistral、Fireworks、Groq、Cohere 等,多工具场景用 bind_tools,强制结构化抽取改用with_structured_output。
1.24
AI编码实践:从Vibe Coding到SDD:淘特导购团队复盘从代码智能补全到 Agent Coding、Rules 约束、再到 SDD(Specification Driven Development)的演进路径,指出 Agentic Coding 暴露代码延续性差、风格不一、协同弱三大问题,SDD 以 spec.md 为唯一真理源但工具链不成熟、落地门槛高,团队最终采用「轻量技术方案模板 + Rules 严格约束 + Agent Coding 实现 + AI 汇总架构文档」的融合策略。
读懂 AI Infra,看这六个关键词就够了:腾讯团队梳理 2025 年 AI Infra 六大方向——分布式推理(DistServe 提出 PD 分离、DOPD 动态调节、Step-3 的 AFD 把 Attention 与 FFN 分离部署、DeepEP/TRMT 优化跨机 EP)、TileLang 面向 Tile 的开发语言解耦数据流与调度、SeamlessFlow 的 RL 训推分离轨迹管理器与标签调度、模型-系统协同设计的算术强度匹配 roofline、Agent Infra 与国产化硬件适配。
1.22
Agent Skills在货拉拉AI应用尝试:货拉拉大数据团队基于 Anthropic 2025.12 开放的 Agent Skills 标准落地两个场景——自然语言查数(财务 / AB 实验报告打包成 SKILL.md + hive.py/doris.py 脚本)与指标归因分析(query_demo.py 周环比 + holiday.py + OLAP 下钻),借助渐进式披露(Progressive Disclosure)三层加载机制将业务经验沉淀为可组合、可复用的能力单元,强调 description 质量决定调用准确度。
一文读懂 Skills|从概念到实操的完整指南:TRAE 开发者咸鱼系统讲解 Skills 的三层渐进式加载(元数据始终加载、SKILL.md 触发加载、scripts/references 按需加载)、与 Command/MCP 的边界、撰写五原则(原子性、Few-Shot、结构化指令、接口设计、迭代复盘),并在 TRAE 中以飞书文档 Spec Coding 为例演示多角色 Skill + 工具 Skill 组合实现需求分析、技术设计、任务拆解到编码的闭环。
腾讯技术面:数据库核心八股终极典藏版:腾讯云 TDSQL-C 团队从业务后台视角拆解云原生数据库实战要点——计算存储分离架构实现秒级扩容、Proxy 自适应负载均衡 + 最终 / 会话 / 全局三档一致性、连接池复用、事务写前 / 写后拆分降低主节点压力、四档容灾部署(同 AZ / 跨 AZ / 跨地域 / 跨云)与跨地域备份、连接保持防闪断、Serverless 应对波峰波谷流量。
1.21
- 多 AI 协同 + SDD 编程实践:一个 AI 全流程交付实录:作者以跨境保险产品为例,基于 OpenSpec 的 Specify→Plan→Tasks→Implement 四阶段 SDD 流程,通过 MCP 协议将 Codex(资深工程师,编码/调试/重构)、Gemini(长上下文分析师,海量文档/日志)注入 Claude Code(协调者),用 CLAUDE.md 强制规则「工具调用即默认」实现三 AI 无缝分工,规范作为共享语境避免单模型能力边界与人工复制粘贴损耗。
1.20
- Understanding LangChain Agents: create_react_agent vs create_tool_calling_agent:拆解 LangChain 两类 Agent 的根本差异在于 prompt 方式与期望返回格式——create_react_agent 走 Thought/Action/Observation 文本循环逐步推理,适合开源模型与可观测调试;create_tool_calling_agent 直接传 function schema 让 LLM 输出结构化调用,更快更稳,依赖模型原生 tool calling 能力(GPT-4、Claude 等),生产场景首选后者。
1.19
有手就行,教你从0到1快速手搓搭建个GUI Agent:基于 Gemini 3 Flash 的原生 GUI 理解与坐标定位能力,用 Environment/Preceptor/Decision/Operator 四件套半小时手搓 PC GUI Agent;要点在于多模态对话保留 conversation_history 防止「输入循环」,用 LangGraph 编排「感知 → 决策 → 执行」闭环,操作层用 pyautogui + pyperclip 复制粘贴解决中文输入问题。
1篇搞懂AI通识:大白话拆解核心点:按基础 → 核心 → 优化 → 落地六层框架白话扫盲 AI 通识,覆盖机器学习 / 深度学习 / 强化学习关系、Transformer 自注意力与位置编码、MoE 混合专家(DeepSeek-V3 6710 亿总参仅激活 370 亿)、量化 / 蒸馏 / 剪枝瘦身、LoRA/QLoRA 轻量微调、RLHF 与 RAG/KAG,适合搭建端到端认知地图。
小红书MySQL内核秒杀能力重磅再升级:小红书自研 MySQL 合并秒杀方案在 24 年排队秒杀基础上再提 5 倍,128 线程 TPS 从 4276 提升至 23543;核心是 Leader 预读库存写入表级全局缓存,Follower 在缓存中合并扣减后由 Leader 一次性 2PC 提交,并对行锁做 phase1/phase2 流水线、Binlog 组并行提交与 Crash Recovery 组粒度回滚,业务 SQL 零改造。
1.18
极速开发出一个高质量 Claude Agent Skills 最佳实践:Skill 是「怎么做」的经验封装,MCP 是「有什么工具」的协议,二者互补;高质量开发关键在于不手写而用 AI 写 AI——拉 anthropics/skills 仓库 + 官方 skill-creator 加上自备资料让模型生成;遵守 SKILL.md 500 行上限、动名词命名、渐进式披露(概览 + 引用、领域隔离、按需加载)与 Haiku/Sonnet/Opus 多模型回归测试。
I Replaced Redis with PostgreSQL (And It's Faster):用 PostgreSQL 单库替掉 Redis 三大用途,月省约 100 美元并消除一致性裂缝——缓存改 UNLOGGED 表跳过 WAL(写延迟 0.08ms vs Redis 0.05ms),Pub/Sub 用 LISTEN/NOTIFY 配合触发器把 INSERT 与通知原子化,任务队列用 FOR UPDATE SKIP LOCKED 实现无锁多 worker 抢占、并发崩溃自动重派。
1.15
什么是技术架构、数据架构、业务架构、应用架构和代码架构?:以「控制复杂度」为架构第一目的,串联 4+1 视图(逻辑 / 开发 / 过程 / 物理 / 场景)、C4 模型(Context/Container/Component/Code)与 TOGAF-4A,再落到互联网常用的业务 / 技术 / 部署三分法,逐项拆解业务架构如何平台化与主辅流程分离、应用架构的稳定 / 解耦 / 抽象 / 松耦合 / 容错五原则、技术架构的无状态与可治理、以及数据架构的读写分离、分库分表与异构落地。
阿里 Assistant Agent 开源,助力开发者快速构建答疑、诊断智能助手:基于 Spring AI Alibaba 的企业级助手框架,采用 Code-as-Action 范式让 Agent 生成并在 GraalVM 多语言沙箱里执行代码以编排工具,核心包含评估图(LLM + 规则双引擎、dependsOn 拓扑并行)、Prompt Builder 按评估结果动态注入经验 / 工具 / 知识,叠加 SearchProvider SPI 接入知识库、MCP/OpenAPI 工具、经验自动沉淀与熟场景跳过 LLM 推理的快速响应路径。
1.14
告别传统 Text-to-SQL:基于 Spring AI Alibaba 的数据分析智能体 DataAgent 深度解析:用 Spring AI Alibaba Graph + Multi-Agent 把 Text-to-SQL 升级为「虚拟数据分析师」,十大能力包括 interruptBefore 的 Human-In-The-Loop、按 agentId 热更新的 Prompt 配置、查询重写 + 向量 / 关键词混合检索的深度 RAG、Docker 化 Python 执行引擎、SSE 流式 + 多轮上下文、MCP Server 与多模型热切换、跨库 Accessor、HTML/Markdown 报告生成,以及 SemanticConsistencyNode + 自愈循环纠错的语义模型与逻辑外键。
提示词技巧分享:一劳永逸版!:把 Gemini 3.0 Pro 调教成「创意总监」式 Prompt 助手,输入口语化描述后强制按四维度扩充(艺术风格与媒介、主体刻画、环境氛围、摄影语言含 85mm f/1.8 等参数),并以「构思推导 + 最终英文 Prompt」固定输出格式,覆盖文生图、文生视频(叙事 / 动态双版本)、文生文分镜剧本与图生文 / 图生视频反推,作者强调要看 AI 推导过程而非直接拿结果以保留思考能力。
1.13
LangChain: Plan-and-Execute:用 LangGraph 复刻 Plan-and-Solve 与 Baby-AGI 思路,状态用 TypedDict 维护 input/plan/past_steps/response,planner 节点借 gpt-4o + Pydantic structured output 生成有序步骤列表,agent 节点用 create_react_agent + Tavily 执行单步,replan 节点输出 Act(Plan 或 Response)并按 should_end 决定回到 agent 或 END,相比 ReAct 显式长程规划且可让弱模型执行、强模型规划。
大模型狂飙2025:一篇文理清从模型到智能体的架构演进:把 2025 LLM 工程栈拆为智能层(基础模型)、能力层(Tools 执行 + Skills 渐进式披露领域知识)、连接层(MCP 以 JSON-RPC 2.0 作 AI 的 USB-C 解决 N×M 集成)与编排层(LangChain 胶水 + LangGraph 有状态运行时),对比 ReAct / Plan-and-Solve / Reflection 认知架构与监督者式多 Agent 协作,并指出 MLOps 正向追踪幻觉与成本的 AgentOps 演进。
AI工程vs传统工程 —「道法术」中的变与不变:以淘宝「AI 万能搜」实践为底,用「道、法、术」框架对比 AI 工程与传统软件工程,「道」从追求绝对正确转向管理概率预期,「法」延续分层解耦、SOLID、熔断降级的同时把核心从领域模型迁向上下文工程、并用预编排 SOP 与多级意图漏斗划定不确定性边界,「术」在工程基本功之上补 Context Manager、Agentic RAG、Memory、人工标注 + 线上 AB 多维评估和 Trace 轨迹可视化,结论是 AI 工程是架构升级而非推倒重来。
从零开始的大模型之旅|解码大模型:开篇&技术篇1.1—基础架构概念:系列开篇规划 3 大部分(基础概念 / 生态体系 / 业界动态)共 6 章;技术篇 1.1 聚焦 Transformer 基础架构,逐层拆解 Self-Attention 的 Q/K/V 三元组、8-16 头 Multi-Head Attention 的语法 / 语义 / 位置 / 共指分工、正弦余弦 Positional Encoding 的相对位置与平滑性、Encoder/Decoder 与掩码注意力的协作差异,并对比 Encoder-only(BERT)、Decoder-only(GPT)、Encoder-Decoder(T5)三种变体适用场景。
1.12
CodeGenius Memory:构建面向代码生成的可控上下文系统:CodeGenius 将「保留最近 5 轮」固定窗口升级为分层 Memory 系统,遵循「输入 → 整理 → 压缩 → 生成」流程,三大机制:5 轮 batch 卸载历史 tool 出入参以兼顾 Claude 缓存(命中价 0.1 倍、写入 1.25 倍)、文件 append-only 仅首次带全量+后续 diff 并用 tree-sitter 对 >3000 行大文件生成带行号签名摘要、上下文用量达 70% 或检测新话题(>3K Token/5 分钟外)时套用 Claude Code Compact 九段式 prompt 把上百 K 压成 2-3K 摘要。
用第一性原理拆解 Agentic Coding:从理论到实操:TRAE 团队从「LLM 只会自回归预测下一 token」第一性原理出发,串起 Attention O(n²) 复杂度、Prompt Caching 前缀匹配、RL 让模型「会做事」、Agent Loop 的 end_turn/tool_use/max_tokens 三种停止条件,揭示有效上下文仅占标称 10-15%、中段「Dumb Zone」性能退化、会话间失忆与过早完成等坑;最佳实践是短对话 + 任务拆分,用 Observation Masking 或 LLM Summarization 管控上下文,以「复利工程」沉淀项目知识库。
1.11
- LangChain: Self-Reflective RAG with LangGraph:对比 Chains / Routing / State Machines 三种 RAG 认知架构,主张用 LangGraph 的状态机实现可循环、可条件跳转的 Self-Reflective RAG,落地 Corrective RAG(CRAG)与 Self-RAG 两套范式:CRAG 引入轻量评分器,文档不相关时改写 query 并触发 Tavily Web Search 兜底;Self-RAG 用 Retrieve/ISREL/ISSUP/ISUSE 四类反思 token 控制检索、相关性、生成支持度与有用性,节点级用 Pydantic + OpenAI tool 做二元打分,再叠加 hallucination 与 answer relevance 双重 grader 形成回退重试闭环。
1.10
Agent Skills (Claude Skills) 详细攻略,一篇文章精通:Anthropic 于 2025-12-18 把 Agent Skills 发布为开放标准(agentskills.io),Codex/Cursor/Opencode 跟进;Skills 本质是「带目录的渐进式提示词」,按 metadata/instructions/resources 三层渐进披露,仅元数据常驻上下文,正文与 scripts/references/assets 资源按需加载;实操示范在
.claude/skills/下创建 SKILL.md(前置 YAML+正文),用「字幕转 markdown + ffmpeg python 脚本」与「帮我写作 + references 范文」演示资源层,并对比 Skills(轻、提示词主导)与 MCP(重、工具调用主导)的协同。「深度好文」MySQL 全局锁、表锁、行锁、间隙锁、临键锁详解,架构师必备高并发下的锁优化策略:从 FLUSH TABLES WITH READ LOCK 全局锁、MDL / AUTO-INC 表级锁、到基于索引项的行级锁系统拆解 InnoDB 锁体系——Record Lock / Gap Lock / Next-Key Lock 三类行锁配合两阶段锁协议 2PL,RR 隔离级别用 Next-Key Lock 抑制幻读,意向锁 IS/IX 解决表行锁冲突;死锁三大场景(S 锁升级、交叉访问顺序、Gap + 插入意向锁)通过固定访问顺序 / 乐观锁 / 小事务 / 索引设计 / 降级 RC 预防,InnoDB 自动死锁检测回滚代价小事务报 ERROR 1213。
1.9
告别碎片化日志:一套方案采集所有主流 AI 编程工具:基于 MCP 的统一 AI 代码采集方案,覆盖 claude-code / codex / gemini / ykcli / iflow / qwen-code / qoder 等 macOS + Windows 主流工具——CLI 用 Hook 注入配置、IDE 解析 History 与 workspaceStorage 快照,Collector 做标准化与 Git/路径规范化,SLS 批量+重试上报;对比高德(DB 解析 + MCP 实时拦截,延迟明显)与 AIDC(仅 cursor 插件)的不足,核心指标 AGCR = AI 有效提交行数 / 分支 Diff 总行数 × 100%。
认知重建:Speckit 用了三个月,我放弃了——走出工具很强但用不好的困境:rickyshou 复盘 spec-driven 工具落地失败——speckit 5 阶段(Constitution→Specify→Plan→Tasks→Implement)+ 9 架构原则 + 7 层 LLM 输出约束、openspec 用 ADDED/MODIFIED/REMOVED/RENAMED Delta + Fail-Fast 冲突检测,都败在企业「跨 BG / 前后端 / FT / 项目多方博弈 + 动态变更」上;致命盲区是流程从零开始、没有「考古」上下文检索机制,AI 看不到业务边界与历史经验(一次需求 45 分钟纯讲解),出路是借鉴 Anthropic 多 Agent 协作 + 上下文工程 + 复合工程。
拥抱大模型:深入剖析ReAct的核心原理、技术架构及其对AI领域的深远影响:2022 普林斯顿 + Google《ReAct: Synergizing Reasoning and Acting in Language Models》提出 TAO 闭环(Thought → Act → Observe)——显式推理轨迹 + 外部环境锚定 + 1-5 个 few-shot 泛化无需微调;三层架构(核心逻辑层 LLM + 提示工程温度 0.2-0.3、执行循环层上下文管理器近期完整 + 早期摘要 / 行动解析器 / 循环调度器、外部交互层工具集),实测 Fever 幻觉率 8.2% vs CoT 23.5%,ALFWorld 2 示例达 71% vs RL 37%。
什么是 MCP:Anthropic 2024.11 推出的开源 Model Context Protocol,被称为「AI 应用的 USB-C 接口」——解决工具复用、模型 / 平台解耦、资源访问统一化三痛点;与 Function Calling 分层(FC 表达调用、MCP 跨模型跨平台标准化集成),C/S + Host 三层架构(MCP Hosts 如 Cursor/Claude Desktop、MCP Clients 内置、MCP Servers 连数据源),本地走 STDIO 远程走 Streamable HTTP(替代旧 SSE),生态含 MCP Mark / MCP.so / ModelScope / PulseMCP。
1.8
如何画好一张架构图丨终极典藏版:以「分层(解耦)+ 分模块(同层独立单元)+ 分功能(模块内入口)」三板斧为核心,横向分层 + 纵向切模块;好图四标准是结构清晰 / 外表美观 / 内容完整自闭环 / 术语粒度一致,设计感遵循亲密性 / 对齐 / 对比 / 重复四原则,配色用色轮三原色 + 互补 / 等距三色组、构图用黄金分割 0.618 与斐波那契;抽象两条路(业务建模自底向上、系统建模自顶向下),落地工具 UML 7 种常用图(类 / 时序 / 组件 / 部署 / 用例 / 状态 / 活动)。
码哥跳动:MySQL InnoDB 事务隔离与 MVCC、版本链与 ReadView 原理详解:从锁机制瓶颈切入讲清 MVCC 三大组件——隐藏字段(trx_id 6 字节 + roll_ptr 7 字节)、Undo Log 版本链、ReadView 可见性算法(low/up_limit_id 水位 + m_ids 活跃事务列表四条规则),对比 RC 每次 SELECT 重建 ReadView 与 RR 事务首次复用快照的差异,并说明 InnoDB 在 RR 下用 Next-Key Lock 抑制幻读。
1.7
Agent全面爆发!万字长文详解上下文工程:从 Chatbot 到 Agent 的形态演进出发,论证上下文从输入补充升级为系统状态载体,提示工程不足以表达持续变化的任务状态,进而引出 Context Engineering 五大模块——工具调用、结果反馈结构化、思考过程分层管理、交互记录、自主性边界约束,并以 MCP 作为结构化协议落地手段,对照 Manus「掩盖而非移除工具」等实践提升 Agent 可靠性。
AI Coding后端开发实战:解锁AI辅助编程新范式:面向后端开发给出两条核心能力——个人上下文管理三步法(需求拆解与文件筛选、.md 文档沉淀、跨会话记忆传递)与 AI 输出质量判断体系(功能正确性、代码质量、性能安全),并落地 PRD → 系分 → 编码 → 验证的标准化流程,配合 Python 脚本批处理与 Agent 提示词工程三大场景,强调分阶段保存、频繁提交与新会话靠 .md 复活上下文。
1.6
- AI 辅助重构 20 万行代码:渐进式重建代码秩序:以推荐系统粗排服务为例,给出 AI 辅助重构五步——战略框架界定(新老并行、渐进演进)、AI 扫描出问题清单与优先级、暴力拆解 2000+ 行巨型函数、从 if-else 升级到策略模式再到依赖注入(AbstractDiversityRule、DiversityRuleManager)、用 Pipeline 取代闲置的 DAG 配置,强调工程师必须复核 AI 拆分点而非盲信生成代码。
1.5
AI Coding 长文分享:如何真正把工具用起来,从原理到实践:基于 Cursor 把 AI Coding 原理拆透——Token 构成(SystemPrompt + Rules + 对话历史 + 工具结果)、Function Call 四类工具(搜索 / 编辑 / 运行 / MCP)、Codebase Indexing 七步 RAG 流程,重点解析 Merkle Tree 实现 O(log n) 增量同步与 10 分钟一次的变更检测,并对比 Claude Code 的代码理解路径,给出规则设置、渐进式提问与代码风格友好性建议。
Claude Code七大组件,90%的人只会用1个?实战案例让你一次搞懂:以 7 个实战场景串起 Claude Code 全部组件——CLAUDE.md 注入项目记忆、Hooks 在 tool_use/Edit 等事件自动跑 lint 与测试、SubAgents 拆分认证重构等复杂任务并行处理、Commands 用 $ARGUMENTS 触发 /review 与 /fix-issue、Skills 通过 SKILL.md frontmatter 封装 add-api-endpoint 工作流、Plugins 一键安装、MCP 接入外部数据源,强调组合用法让 5 轮交互压缩到 1 轮。
1.4
- 库存合并扣减:一种基于分布式缓存的强一致性热点库存扣减方案:针对深库存热点抢购,给出 Redis 分桶计数 + DB 明细兜底的强一致方案——锁库存只加 lq 不动 sq,下单先扣 Redis 分桶再写明细,延迟 1s 通过覆盖索引 sum(quantity) 合并提交 DB,并设计扣减屏障防并发漏扫单据,压测单行 TPS 从 1.4w 提升至 3.2w,线上扣减成功率由 80% 升至 100%、耗时从 15ms+ 降至 7ms+。
