2025.12 期
2025.12 期
12.31
大模型在需求分析与设计中的提效实践:通过 RAG 检索 + 多 Agent 协作,将业务诉求端到端串联为 MRD→PRD→系统设计→代码骨架的全链路智能化流程,覆盖模块拆分、接口设计与多语言代码生成。
AgentScope:面向代理的编程,用于构建LLM应用程序:AgentScope 是一个生产就绪的 Agent 开发框架,提供与模型能力演进适配的核心抽象,并内置微调支持,目标是让构建 LLM 应用开箱即用。
12.30
- 程序员必备!微服务核心概念典藏版:以《Building Microservices》全书为基础,系统梳理从微服务定义、服务建模、集成技术、单块拆分到康威定律与规模化实践的完整知识框架。
12.29
别搞混了!MCP 和 Agent Skill 到底有什么区别?:MCP 解决"连接"问题——通过标准化协议让 AI 访问外部工具和数据源;Skill 解决"方法论"问题——以结构化指令教会 AI 完成特定类型任务,两者分工互补而非替代。
AI coding 智能体设计:以 Gemini-CLI 源码为切入点,逐层剖析提示词预处理、MCP 扩展解析、SubAgent 上下文隔离和规约驱动开发(spec-driven development)等 AI coding 智能体的核心设计原理。
12.26
一样的 LLM, 为什么有些私有化部署/托管部署的 LLM tool_chioce 相关特别差的原因 —— Chasing 100% Accuracy: A Deep Dive into Debugging Kimi K2's Tool-Calling on vLLM:调试 Kimi K2 在 vLLM 上 tool calling 成功率从不足 20% 提升至接近 100% 的过程,根因为三个 chat_template 兼容性缺陷:
add_generation_prompt被丢弃、空content类型处理错误、tool call ID 解析过严。AgentScope AutoContextMemory:告别Agent上下文焦虑:AgentScope Java 框架的 AutoContextMemory 组件通过 6 种渐进式压缩策略 + LLM 智能摘要 + 内容卸载到外部存储,在控制 token 成本(降低 70%)的同时保留完整历史可追溯性。
回收团队基于Cursor集成MCP的智能代码修复提示词生成实践:针对 Sonar 扫描结果修复场景,通过 Cursor 集成 MCP 实现精准上下文提取,将模糊大段粘贴替换为精确定位问题方法 + 规范引导 + 示例的结构化提示词,解决 token 超限与修复不准确问题。
12.25
Claude Agent Skills: A First Principles Deep Dive:Claude Agent Skills 本质是通过 prompt 扩展与执行上下文修改来扩展 LLM 能力的 meta-tool 架构,而非传统可执行代码。
腾讯技术面:聊聊MySQL五大核心模块:系统剖析 MySQL 分层逻辑架构、InnoDB 存储引擎、事务与 MVCC、主从复制、分区策略五大模块,并解答单表 2000 万行限制等经典面试问题。
12.24
从CLI原理出发,如何做好AI Coding:以 Unix"一切皆文件"哲学解析 CLI 型 AI Coding 工具的设计本质,指出其轻量可组合特性使其成为通用 Agent 内核,并非时代倒退而是极简主义回归。
IMA知识库:从0到1的架构设计与实践:腾讯 IMA 知识库以统一内部数据格式解耦异构数据源,通过单体到微服务的渐进演进解决 RAG 场景下的数据一致性、异步任务与高并发三大分布式挑战。
教你从零"手搓"一个大模型,别再只会调用API了:以参考 GPT-2 结构从零实现小型 LLM 为主线,逐步拆解 Tokenizer、Attention、训练循环等核心组件,将大模型原理转化为可运行的工程代码。
数据库主从同步高延迟破局实践之路:针对亿级库存快照写入导致的主从延迟高达 30 分钟问题,最终以大数据离线抽取(BDP + Hive → ES)替代 SQL 层同步,从根本上绕开 binlog 复制瓶颈。
12.23
- Agent全面爆发!一文搞懂背后的核心范式ReAct!:ReAct 范式通过"推理-行动-观察"(TAO)闭环将 LLM 的内部推理链与外部工具调用深度协同,使 Agent 具备可解释决策路径和抑制幻觉的能力。
12.22
- 从代码生成到自主决策:打造一个Coding驱动的"自我编程"Agent:在 ReAct 架构基础上以"代码即指令"替代传统 JSON 工具调用,结合 Py4j 双向调用、FIM 代码生成和分层记忆系统,构建面向 DevOps 场景的自主编程 Agent。
12.21
- Building agents with the Claude Agent SDK:Anthropic 通过赋予 Claude 文件系统、bash、代码执行等计算机访问能力,以"收集上下文 → 执行动作 → 验证结果 → 循环"的反馈闭环构建通用 Agent 框架,支持 Tools、语义搜索和子 Agent 编排。
12.19
AI架构师的诞生:AI+传统DDD模式 = 实现开发效率提升75%:以淘宝闪购服务包系统为案例,通过 AI 辅助识别限界上下文、生成 DDD 领域模型代码骨架,将新增服务包类型的开发成本从 5-8 人天降至配置化实现。
万字详解AI悖论,戳破AI时代最大的谎言:拆解 LLM 本质是概率预测器而非 AGI,用 p^n 不可靠性模型、Known/Unknown Unknown 分类与"用系统对抗个体不可靠"三大原则,批判 Vibe Coding 神话并给出 AI 协同开发的正确认知框架。
12.17
Java 设计模式:原理、框架应用与实战全解析|得物技术:系统梳理 GoF 23 种设计模式与七大设计原则,结合 Spring/框架源码解析各模式在 Java 工程中的实际应用,并以得物真实业务改造为实战案例。
转转大数据与AI——数据治理安全打标实践:基于自建 ZZ-Dify 平台将大模型接入数据治理流程,通过统一元数据结构 + 优化 Prompt 实现表/字段级自动安全打标,达到分钟级增量响应并显著降低人工成本。
12.16
- Multi-Agent全面爆发!一文详解多智能体核心架构及LangGraph框架:以 State/Node/Edge 三要素和有向图模型详解 LangGraph 核心,覆盖 Multi-Agent 主流架构模式,并附 LangChain4J/LangGraph4J 的 Java 版本实践。
12.15
破除AI Agent自主操控风险:万字解读LangGraph"人工干预"机制 ,附零基础实战:详解 LangGraph 通过持久化检查点 + interrupt 机制实现 Human-in-the-Loop,区分动态/静态两类中断模式,并结合 MCP 工具搭建真实 Agent 实战案例。
AI编码实践:从Vibe Coding到SDD:记录淘特导购团队从代码补全到 Agent Coding、再到 Rules 约束、最终探索 SDD(规格驱动开发)的演进路径,落地策略为:轻量级技术方案模板 + Rules 约束 + Agent Coding + AI 自动归档架构文档。
12.12
- AI研发新范式:基于技术方案全链路生成代码:腾讯广告审核团队提出"技术规范索引/rules + 模板化技术方案/prompt + MCP 工具集成 + AI 自我总结"四位一体范式,以技术方案文档为唯一驱动源,由 Agent 一站式完成从需求确认到代码上线的全链路提效。
12.11
- 后台太多记不住?我做了一个统一门户把所有系统全串起来了:以"门户为中心"替代传统 SSO 的"以子系统为起点",用轻量授权码机制实现一次登录进入所有后台,同时避免多技术栈系统的大规模改造。
12.10
让 AI Agent 实时生成个性化交互式可视化体验:将设计师的规范文档转为 design-master-prompt,让 Agent 在运行时直接生成可渲染的 HTML/WebComponent 前端组件,颠覆传统"设计稿 → 前端开发 → 接入 Agent 数据"的交付流程。
Redis+Caffeine 太强了!:以 Caffeine 作一级本地缓存、Redis 作二级远程缓存,构建两级缓存架构,并逐项对比 ConcurrentHashMap、Guava Cache、Caffeine、Encache 的选型差异及缓存一致性解决思路。
12.9
Human In the Loop竟然可以是个MCP?:阿里 OpenLM 平台实践,通过将 Human-in-the-Loop 设计为 MCP Server,结合图状态持久化与 Streamable Transport,解决 Agent 在服务端分布式部署下的人机回路工程难题。
非专业也能看懂的AI大模型工作原理!:从分词嵌入、Transformer 自注意力到位置编码,系统拆解大语言模型的完整推理链路,并结合 DeepSeek V3 案例给出上下文优化、多 Agent 协同等工程实践建议。
「深度好文」从"披着微服务外衣的大单体"到云原生架构:微服务拆分七大原则与反例详解:作者以亲历的"分布式大单体"演进为主线,逐条拆解微服务拆分的七大原则及其反例,覆盖从单体架构、Spring Cloud 到云原生服务治理的完整演进路径。
12.8
大模型开发实战从入门到入坑:动手写一个MCP Server去理解MCP背后的技术原理:通过从零手写 MCP Server,拆解 MCP 协议在 SSE/JSON-RPC 传输层的完整通信机制,阐明 MCP Client、Server、Host 三角架构如何将 Agent 的 function call 标准化解耦。
数据库AI方向探索-MCP原理解析&DB方向实战|得物技术:从 RAG 与 Function Calling 的局限出发,解析 MCP 如何以 JSON-RPC 2.0 统一 LLM 与数据库资源的交互规范,并结合 DW-DBA-MCP 项目展示 DB 方向落地实践。
让AI智能体拥有像人类的持久记忆:基于LangGraph的长短期记忆管理实践指南:以 LangGraph 的 Checkpointer(短期会话记忆)与 Store(跨线程长期记忆)为核心,结合 PostgreSQL + Embedding 语义检索,构建融合 MCP 协议与 supervisor 架构的多 Agent 长记忆系统。
深入理解分布式共识算法 Raft:系统拆解 Raft 的 Leader 选举、WAL 日志复制、ReadIndex/Lease Read 线性一致性读三大机制,阐明单主复制模型如何在分布式网络不可靠环境下保证数据的线性一致性。
12.5
- 聊聊线程池:深入
ThreadPoolExecutor源码,解析核心线程与非核心线程的调度逻辑、状态机流转、拒绝策略及 Tomcat/Dubbo 线程池差异,给出参数调优与最佳实践。
12.4
- 推荐系统三十年:从协同过滤到大模型时代的技术编年史:以时间轴梳理推荐系统从 1992 年协同过滤起源,经 Netflix Prize 矩阵分解、深度学习 Wide&Deep/DIN,到 2023 年后 LLM 生成式推荐的四阶段范式演进。
12.3
看懂这篇,你就能秒懂 LLM底层秘密—Transformer原理解析:以"翻译句子"为贯穿案例,从分词、词嵌入、位置编码到多头注意力机制,逐层拆解 Transformer 的 Encoder-Decoder 核心原理,并延伸至 MoE 混合架构等当前前沿设计。
团队AI编码率稳步提升到89.2%的AIcoding实践分享:以"技术方案模板 + 分层结构化 Prompt + 工程目录描述"三位一体构建 AI 编码方案,通过传帮带与 AI Code Review 等运营手段,将团队 AI 编码采纳率从 9.6% 提升至 89.2%,需求交付效率提升 23.6%。
货拉拉RAG优化实践:从原始数据到高质量知识库:针对 RAG 知识库中意图名定义不清、相似问法与意图不匹配、意图过于概括三类问题,采用大模型语义理解替代嵌入聚类方案,通过"少样本初始化 → 人工二次校验 → 全量分类"流程完成知识库清洗,将 63% 的意图进行了细拆。
万字长文讲透LLM核心:Transformer架构原理解析:系统梳理 Transformer 从分词、位置编码到 Self-Attention、Decoder-only 架构的完整原理,并介绍当前旗舰模型采用的 MoE 混合架构设计,指出理解模型能力是一切 LLM 应用演进的根本前提。
12.2
- 基于AI大模型的故障诊断与根因分析落地实现:基于 Dify 构建任务规划、指标分析、日志分析、拓扑感知、分析决策、最终输出六类专职 Agent 的多智能体协作系统,统一接入 Metrics/Logs/Traces 三类运维数据,将故障根因分析从小时级压缩至分钟级。
12.1
MCP 网关实战:基于 Higress + Nacos 的零代码工具扩展方案:以 Higress 承担 MCP Proxy、Nacos 承担 MCP Registry 的架构,解决多实例 SSE 粘性会话、工具 Prompt 动态更新和多租户鉴权三大问题,支持在无外网、无 Helm 的私有化 K8s 环境中零代码扩展 MCP Tool。
复杂任务AI处理实践:淘宝工程师的实战手记:将人工操作抽象为"眼(感知上下文工具)+ 手(执行操作工具)+ 脑(Workflow/Agent 决策)"三层范式,通过工单排查、数据治理、基线运维等真实案例,演示从单次工具助手到多步 Workflow 再到自主 Agent 的三级自动化路径。
从CoT到AGI:深扒大模型LLM"深度思考"的技术演进:从 Decoder-only 因果掩码的自回归预测机制出发,阐明深度思考的本质是将模型参数中蕴含的推理能力"显化",并系统梳理 CoT 及其变体从外部引导到 o1 式内化的技术演进路径,指出深度思考是以时间和算力换取更低幻觉率的"演绎推理"过程。
深度好文:MySQL InnoDB 事务隔离与 MVCC、版本链与 ReadView 原理详解:以问答体逐层拆解 MySQL InnoDB 四种事务隔离级别的实现机制,重点说明 MVCC 如何通过版本链与 ReadView 快照在 RC 和 RR 级别下实现非阻塞读,以及 Next-Key Lock 如何在 RR 级别下解决幻读问题。
