2025.9 期
2025.9 期
9.30
- 【万字长文】大模型训练推理和性能优化算法总结和实践:阿里云 AI 汽车行业团队系统梳理大模型训练与推理的性能优化方法论,从 NLP 发展路线讲到 Transformer/GPT 架构,再展开 KV-Cache 显存占用公式、PagedAttention 分块管理与共享机制、Continuous Batching、Flash Attention、混合精度、ZeRO 与 Megatron-LM 张量并行、Activation Recomputation,以 roofline 模型定位计算/访存瓶颈,落点是用工程化手段降低推理延迟与显存占用、提升吞吐。
9.29
与Cursor结对编程,掌握这个方法效率起飞!:腾讯业务开发同学把 PDCA(Plan-Do-Check-Act)方法论套到 AI 结对编程上,按生产交付/快速验证/实验探索三类场景区分人机协作模式(人主导 vs 结对 vs AI 主力),强调 Plan 阶段用结构化元数据、TAPD MCP、CoT 与 Mermaid 序列图把目标拆成确定小任务,再借助 Prompt Engineering 与 Context Engineering 沉淀规则,把 AI 的概率性输出收敛为稳定可交付的生产力。
用雪花 id 和 uuid 做 MySQL 主键,被领导怼了:用 Spring Boot + jdbcTemplate 在 user_auto_key / user_uuid / user_random_key 三张表上做控制变量法插入与查询压测,从 InnoDB B+ 树聚簇索引结构角度解释为何 auto_increment 自增主键在写入吞吐与页分裂上明显优于 UUID 与雪花 id,结论是无序主键会导致频繁页分裂、随机 IO 和索引膨胀,常规业务表应优先使用连续自增主键。
9.28
RAG实践:一文掌握大模型RAG过程:以 ROMA 框架文档为例完整走一遍 RAG 全链路,知识准备阶段覆盖文档解析、清洗标准化、元数据提取(file_path/section_title/entities 等)、按大小/语义/递归/结构等多种 Chunking 策略,再到 Embedding 与向量库构建;检索阶段讨论 query 改写、向量检索、混合检索与重排;生成阶段强调 prompt 模板与引用回填,给出缓解知识新鲜度、幻觉、信息安全、垂直知识四大痛点的工程范式。
开源|Python 应用往微服务迈进的 1*3 种 Pythonic 步伐:开源项目 nacos-serving-python 把 Spring Cloud Alibaba 那种「加注解即注册」的体验搬到 Python——「1」指通过
from nacos.auto.discovery.ext import requests等替换 import 实现 requests/httpx/aiohttp/urllib 的低侵入服务发现与负载均衡,「3」指三种由浅入深的注册方式:CLI 启动器零代码包装 Flask/Django/FastAPI、Import 触发器 hook 内置__import__自动注入 WSGI/ASGI Middleware、手动调用 inject_wsgi_middleware 精细控制时机。
9.27
- 谷歌浏览器扩展开发的原理与实践(DIY存网文):CodeBuddy「首席试玩官」征文软文,以「一键把网页转 Markdown 存档」为需求示例,介绍 Chrome 扩展的 manifest.json + background script + content script + popup 基本架构,主要演示用 CodeBuddy 从零生成扩展代码并加载到 chrome://extensions/ 调试,对扩展底层机制只做概览,重心在 AI Coding 工具的使用体验展示。
9.26
适用所有团队研发提效|带你1分钟上手基于Claude Code的AI代码评审实践:阿里 Aone 团队把 Claude Code 接入 CI 流水线做 AI Code Review,封装可配置流水线模板(ANTHROPIC_BASE_URL/TOKEN/MODEL + AONE_MCP_URL),通过 AONE MCP Server 获取 CR 上下文避开 git 权限问题,按 Level 1/2/3 对未分析、增量、已分析区域做分层处理,并用 Multi/Background Agent 并行 + 30 分钟超时控制,给出 push/merge_request 触发的 YAML 全量配置,体感提效 50% 以上。
从理论到实战,送你一份高可用架构踩坑说明书:京东工程师以「4 个 9/5 个 9」为基线,按应用、容器、机房、GC、DB、Redis(jimdb)、MQ(JMQ)多个维度盘点高可用陷阱,覆盖 int 溢出/字符长度溢出/除零空指针等代码故障、jimdb 2.1.12 缓冲区溢出与 2.3.1-HOTFIX 空指针、单容器故障对 Web/RPC/MQ/流程框架的差异化影响、机房级流量入口与垂直分组逃逸、JMQ 滑动窗口锁队列与应答超时(调到 tp999 的 10 倍)、消息体过大与下行带宽打满等真实案例与可执行规避方案。
9.25
1.8w字解析面向对象在软件工程中的应用:腾讯云开发者从编程语言演进史(数学翻译器→过程式→结构化→OOP)切入,纠正「OOP 过时了/编程语言默认就是 OO 所以无需学」两类误区,厘清面向对象与 UML、软件工程、DDD 的关系,系统讲解用例建模、面向对象分析 OOA 的静态/动态/深层建模、面向对象设计 OOD 的 GRASP 职责驱动模式(信息专家、创建者、控制器、低耦合、高内聚等),构建从思想到方法到落地的完整 OO 知识框架。
如何将 AI 代码采纳率从30%提升到80%?:作者基于 Roo Code / Continue / Trae / Claude Code 的重度使用经验,把 AI 编码采纳率低归因为信息不对称、任务粒度过大、反馈循环缺失、角色边界模糊四大问题,给出两条主线方案——分层文档体系(用户全局/项目/模块/需求四级 + CLAUDE.md + .ai/docs 规范模板)解决上下文缺失,以及 Issue 管理流程(/issue-create→/issue-breakdown→/issue-execute→/issue-status)解决任务粒度,并展望 TDD 集成与 Multi-SubAgent 多角色协作。
9.24
一篇文,让你的Cursor、CodeBuddy们变更强!:作者强调「工具不重要、方法论才重要」,把 AI 编程从迷宫导航式读码(用 Role/Task/Context/Constraints 四要素 Prompt 让 AI 在 1 小时内输出含 Mermaid 流程图的架构梳理)推进到结构化协作四阶段——Explore 勘探、Plan 规划、Code 编码、Commit 收尾,反对 Vibe Coding 式甩需求,主张开发者把自己从使用者升级为「总建筑师」,让 Cursor/Claude Code/CodeBuddy 在同一套工程流程下都能稳定产出高质量代码。
打破RAG局限!意图+语义双检索框架来了:货拉拉与 AWS 联合提出 CID-GraphRAG(Conversation Intent Driven GraphRAG)解决智能客服多轮对话中传统单路径 RAG 的上下文断层与机械重复问题——构建阶段用 LLM 从优秀人工对话提取双层意图(Primary + Secondary)建图,并聚合「意图对」节点优化推理查询;推理阶段并行跑意图匹配 Path 与语义相似 Path,结合多维评分自适应融合候选,把双层检索结果作为 Few-shot 联合用户/助手意图与对话 memory 生成更拟人、目标导向的回复。
线程池ThreadPoolExecutor源码深度解析|得物技术:从 JUC Executor 类图切入,逐行拆解 ThreadPoolExecutor 七大参数(corePoolSize / maximumPoolSize / keepAliveTime / workQueue / threadFactory / handler)与 execute → addWorker → runWorker 的核心源码路径,澄清核心线程满后先入队再扩容到 max 的真实顺序,并对比 ArrayBlockingQueue / LinkedBlockingQueue / SynchronousQueue 适用场景,最后给出 invokeAll 超时失效、submit 异常吞掉、池隔离与自定义 RejectedExecutionHandler 等生产最佳实践。
9.23
CC&LG实践|基于 LangGraph 一步步实现 Claude-Code 核心设计:以 LangGraph 的 state/node/tool 三要素为骨架,从最小 ReAct Agent 渐进升级为简版 Claude Code,依次接入 interrupt + Command 实现人在环路、MemorySaver/Redis 检查点持久化、伪造 askHuman 工具让 LLM 自主触发人工协同、TaskTool 派生 SubAgent 实现多 Agent 并发与上下文隔离,复刻 Claude Code 用户交互层 / Agent 调度层 / 工具层 / 记忆层的核心实现路径。
学习上下文工程邪修版,万字详解啥是"上下文处理(Context Processing)":解读 arXiv 上下文工程综述 2507.13334 的 Context Processing 章节,把「精加工」分为长上下文、多模态、关系型/结构化、自优化自适应四类问题,系统梳理 Mamba / LongNet / TNN / 线性注意力的架构创新,NTK / YaRN / LongRoPE / PoSE / Self-Extend 的位置插值,GQA / FlashAttention / Ring Attention / 稀疏注意力的工程优化,以及 Rolling Buffer 等内存压缩与 CLIP / Q-Former 多模态对齐、K-BERT 类知识图谱融合方案。
MySQL单表为何别超2000万行?揭秘B+树与16KB页的生死博弈|得物技术:从 InnoDB 16KB 数据页与 B+ 树结构推导单表 2000 万行的来历——非叶子节点单页可容纳约 1280 个 (主键+页号) 指针,叶子节点按 1KB/行算每页约 15 行,三层 B+ 树承载 1280² × 15 ≈ 2.5kw 记录,对应 3 次磁盘 IO;行数突破临界点会触发树高从 3 升 4,I/O 多一次、性能断崖式下降,并对比 B 树同等数据需 6 层证明 B+ 树更适合做索引,给出控制行宽、分库分表、冷热分离的实践建议。
0基础带你精通Java对象序列化--以Hessian为例|得物技术:把序列化拆为对象图遍历 + 编码格式两层,对比 JSON 用 {}/,/: 做边界 token,详解 Hessian 二进制协议如何用 1 byte tag 标记每个数据块类型,POJO 用 C 编码结构、O 编码字段值并通过结构引用序号复用 className/fieldNames,借助对象引用序号解决重复引用与循环引用,以及通过 tag 分段实现长度≤31 字符串与序号≤16 POJO 的内联、变长整数 1/2/3/5 字节自适应压缩等紧凑编码细节。
9.22
私域知识工程实战:如何让AI一次性写出高质量代码?:把 AI 编程「80 分困境」归因为信息不对称而非模型能力,提出私域知识工程三板斧——用「代码解构与业务分析师 Prompt」对工程做入职培训沉淀架构 / 数据模型 / 业务规则 / 术语 / 规范 / FAQ 六类 markdown 文档,再用「开发专家 Prompt」叠加知识库一次性生成符合规范的 Controller/Service/DTO 代码,最后通过「文档自动维护 Prompt」基于 git 变更与需求文档增量更新,让 Claude Code / Aone Agent 从临时工变成项目老手。
配置驱动的动态Agent架构网络:实现高效编排、动态更新与智能治理:针对 Dify / Coze 共享运行时在企业落地暴露的隔离差、单点故障、安全边界弱等问题,提出配置驱动的独立运行时 Agent 架构——通过 Agent Spec(Agent 基础 / Model / MCP / Partner Agent / RAG / Memory 六类配置)+ Prompt Center / MCP Registry / Agent Registry 三个 AI 注册中心解耦远程通信,依赖 A2A 协议构建对等协作网络,并由 Agent Spec Execution Engine 运行时热更新 Prompt / MCP / 子 Agent 拓扑,Agent Studio 提供可视化编排、灰度发布、链路追踪、凭证托管。
Claude Code 深度拆解:一个顶级AI编程工具的核心架构:基于开源逆向版 ClaudeX 拆解 Claude Code 的三层架构——交互层用 Ink 框架的 REPL.tsx / PromptInput.tsx 处理
/slash、!bash、自然语言三种输入并区分 AssistantToolUseMessage / UserToolSuccessMessage 渲染;核心引擎在 query.ts 以 async generator 串起 prompt 拼装、queryWithBinaryFeedback(同一请求并发两次比对 tool_use 检测模型犹豫)、只读工具并发 / 写工具串行调度;上下文层用 LRU 缓存文件编码与行尾、按需 Glob、结果截断;权限层通过 needsPermissions + dangerouslySkipPermissions 守护工具调用。干掉if-else噩梦!这四种设计模式太优雅了!!:用四种行为型模式替换条件分支爆炸——策略模式通过 Strategy 接口 + Context 持有引用实现算法可替换,SPI 机制以 JDBC DriverManager 的 ServiceLoader 加载 META-INF/services 实现接口与实现解耦、Dubbo SPI 用 @SPI + ExtensionLoader 支持按 key 按需加载与 IOC/AOP,责任链模式以神州专车支付流程为例把账户余额 / 优惠券 / 企业账号判断串成 PaymentHandler 链,配合状态模式与命令模式覆盖复杂分支场景。
9.21
- 大模型可观测1-5-10:发现、定位、恢复的三层能力建设:基于阿里巴巴 1-5-10(1 分钟发现 / 5 分钟定位 / 10 分钟恢复)方法论构建大模型应用可观测体系,把核心指标拆为可用性(状态码、4XX/5XX/429)、性能(延迟、Token 数)、业务反馈(用户差评率)和资源水位(QPM / Token 使用率)四类,按 app / module / model / workspace 维度打点;业务监控通过 SLS + Logtail / LoghubAppender 采集自定义日志构建 QuickBI / DataV 大盘,云产品监控则结合百炼模型观测、ARMS、云监控实现告警与下钻定位。
9.20
xxl-job中那些惊艳的架构设计:剖析 xxl-job 调度器与执行器基于 netty http 的通信链路四个关键设计——XxlRpcReferenceBean 用动态代理隐藏远程通信细节、执行器收到任务后丢入 LinkedBlockingQueue 全异步处理、回调结果同样异步出队避免阻塞 netty 工作线程提升吞吐,以及通过 XxlRpcFutureResponse 的 lock.wait / notifyAll 配合 requestId 索引 futureResponsePool,把异步 RPC 包装成调用方眼里的同步 run() 调用。
换掉ES!Redis官方搜索引擎来了,性能炸裂!:介绍 Redis 官方搜索引擎模块 RediSearch,宣称压缩倒排索引构建 50K 索引 / 2500 万文档仅 201 秒(ES 在 921 个索引时崩溃)、两词查询吞吐 12.5K ops/s 对 ES 3.1K ops/s、延迟 8ms vs 10ms;列举 docker run redislabs/redisearch 安装方式与 FT.CREATE / FT.ADD / FT.SEARCH 命令示例,演示 SORTBY / LIMIT / 前缀
李*/ Levenshtein%%...%%模糊 /@field:字段查询,并提示中文需 LANGUAGE chinese 走 friso 分词。
9.19
jwt与token+redis,哪种方案更好用?:从认证与授权基本概念入手,对比 JWT 的无状态/跨域/自包含与 Token+Redis 的可主动失效/精细控制两类方案在性能、安全性、扩展性上的差异,给出「短期 JWT + Redis 黑名单 + Refresh Token」的混合方案 Java 实现,并结论:分布式微服务和 SPA 优先 JWT,需精细会话与即时吊销的企业系统选 Token+Redis,现代 Web 应用推荐混合方案以兼顾无状态特性与主动注销能力。
一组用于优化提示词的提示词:提供一段中英文双版本的「增强型 AI 提示词生成器」Prompt,作为新对话窗口的开场预设,按「理解输入 → 优化扩展 → 注入专业性 → 结构化(角色/职责/方法论/任务/建议)→ 审核精炼」五步工作流,把用户模糊提示自动转写为含角色定义、可执行步骤与示例的结构化指令,以减少模糊表达并提升 LLM 回复质量。
9.18
凡人程序员进入修仙时代?意图即代码的范式革命即将到来:腾讯云开发者提出 AI 原生开发范式「意图即代码」,由三大支柱构成——意图编排(在意图画布上用自然语言描述业务流程,意图块以 .doc/.flow/.contract 等结构化字段组成意图树,AI 通过「智能上下文总线」自动连接数据流以消灭胶水代码)、资源发现(通过 MCP/gRPC reflection/OpenAPI 等模式让 AI 动态发现并理解 DB 与外部 API)、意图约束(用 Protobuf 契约定义输入输出、BDD 风格 examples 定义行为,给 AI 创造力安装可验证护栏),主张让开发者从编码工匠回归到意图叙述与架构思考者。
API协议全景图:从REST到MCP的选型指南:以阿里开源 HiMarket 项目为背景按场景梳理六类主流 API 协议——RESTful(资源+HTTP 动词,Web API 事实标准)、GraphQL(单一入口按需取数,解决移动端字段过多/不足)、面向微服务的 RPC 体系(Dubbo/gRPC/Spring Cloud Feign,HTTP/2 + Protobuf 提性能)、WebSocket(全双工长连接,做 IM/协同/行情)、面向 LLM 流式输出的 SSE(HTTP 单向流,兼容代理与负载均衡,支持 Last-Event-ID 断线重连)、面向 MCP 的 Streamable HTTP(统一端点 + 按需流式,替代早期 HTTP+SSE 的双通道方案以解决长连接资源消耗与防火墙兼容性问题)。
面试官:如果要存ip地址,用什么数据类型比较好:解释《高性能 MySQL》建议用 UNSIGNED INT 而非 VARCHAR(15) 存 IPv4 的原因——整型只占 4 字节,节省存储与索引空间,BETWEEN AND 范围查询效率更高;缺点是不便阅读需手动转换,MySQL 提供 INET_ATON / INET_NTOA 函数双向转换,IPv6 对应使用 VARBINARY 与 INET6_ATON/INET6_NTOA;附 Java 端 ip2Long / long2Ip 位运算实现示例。
9.17
初探:从0开始的AI-Agent开发踩坑实录:作者在 K8s Helm Chart 自动生成任务中复盘 AI Agent 开发踩坑——先按 LangChain 的 Define→Build MVP 流程界定 AI 的「分析者/决策者」边界,再对比 ReAct(Thought-Action-Observation 循环)、Plan-and-Execute(先规划任务清单再执行)、ReWOO(Planner-Worker-Solver 三段解耦、Worker 无 LLM、蓝图固定)三种行为范式;首版「全自主决策」Agent 因决策瘫痪、工具误用、幻觉与不可复现而阵亡,最终转向 LangGraph 编排的「结构化工作流」范式(人类定义骨架、AI 填血肉),并总结结构化 Prompt(角色/工具/注意事项/输出格式/逻辑/要求)配合 Few-shot 是关键。
大模型提示词技巧Prompt Engineering,看这一篇就够了:腾讯 CSIG 磐石数据中心在数据分析场景下沉淀的 Prompt 写作框架——以 Markdown 格式按「角色/任务 + 核心原则(≤3 条)+ 上下文处理 + CoT + 输出规范 + Few-Shot」组织提示词,先借模型生成初版再用 30 条 query/期望输出数据驱动迭代优化;强调上下文长内容置末、Few-Shot 与 CoT 步骤保持一致、对难以文字表达的复杂逻辑可用伪代码描述、输出规范同时列出期望和禁止的内容结构以约束 LLM 自由发挥。
LLM在转转回收问答系统的主要应用场景及关键技术:转转质检问答系统围绕意图理解、RAG 问答、知识库维护三大场景做工程落地——意图理解用「意图识别 + 意图改写」双模块闭环(先通用 LLM+Prompt 后做领域微调,结合「部件-现象」知识图谱实现结构化反问引导);RAG 升级为「检索 → 重排 → 生成」三层 pipeline 通过重排过滤噪音、严格 Prompt 抑制幻觉;知识库走「人机协同知识工厂」四步(QA 对挖掘 → 聚类挖标准问 → LLM 多 QA 合成统一答案 → 人工质检入库),实现 LLM 与领域知识图谱、人工审核三者融合的持续进化型问答系统。
9.16
2w 字 MySQL面试真题(图文并茂版):事务、索引、锁、主从同步、日志、性能优化、分库分表:码哥整理的 75 道 MySQL 高频面试题合集,按基础(三范式、InnoDB vs MyISAM、char/varchar、in/exists、drop/delete/truncate、查询执行流程)、事务(ACID、四种隔离级别、脏读/不可重复读/幻读、MVCC 基于隐藏事务 ID + undo log 版本链与 Read View 实现原理)、索引、锁、主从同步、日志、性能优化、分库分表七大类组织,给出图示与解答,定位面试前的查缺补漏参考。
MySQL同步ES的5种方案!:对比 MySQL → ES 同步的五种方案——双写(业务代码直写两端,实时但一致性差、侵入强)、定时任务(按 update_time 扫描批量同步,简单但实时性低)、Binlog 直连(用 BinaryLogClient 解析 WriteRows/UpdateRows/DeleteRows 事件,实时无侵入但实现复杂)、Canal(订阅 Binlog 增量消息,阿里开源、社区活跃,需维护服务)、MQ 异步(业务写 MySQL 后发消息到 RabbitMQ/Kafka 由消费者写 ES,解耦高可用但有顺序与一致性延迟问题);选型建议:小规模选双写/定时,中大型选 Canal/MQ,大数据量高实时选 Binlog 或 Canal。
9.15
别再误会MCP了!一篇写给AI工程师的硬核"辟谣"指南:阿里云通过架构分析、SDK 源码检验与 CherryStudio 案例解剖,论证 MCP 本质是 Client-Host-Server 三组件的模型无关 RPC 协议,Server/Client 仅承担协议通信与确定性能力,所有 LLM 智能(Prompt 构建、模型调用、意图解析)由 Host 承担;与 Function Calling 是基础设施协议与模型决策能力的协作关系而非替代;并指出基于 Prompt 的 MCP 方案存在 System Prompt 随 tools 数量膨胀至 60K Token 的固定成本,应用效果取决于工具原子性、Prompt 精度与 LLM 能力三者协同。
为什么不建议在 Docker 中跑 MySQL?:从有状态服务与容器无状态设计哲学的根本矛盾切入,论证 Docker 跑 MySQL 在 I/O 性能(存储驱动层带来 10%-20% 损耗)、数据持久化(数据卷孤儿与 fsync 风险)、内存与 CPU 资源精确管控、主从复制与脑裂、安全隔离、监控诊断六大维度的劣势,结论为开发测试环境可放心使用 Docker,生产核心库应回归物理机或云数据库,必须容器化时使用 Kubernetes StatefulSet + SSD StorageClass。
一口气说出前后端 4 种鉴权方案:系统梳理 HTTP Basic Authentication、session-cookie、Token(JWT)、OAuth 2.0 四种鉴权方案的协议流程、Node.js + Express 实现代码与适用边界——Basic Auth 因 base64 可逆与请求头携带凭据仅适合内网;session-cookie 依赖 cookie 限制客户端类型;Token/JWT 通过 Header + Claims + Signature 三段式签名自携状态、跨端友好且可灵活扩展;OAuth 2.0 通过 code → access_token 六步流程实现第三方授权,适合 ToC 场景提升登录体验。
9.13
- 转转LLM应用-重排阶段商品粒度的跨品类搭配:转转推荐重排阶段引入 LLM 标注 + BERT 蒸馏的两阶段方案构建跨品类搭配能力——通过用户行为按高/中/低频拆分 pair 并差异化处理(人工抽检、LLM 校验、few-shot 扩长尾),按品类/颜色/品牌/成色/型号 5 维度加权 1-10 打分并拆分 Prompt 并发执行规避耗时;先用样本微调 Qwen 7B 获取垂域能力,再以 distill_loss + task_loss 蒸馏至 340M BERT 解决线上耗时;首页 feed 上线后 PV 商详到达率 +6%、UV +5%。
9.12
- 多智能体自主规划模式性能提升:五大精准策略详解:阿里基于线上 React Multi-Agent 框架的实测痛点提出五项工程改进——(1) 用 XML 标签流式输出替代 Function Calling 以合并思考与工具推理并提升响应感;(2) 通过文件引用 + 文本改写小模型压缩上下文,仅在工具调用时回填原文;(3) 内置「万能 agent」推理工具兜底无对应能力的规划步骤,避免空缺导致下游入参质量崩塌;(4) 用结束总结工具替代简单空 tools 判停,强制产出贴近用户的完整报告;(5) 通过即插即用的规划 MCP 维护待办表实现过程监督,防止跑题与死循环。
9.11
- 一文搞懂架构顶层设计之业务建模:腾讯云从建模的哲学定义出发,将软件工程分为业务建模、领域建模、数据建模三层,论证建模是软件工程难题的根因来自语言的模糊性(如电商「商品 ID」在不同场景定义不一)、现实复杂性与跨团队信息失真;重点拆解业务建模的四个产出物——业务用例、业务流程图、系统用例、系统用例规约的严格推导关系,强调业务流程图泳道必须是角色或系统而非内部模块、研究对象是组织而非系统、价值点定义先于用户定义,区分业务用例(为组织价值)与系统用例(为系统价值)。
9.10
- 分布式事务:共识之外,分布式系统状态管理的另一大基石:阿里云阐述共识作用于副本一致性而事务解决跨资源实体的 Serializability,二者分别对应 CAP 与 ACID;分布式事务标准实现为 2 PC + MVCC + Paxos 三层;按 SQL-92 隔离级别梳理 Read Committed、Repeatable Read、Serializable 与新增的 Snapshot Isolation 对脏读、不可重复读、Phantom、Write Skew 的应对;深入 MVCC 三大并发控制协议 MVTO/MVOCC/MV2PL 的元组版本布局与冲突判定差异,并讨论 Append-only (O2N/N2O) 与 Delta Storage 两类版本存储方案及对应 GC 与索引优化策略。
9.9
- 万字详解让大模型写出好代码:上下文窗口的工程化实践:腾讯云从 BPE token 化机制切入,分析代码相较自然语言信息密度更高、语法结构占用 token 的特性,拆解上下文窗口被系统提示词、历史对话、用户输入与相关文档四类内容消耗的分布;以 Cursor + Claude 4 分析 React 源码的实际链路为例,提炼语义化分层搜索、选择性读取代码片段、记录与关联搜索结果三条节流原则;针对多轮和单轮易爆窗的两类场景,给出主动要求 AI 记忆关键发现、定期请其总结状态、按 P0/P1/P2 优先级更新、问题分段处理与代码摘要替代粘贴大段代码等可执行 Prompt 模式。
9.8
让AI成为你的编程助手:如何高效使用Cursor:转转分享 Cursor 高效使用方法论——Prompt 编写遵循角色定义、任务描述、约束条件、预期输出、反馈循环五段式框架,原则是具体胜于模糊、简洁胜于冗长、结构胜于无序;上下文引导用 @ 精准指定接口、规范输出位置、建立功能导航 MD、提供参考代码以避免重复造轮子和「屎山」;复杂任务用多轮对话拆分(先框架后细节);通过 Cursor Rules(User / Project / Memories 三层 + 文件 > 项目 > 用户优先级)解决 AI 无记忆与上下文截断问题,规则按 base / languages / frameworks / other 分层组织、单文件 ≤500 行,配合 Always / Auto Attached / Agent Request / Manual 四种触发方式精准引用。
万字长文详解腾讯优图RAG技术的架构设计与创新实践:腾讯优图 RAG 体系覆盖语义检索、结构化表检索与图检索三大栈——语义检索侧自研 2B Embedding 通过弱监督/有监督/指令对比学习三阶段管线及 Reranker 模型蒸馏数据筛选实现 C-MTEB SOTA,并把 Reranker 升级为 LLM + Layerwise 知识蒸馏支持按层裁剪推理速度;结构化检索融合 Text2SQL 与 RAG,基于 MAC-SQL 多智能体(Selector/Decomposer/Refiner)框架配合 ES+MySQL 双引擎与 AST 校正提升模糊查询召回;自研 GraphRAG 用「属性-三元组-关键词-社区」四级知识树 + S2Dual-perception 社区检测算法(相比 Leiden 提速近 100%)+ AgenticGraphQ Schema 感知的复杂 Query 解耦,相比微软 GraphRAG 与 LightRAG 在构图成本上从亿级 token 降至百万级、效果提升 20%-200%。
9.6
基于《架构现代化》浅谈架构共鸣:基于《架构现代化》一书从八个切点(大泥团、独立价值、领域划分、概念设计、分类视角、领域厚度、全局与局部、脚手架)梳理架构演化共鸣,强调技术债的隐性成本主要在前期沟通与后期运维,业务/平台权责一体的动态平衡、DDD 六边形架构作为顶层设计与现状演化的融合点、概念设计承上启下的拉齐共识作用,以及局部与全局复杂度的转移本质,最终落脚于以信任与卓越工程推动「码农」向具备设计思维的工程师转变。
淘宝闪购实时分析黑科技:StarRocks + Paimon撑起秋天第一波奶茶自由:饿了么数据团队为支撑淘宝闪购亿级营销与分钟级实时决策,采用 StarRocks + Paimon 实时湖仓架构,通过三大技术手段突破传统离线瓶颈——异步分区物化视图分层加速(120+ MV、15min 刷新、千亿级分区物化)将复杂查询从分钟级压缩到秒级;RoaringBitmap 结合 Paimon 流读流写与 StarRocks Bitmap 函数实现 UV 去重的 UNION/AND/AND NOT/漏斗等多维灵活分析;通过 SQL 优化、资源隔离与大查询治理保障 9280→20800 CU 集群稳定。
9.5
- 如何让AI"看懂"网页?拆解 Browser-Use 的三大核心技术模块:从源码视角拆解 Browser-Use 在 Service/View 分层下的三大核心模块——Agent(含 message_manager 消息管理与基于 Mem0 的 memory 压缩长上下文)、Browser(基于 Playwright 封装的会话管理)、DOM 感知引擎(buildDomTree.js 递归遍历含 iframe/Shadow DOM/contenteditable 的结构化抽取与可交互元素索引),并对照传统 RPA、Selenium/Puppeteer 阶段的局限,论证 LLM + Vision + DOM 让浏览器自动化从规则驱动跃迁到认知驱动。
9.4
从 Prompt 到 Context:基于 1400+ 论文的 Context Engineering 系统综述:以 1400+ 论文综述为线索,将 Context Engineering 定义为「在 context window 中装入恰当信息」的优化工程,比 Prompt Engineering 范围更广;用 LLM OS 视角把 context window 类比为 RAM,把 Context Engineering 定位为 Software 3.0 的「用户态编程」(不改内核而最大化模型行为),引用 Manus 的 KV-Cache 前缀稳定设计佐证;并通过 Context Poisoning、Distraction、Confusion、Clash 四类失败模式与 Instructions/Knowledge/Tools 三类内容分类、Short-term/Long-term Memory 体系阐明 Context 的工程边界。
菜鸡才用AI写代码,10倍程序员这样用Claude重塑编程工作流:基于 Anthropic 内部 9 个团队的实践沉淀出三类 AI 协作模式——同步协作(架构与核心算法,人主导 AI 补盲)、异步自主(SQL/测试等可委派执行)、混合探索(陌生代码库与新技术学习),并提炼三个反直觉技巧:「老虎机模式」用 git checkpoint + 失败果断回滚替代修补以避免上下文污染、「双代理分工」绕开多目标帕累托困境、「视觉驱动开发」用截图迭代降低自然语言有损压缩;落地路径强调 Claude.md 项目说明书、频繁提交与按复杂度匹配策略。
我工作中用MQ的10种场景:作者从工程实战角度梳理 MQ 在解决系统耦合、性能瓶颈与数据一致性中的 10 类典型场景——系统解耦(订单→库存/积分/邮件改异步事件)、异步处理(视频转码 Kafka 解耦)、流量削峰(秒杀 Redis 预扣 + RabbitMQ 缓冲)、数据同步(RocketMQ 事务消息 + 幂等消费)、日志收集、配置广播、顺序消息(按 sharding key 保证订单状态有序)等,附 Spring Boot 代码示例与对应的 RabbitMQ/Kafka/RocketMQ 选型要点。
9.3
- 三重Reward驱动的运维智能体进化:多智能体、上下文工程与强化学习的融合实践:阿里技术风险团队提出 DeRisk 这一 AI 原生 AIOps 智能系统,主张抛弃 Workflow 锁死智能演进的范式,沿三类 Reward 优化驱动进化——多智能体协同 Reward(Group 群组式与基于组织架构的 TeamMode 两种协作范式)、上下文工程 Reward(把 LLM 输入形式化为 Instructions/Tools/Knowledge/Memory/State/Query 的优化函数)、强化学习 Reward(与环境在线交互的端到端进化);架构上三层(基础平台/智能迭代/应用场景)配套推理引擎、知识引擎与 MCP 工具资产,并以 DeepRCA 告警深度诊断为落地案例。
9.2
- ClickHouse 的"独孤九剑":极速查询的终极秘籍:以「独孤九剑」比喻系统拆解 ClickHouse 极速 OLAP 的九大设计——MPP 对等架构 + 存储服务于计算的总体结构、列式存储(8:1 压缩比与按列解压)、SIMD 向量化执行引擎、类 LSM 预排序写入、丰富表引擎、为列计算优化的 100+ 数据类型、分片 + 副本(Distributed 表与 sharding_key、load_balancing 算法)、主键稀疏索引 + minmax/set/Bloom 跳数索引,以及不太成熟的计算引擎(JOIN 与优化器是短板)。
9.1
AI Agent工程化融合:分享我的实践经验和选型技巧:以淘天两个真实场景论证 Agent 与工程结合而非替代的选型方法论——第一个场景用 Agent + playwright-mcp(含 STDIO/SSE/StreamableHttp 三种 MCP 通信方式辨析)打造定时报表巡检与异常播报,突破 FBI 在表格类型、异常筛选与下游动作上的限制,并将不同场景元数据 RAG 存到关系库做语义匹配;第二个场景从全量交给 Agent 的失败经验(token 高、速度慢、准确性差)回到「工程做规则确定的事,Agent 只做语义匹配」的分工,给出能力边界对比清单。
解码大模型:技术篇《1.1-基础架构概念》:大模型科普系列的基础架构开篇,系统讲解 Transformer 的四大核心组件——自注意力(Q/K/V 联想机制)、多头注意力(语法/语义/位置/共指等专业化分工解决多目标优化)、位置编码(正弦余弦保证唯一性/相对性/可扩展性/平滑性)、Encoder/Decoder(BERT 仅编码器、GPT 仅解码器、T5 编码解码兼备);并延伸到预训练(LM/MLM/NSP/SOP 自监督任务、规模效应、数据/训练/效率三类挑战)与微调(全参/LoRA/Adapter/Prompt Tuning/渐进式)及迁移学习的域适应理论。
拥抱 AGI 时代的中间层⼒量:AI 中间件的机遇与挑战:以 OpenAI 提出的通往 AGI 五级路径(对话→推理→Agent→发明发现→组织级)为框架,阐述大模型能力跃迁与 LLaMA/QWen/DeepSeek/Kimi 等开源生态共同推动 AI 应用从聊天机器人到通用/垂直 Agent 并存的演进,并论证 AI 中间件作为「中间层」的七大机遇——Agent 研发提效(Serverless 运行时 + Evaluation 框架)、Context Engineering(KV-Cache 前缀稳定与上下文压缩)、短长期记忆管理、MCP 工具生态、沙箱安全、多智能体编排、多模态管线。
