2024.11 期
2024.11 期
11.30
更快、更稳、更优,揭秘火山引擎全站加速 DCDN 规模容器化最佳实践:火山引擎边缘云团队把 DCDN 节点 90% 流量迁到边缘容器平台的复盘——选 Kata + 富容器保留 systemd / sshd 运维体系且做安全隔离,EIP 直通模式兼容 LB 转发避免流冲突,调度亲和性绑定同机型 CPU 保证负载均衡,并通过故障迁移 + 风控熔断 + Pod 快照快速恢复保障稳定性,落地后资源筹备从月级降到周级、上线效率提升 80%、边缘资源售卖率提升 11%。
字节跳动基于 Ray 的大规模多模态数据处理框架:字节 Seed + Data Infra 团队的 Ray Summit 2024 分享——用 RayCore + RayData 构建 Audio / Video 多模态训练数据 pipeline 解决 PB 级数据 + 异构 CPU/GPU + 复杂 DAG 三大挑战;针对 K8s 不稳定 Pod 抢占下 RayData 任务卡死的问题,自研「任务重新分配 + RayData 自维护算子血缘」两个增强方案,绕开 Actor max_restarts 限制让被抢占 Pod 不再阻塞整体作业。
11.29
详解 Apache ShardingSphere 的架构和原理:《Apache ShardingSphere 权威指南》新书序章——从云原生数据库管理三大痛点(多 SDK 学习成本高 / 适配新需求要重写代码 / 异构数据库无统一标准)切入,介绍 ShardingSphere 三大法宝:标准化数据分片、分布式事务、数据库治理;底层架构与上层组件如何协作打通,给开发与 DBA 一套通用治理范式。
B站创作端接入自研剪辑引擎:B 站创作端从第三方剪辑引擎切到自研引擎的迁移实录——第三方引擎的三大痛点(时间线模型固定难定制、多 App 共用一个对接研发响应慢、按 App 按年付费成本高)促成自研决策;接入挑战聚焦在原子素材(视频 / 音频 / 字幕 / 滤镜 / 贴纸 / 转场)+ 原子能力的抽象重设计,长期看随业务矩阵扩张边际成本趋零。
大模型加持下的Linux操作系统开发和自动化维护实践:把大模型嵌入 Linux 发行版开发与运维——总览解决方案后逐项实现 + 新增模块拆解,回答「LLM 如何参与内核构建 / 包管理 / 故障自愈」这类系统级 AI 化命题。
Prometheus在B端门店回收系统中的应用:B 端门店回收业务用 Prometheus 监控核心数据保稳定——四种 Metric 类型(Counter / Gauge / Histogram / Summary)的应用边界,配合 Grafana 大盘 + AlertManager 告警,落到核心业务数据的实时观测与告警链路。
11.28
- 性能提升 2000%!揭秘 MyBatis-Plus 批量插入的终极优化技巧:MyBatis-Plus
saveBatch默认实现的局限(每条都执行 INSERT,并未真正批量)→ 开启 JDBCrewriteBatchedStatements=true让驱动层把多条 INSERT 合并成一条 multi-row VALUES → 进一步用INSERT ... ON DUPLICATE KEY UPDATE处理冲突,最终把数十万行写入压到原来的 5%。
11.27
- 10 个系统设计中的取舍:10 组系统设计常见 trade-off——垂直 vs 水平扩展、SQL vs NoSQL、批处理 vs 流处理、Normalization vs Denormalization、CAP 一致性 vs 可用性、强一致 vs 最终一致、REST vs GraphQL、有状态 vs 无状态、同步 vs 异步、长连 vs 短连,每组都给出适用场景与取舍依据。
11.26
B 站基于 Iceberg 的流批一体的探索和实践:B 站资深开发的 Iceberg 落地分享——海量用户行为数据传输、商业 / AI 在线训练、DB 数据同步、Iceberg 维表 Join 四个核心场景,把流批一体从概念落到具体的数据通路与 Join 方案。
10 倍性能提升, GraalVM 应用可观测实践:GraalVM 解决 JVM 冷启动慢与运行时内存占用高问题,但带来可观测性挑战——文章给出 GraalVM Native Image 应用下的指标数据采集与调用链数据采集落地方案,让原本 JVM 上成熟的 APM 体系在 GraalVM 上继续可用。
11.25
从零开始了解推荐系统全貌:腾讯程序员的推荐系统科普长文——推荐算法理解、整体框架、用户画像、内容画像、算法构建、当前发展、衡量标准(CTR / CVR / 多样性 / 新颖度)以及算法之外的工程考量(特征工程 / 数据闭环 / 冷启动),适合刚入门的工程师建立全景认知。
转转度量平台技术建设实践:转转度量平台 V0.1 → V0.5 → V1 三代演进——V1 把数据源统一到数仓建设之上,技术架构上做指标管理、维度管理、口径治理与一致性校验,输出全公司一份「同一指标同一口径」。
QCon演讲实录|赵彦奇:HTTPDNS 边缘下沉,性能、成本和稳定性之间的取舍与思考:HTTPDNS 边缘下沉的取舍报告——核心矛盾是「流量与资源的冲突」+「性能与稳定性的冲突」,解法走敏捷交付 + 演进式架构,靠智能调度平衡容量 / 性能 / 可靠性,配合云边端全链路流量调度与软件 / 系统架构优化兜底。
11.23
- 23 种设计模式详解(全23种):CSDN 阅读 10w+ 的 GoF 23 种设计模式速查长文——创建型 5(工厂方法 / 抽象工厂 / 单例 / 建造者 / 原型)+ 结构型 7(适配器 / 装饰器 / 代理 / 外观 / 桥接 / 组合 / 享元)+ 行为型 11(策略 / 模板方法 / 观察者 / 迭代子 / 责任链 / 命令 / 备忘录 / 状态 / 访问者 / 中介者 / 解释器),每种附定义、UML 类图、Java 代码示例,适合面试前回炉。
11.21
- vivo 企业云盘服务端实现简介:vivo 企业云盘服务端整体实现——文件秒传 / 断点续传 / 多端同步 / 分享权限管理等核心能力的服务端拆解,重点讲存储分层、上传链路、客户端协议、权限模型与企业管控特性。
11.20
转转技术:亿级高性能通知系统实践:转转通用消息通知系统实践——五层架构(配置层 / 接口层 / 基础服务层 / 通用组件层 / 存储层);首次发送靠 Redis SETNX 保幂等 + Sentinel 滑动窗口动态发现问题服务自动路由到「异常通知执行器」做舱壁隔离 + 无界队列加自定义繁忙检测避免触发拒绝策略;重试发送靠分布式定时任务 + 锁防止重复捞取,配合 ES + MySQL 双写(用 update_time 当版本号保最终一致);流量突增两层降级(线程池繁忙走 MQ 削峰 → Sentinel 拦截直接落库延迟消费)。
什么才是架构师的真内核?:架构师真正的内核不是堆技术词,而是「在约束条件下做最优决策」——抽象建模、问题分解、权衡取舍、跨域协作四项底层能力,配合对业务领域的深度理解,比掌握某个新框架重要得多。
11.18
- Java方法设计原则与实践:从Effective Java到团队案例:从 Effective Java 出发的方法设计 checklist——入参(不要太多 / 谨慎使用可变参数 / 校验有效性)、返回值(避免返回 null、避免返回基本类型包装类)、命名、异常处理、文档与单元测试,配团队真实 Code Review 案例对比反例与修正。
11.16
- B站直播S14保障全解析:高效保障技术实践:B 站直播 S14 英雄联盟全球总决赛保障复盘——从赛事预案、压测建设、流量调度、CDN 容灾到值班 SOP 的端到端保障实践,重点拆解突发流量下的弹性扩缩容与回源链路稳定性策略。
11.13
- 【提效】docker镜像构建优化-提速10倍:Docker 镜像构建提速 10 倍的实战——动静分离原则(依赖装在 builder 阶段、源码后置避免缓存失效)+ 多阶段构建(builder 阶段下载依赖、runtime 阶段只 COPY 产物);构建耗时优化(合理 layer 切分 + buildkit 并行)+ 镜像体积优化(剥除中间产物 + 选轻量基础镜像)。
11.12
- 被问懵了,加密后的数据如何进行模糊查询?:可逆加密字段做模糊查询的三档方案——「沙雕做法」全量加载内存解密 / 维护明文映射表(违背安全初衷);「常规做法」数据库实现自定义解密函数 + 函数索引、或先取首末几位明文做粗筛再解密;「超神做法」对原文做 N-gram 切片后逐个加密入库,查询时把模糊词同样切 N-gram 加密做交集求并。
11.11
- 腾讯文档在线表格卡顿指标探索之路:腾讯文档在线表格的卡顿指标体系——重新定义「卡顿」(不是 FPS 而是用户操作到帧呈现的端到端时延),搭建大盘卡顿指标看板,把零散的性能埋点串成可量化、可下钻、可归因的指标体系。
11.9
- 没有实际的高并发经验,面试如何吹一波牛?:高并发面试话术五板斧——系统稳定性(限流 / 熔断 / 降级)、资源争抢与锁竞争(分段锁 / CAS / Redis 红锁)、缓存优化(多级缓存 + 一致性方案 + 热点 Key 处理)、数据库压力(读写分离 / 分库分表 / 慢 SQL 优化)、队列与异步(MQ 削峰 / 线程池 / CompletableFuture),每点配可量化指标话术。
11.8
京东面试:亿级黑名单 如何设计?亿级查重 呢?(答案含:布隆过滤器、布谷鸟过滤器):尼恩面试题——先回顾基数 / 二值 / 排序 / 聚合「四大统计」原理,再以亿级黑名单 + 亿级查重为切入,对比布隆过滤器(哈希多次置位 / 不能删除 / 有误判)vs 布谷鸟过滤器(指纹存储 / 支持删除 / 误判率更低 / 空间利用率更高),给出工程选型建议。
Java方法设计原则与实践:从Effective Java到团队案例:京东云开发者社区版的同篇「Java 方法设计」——以 Effective Java 为底、配团队案例的方法设计 checklist:入参不超过 4 个、可变参数慎用、入参一律校验、返回值避空,注释驱动设计先于实现。
电商库存系统的防超卖和高并发扣减方案:电商库存防超卖与高并发扣减方案——单机锁演进到 Redis 分布式锁、再到 Redis 原子扣减(lua 脚本)+ MQ 异步落库、再到分桶库存(拆分热点 Key),最终用「预扣库存 + 异步对账」处理支付超时与回滚。
11.7
- 揭秘JDQ限流架构:实时数据链路的多维动态带宽管控|京东零售技术实践:京东零售 JDQ 实时数据链路的限流方案——原生 Kafka 限流按 client.id / user 单维度,无法应对实时数据链路的多维(topic / partition / consumer group)动态带宽管控;JDQ 自研限流模型把多维带宽配额下发到 Broker,运行时根据热点动态调权,避免单 topic 被打爆波及全集群。
11.6
短链文章:
一个企业级高并发短链接服务项目分享_牛客网:四川大学校招简历项目级短链方案——三高(高可用 / 高性能 / 高并发)覆盖;MurmurHash + Base62 编码生成 6 位短链可撑 5 亿条;冲突识别选「唯一索引插入失败再判断」而非先查再插减少网络往返;302 重定向方便统计点击;Redis 多级缓存 + Caffeine 本地缓存挡住读侧 100:1 读写比。
京东短网址高可用提升最佳实践:京东
s.3.cn短网址服务(日均 1 亿条)的高可用改造——原方案随机算法在长链重复时能快速命中 Redis / HBase,但极端场景下生成性能波动;改造为「号段服务预生成短码 + 双写 Redis + HBase 兜底」,配合熔断降级与多机房部署提升整体 SLA。[万字长文] 系统设计之路:如何设计一个URL短链服务:万字长文版 URL 短链系统设计——从需求估算(QPS / 存储 / 带宽)→ 短码生成算法(Hash / 自增 ID / 雪花)→ 重定向 301 vs 302 取舍 → 数据库选型 → 缓存层级 → 高可用与扩展,串完整套系统设计 4S 流程。
字节二面:100Wqps短链系统,如何设计? - 疯狂创客圈 - 博客园:字节二面真题级 100W QPS 短链方案——62 / 128 进制表示法对比,号段模式预取 + Redis Cluster 分片 + 多级缓存挡读、布隆过滤器挡无效查询、HBase 做冷数据存储,把 100W QPS 拆到工程可落地的每一层。
腾讯女后端设计了一套短链系统,当场就想给她 offer!:以「相对安全 + 美观」为出发点的短链设计——302 跳转原理、Base62 编码方案、Hash 冲突解决、过期机制、防刷与限流,给出一套可在面试现场连贯讲完的完整答题模板。
不错的短链接产品:
小码短连接:支持分析报表、分组管理、自定义域名、API 对接等功能。地址:小码至营官网 - 小码短链接、小码公众号助手
魔众短连接:支持分析报表,短连接有效期设置、API 对接等功能的短链接系统。地址:魔众短链接系统 | 魔众软件 。
相关项目和教程推荐:
马哥的 SaaS 短链接系统,采用最新 JDK17 + SpringBoot3&SpringCloud 微服务架构:shortlink: 🔥 热门推荐 🔥 SaaS 短链接系统,承载高并发和海量存储等场景难题
一个基于 Spring Boot + MyBatis + + Redis + Hutool + Thymeleaf 开发的短链系统:GitHub - Naccl/ShortURL: 🔗 短链接生成器,长网址转短网址
11.4
- 再也不用心惊胆战地使用 FastJSON 了 —— 序列化篇 - 阿里云开发者:阿里云开发者从源码层级拆解 FastJSON 序列化整体流程 + 详细流程——按字段类型分发到对应 Serializer、对自定义类型做反射缓存、对循环引用与日期格式做特殊处理;逐个揭示历史上踩过的坑(autoType 漏洞 / NullValue 处理 / 日期格式默认值)以及对应的安全配置项。
11.1
- 走进京东零售广告研发部:大模型时代下的新一代广告系统 - 京东技术:京东零售广告研发部大模型时代广告系统全景——广告用户意图理解、广告多模态内容理解、ListVCG 基于强化学习的序列拍卖机制、基于强化学习的多智能体博弈,把传统 CTR/CVR + 出价机制升级到大模型 + RL 驱动的新一代召回 / 排序 / 出价架构。
