最近更新
排序
GitHub Actions Docker 构建缓存失效的两个真实原因:token过期和dockerignore
问题:CI 构建每次从零编译 用 GitHub Actions 跑 Docker 构建,明明什么都没改,却每次都从零开始。缓存命中率 0%,CI 时间从 2 分钟飙升到 12 分钟。 根因有两个,都很隐蔽:GITHUB_TOKEN 24h...
GitHub Actions 环境配置的两个真实坑:inputs默认值和secrets作用域
用 GitHub Actions 的 workflow_dispatch 配合 environment 字段,蓝绿部署、灰度发布都能搭。但跑起来有两个容易踩的坑:inputs 的默认值在特定触发方式下不生效,以及 environment secrets 在...
Docker BuildKit 缓存失效:本地能跑 CI 不行的 2 个真实场景
# Docker BuildKit 缓存失效:本地能跑 CI 不行的 2 个真实场景 本地开发好好的 Dockerfile,CI 里每次都从零编译。一个下午排查完才发现——问题不在 Dockerfile,在于 CI 环境和本地的三处差...
CDN缓存失效了?用一行curl快速定位
CDN缓存失效了?用一行curl快速定位 静态资源部署后用户还是看到旧版本,浏览器清缓存也没用。第一时间不是怀疑CDN,而是用curl命令确认缓存状态。但看哪个响应头、怎么看,很多人说不清楚。本...
GitHub Actions fail-fast 陷阱:我的矩阵任务被团灭始末
问题场景:12 个矩阵任务被「团灭」 用矩阵策略跑 12 个测试组合,一个组合失败了,另外 11 个正在运行的任务全部被 GitHub Actions 强制取消,白跑了 40 分钟。 这不是网络波动,是 fail-fast ...
tiktoken 四种编码器实测:中文场景最大差 108%
上周发完 token 预算告警文章后,有读者问:'用 tiktoken 统计了,但 API 还是爆了预算,为什么?'我复盘发现——不同模型用的编码器不同,同一段文字,token 数可以差 1 倍。中文场景尤其明显...
GitHub Actions 矩阵构建避坑指南:多平台多版本并行测试的 5 个真实问题
解决什么问题 GitHub Actions 的 matrix 策略让你可以用一条 workflow 跑遍 Python 3.9/3.10/3.11/3.12 四个版本 + macOS/Linux/Windows 三个系统。但真正用过的人都知道:matrix 跑起来很爽,...
上下文压缩后 RAG 检索降级的 4 种应对策略
问题:压缩后 Embedding 变了 给 RAG 对话系统加上上下文压缩(对话历史摘要化)后,向量检索缓存命中率从 60% 跌到接近 0。这不是缓存本身坏了,而是压缩改变了对话历史的向量空间:同一个问题...
Docker BuildKit 缓存失效的 5 个真实场景:GitHub Actions CI/CD 提速避坑指南
Docker BuildKit 缓存失效的 5 个真实场景:GitHub Actions CI/CD 提速避坑指南 明明什么都没改,GitHub Actions 的 Docker 镜像构建每次都从零开始。层缓存失效是 CI 慢的根因,但 BuildKit 在...
GitHub Actions 缓存失效的根因与解法:同一个 workflow 为什么时而快时而慢(临时标题)
GitHub Actions 缓存失效的根因与解法:同一个 workflow 为什么时而快时而慢 同一个 workflow,第一次跑 3 分钟,第二次跑 40 秒,第三次又回到 3 分钟。换了台机器反而更快。不是网络问题,不...
LLM Token 预算告警:让对话机器人在崩溃前悬崖勒马的完整方案
背景:上线3个月后开始答非所问 我们的客服机器人跑了3个月后,开始出现'答非所问'的问题。用户说'查一下我的订单',AI 回的是'工单编号格式如下'。日志里单会话 token 已经突破 18 万,上下文...
上下文压缩后缓存失效:RAG 系统的真实踩坑与解法
上下文压缩后缓存失效:RAG 系统的真实踩坑与解法 用 RAG(检索增强生成)跑生产系统,最怕两件事:上下文超限,和明明压缩了却没省下 token。第二个问题更隐蔽——你上了上下文压缩,LLM 输入...











