最近更新
GitHub Actions 缓存失效的根因与解法:同一个 workflow 为什么时而快时而慢(临时标题)-树屋小站

GitHub Actions 缓存失效的根因与解法:同一个 workflow 为什么时而快时而慢(临时标题)

GitHub Actions 缓存失效的根因与解法:同一个 workflow 为什么时而快时而慢 同一个 workflow,第一次跑 3 分钟,第二次跑 40 秒,第三次又回到 3 分钟。换了台机器反而更快。不是网络问题,不...
小树根的头像-树屋小站大树丫小树根19小时前
3914
LLM Token 预算告警:让对话机器人在崩溃前悬崖勒马的完整方案-树屋小站

LLM Token 预算告警:让对话机器人在崩溃前悬崖勒马的完整方案

背景:上线3个月后开始答非所问 我们的客服机器人跑了3个月后,开始出现'答非所问'的问题。用户说'查一下我的订单',AI 回的是'工单编号格式如下'。日志里单会话 token 已经突破 18 万,上下文...
小树根的头像-树屋小站大树丫小树根昨天
3813
上下文压缩后缓存失效:RAG 系统的真实踩坑与解法-树屋小站

上下文压缩后缓存失效:RAG 系统的真实踩坑与解法

上下文压缩后缓存失效:RAG 系统的真实踩坑与解法 用 RAG(检索增强生成)跑生产系统,最怕两件事:上下文超限,和明明压缩了却没省下 token。第二个问题更隐蔽——你上了上下文压缩,LLM 输入...
小树根的头像-树屋小站大树丫小树根前天
228
GitHub Actions cron + 矩阵策略:定时触发多版本测试完整方案-树屋小站

GitHub Actions cron + 矩阵策略:定时触发多版本测试完整方案

解决什么问题 每天凌晨自动跑「Python 3.10 / 3.11 / 3.12 × Ubuntu / Windows / macOS」共 9 个组合的测试,或者每周一检查依赖有没有安全更新。GitHub Actions schedule 触发器配合矩阵策略...
小树根的头像-树屋小站大树丫小树根3天前
3312
HyDE实战:RAG召回率从0.42到0.78的完整记录-树屋小站

HyDE实战:RAG召回率从0.42到0.78的完整记录

解决什么问题 RAG 问答系统里,模型够强但检索层召回率太低——向量检索拿不到正确答案的上下文,模型 hallucinate。客服场景下'工单'vs'订单'语义相似度仅 0.05,直接检索返回错误段落。HyDE(...
小树根的头像-树屋小站大树丫小树根4天前
256
GitHub Actions 缓存失效的隐藏战场:restore-keys 与跨 runner 路径陷阱-树屋小站

GitHub Actions 缓存失效的隐藏战场:restore-keys 与跨 runner 路径陷阱

场景 每次 Push 都重新安装依赖,CI 运行时间从 40 秒飙到 4 分钟。`actions/cache` 配了、`restore-keys` 也有,但缓存依然每次都重新下载。 这不是幻觉。`actions/cache` 有两个陷阱,即使读...
小树根的头像-树屋小站大树丫小树根5天前
365
LLM 对话机器人上线3个月后答非所问:上下文窗口溢出的4个真实踩坑与工程解法-树屋小站

LLM 对话机器人上线3个月后答非所问:上下文窗口溢出的4个真实踩坑与工程解法

客服机器人上线 3 个月后,用户开始反馈'答非所问'。查日志发现:单会话 token 数突破 18 万,关键信息被截断,模型拿到的上下文全是碎片。这就是上下文窗口溢出的威力——它不是慢慢来的,是突...
小树根的头像-树屋小站大树丫小树根6天前
5510
GitHub Actions 缓存失效的 4 种真实原因(附解决方案)-树屋小站

GitHub Actions 缓存失效的 4 种真实原因(附解决方案)

结论:GitHub Actions 缓存失效的4种真实原因,附可复现的配置方案 GitHub Actions 跑 CI 时,依赖缓存总是莫名其妙 miss。明明没改 requirements.txt,缓存却废了;或者改了注释,缓存全失效。...
小树根的头像-树屋小站大树丫小树根7天前
2910
GitHub Actions 缓存失效的 4 种真实场景和对应解法-树屋小站

GitHub Actions 缓存失效的 4 种真实场景和对应解法

每次提交代码,GitHub Actions 都要重新安装一遍依赖?同一个项目,别人的 CI 跑 1 分钟,你的跑 8 分钟?问题大概率出在缓存策略上。本文总结 4 种最常见的缓存失效场景,配合可运行的配置文件...
小树根的头像-树屋小站大树丫小树根8天前
2514
LLM 上下文窗口溢出维修实录:3个真实踩坑案例与工程解法-树屋小站

LLM 上下文窗口溢出维修实录:3个真实踩坑案例与工程解法

问题:上下文窗口不是无限的 上线客服机器人三个月后,用户开始反馈'答非所问'。查日志发现单会话 token 数已经突破 18 万——上下文窗口爆了,最关键的用户订单信息被截断在最前面,模型根本'...
小树根的头像-树屋小站大树丫小树根9天前
366
LLM 上下文窗口快满了?我在生产踩过的3种应对方案与坑-树屋小站

LLM 上下文窗口快满了?我在生产踩过的3种应对方案与坑

上下文越来越长,模型却开始答非所问 用 LLM 做应用开发,最怕的不是模型不够聪明,而是上下文窗口越来越不够用。 我接手过一个客服机器人项目,上线第一个月效果很好。第三个月开始,用户频繁...
小树根的头像-树屋小站大树丫小树根10天前
3215
GitHub Actions pip 缓存总失效?我踩过最深的 4 个坑-树屋小站

GitHub Actions pip 缓存总失效?我踩过最深的 4 个坑

# GitHub Actions pip 缓存总失效?我踩过最深的 4 个坑 GitHub Actions 的 pip 缓存用不对,每次 CI 都重新下载几千个包,多花 1-3 分钟。本文记录我实际踩过的 4 个缓存失效场景,给出可直接...
小树根的头像-树屋小站大树丫小树根11天前
396