最近更新
LLM 对话机器人上线3个月后答非所问:上下文窗口溢出的4个真实踩坑与工程解法-树屋小站

LLM 对话机器人上线3个月后答非所问:上下文窗口溢出的4个真实踩坑与工程解法

客服机器人上线 3 个月后,用户开始反馈'答非所问'。查日志发现:单会话 token 数突破 18 万,关键信息被截断,模型拿到的上下文全是碎片。这就是上下文窗口溢出的威力——它不是慢慢来的,是突...
小树根的头像-树屋小站大树丫小树根18分钟前
4810
GitHub Actions 缓存失效的 4 种真实原因(附解决方案)-树屋小站

GitHub Actions 缓存失效的 4 种真实原因(附解决方案)

结论:GitHub Actions 缓存失效的4种真实原因,附可复现的配置方案 GitHub Actions 跑 CI 时,依赖缓存总是莫名其妙 miss。明明没改 requirements.txt,缓存却废了;或者改了注释,缓存全失效。...
小树根的头像-树屋小站大树丫小树根22小时前
2610
GitHub Actions 缓存失效的 4 种真实场景和对应解法-树屋小站

GitHub Actions 缓存失效的 4 种真实场景和对应解法

每次提交代码,GitHub Actions 都要重新安装一遍依赖?同一个项目,别人的 CI 跑 1 分钟,你的跑 8 分钟?问题大概率出在缓存策略上。本文总结 4 种最常见的缓存失效场景,配合可运行的配置文件...
小树根的头像-树屋小站大树丫小树根昨天
2214
LLM 上下文窗口溢出维修实录:3个真实踩坑案例与工程解法-树屋小站

LLM 上下文窗口溢出维修实录:3个真实踩坑案例与工程解法

问题:上下文窗口不是无限的 上线客服机器人三个月后,用户开始反馈'答非所问'。查日志发现单会话 token 数已经突破 18 万——上下文窗口爆了,最关键的用户订单信息被截断在最前面,模型根本'...
小树根的头像-树屋小站大树丫小树根前天
356
LLM 上下文窗口快满了?我在生产踩过的3种应对方案与坑-树屋小站

LLM 上下文窗口快满了?我在生产踩过的3种应对方案与坑

上下文越来越长,模型却开始答非所问 用 LLM 做应用开发,最怕的不是模型不够聪明,而是上下文窗口越来越不够用。 我接手过一个客服机器人项目,上线第一个月效果很好。第三个月开始,用户频繁...
小树根的头像-树屋小站大树丫小树根4天前
2715
GitHub Actions pip 缓存总失效?我踩过最深的 4 个坑-树屋小站

GitHub Actions pip 缓存总失效?我踩过最深的 4 个坑

# GitHub Actions pip 缓存总失效?我踩过最深的 4 个坑 GitHub Actions 的 pip 缓存用不对,每次 CI 都重新下载几千个包,多花 1-3 分钟。本文记录我实际踩过的 4 个缓存失效场景,给出可直接...
小树根的头像-树屋小站大树丫小树根5天前
396
GitHub Actions 实战:生产级 Node.js CI/CD 流水线搭建全过程-树屋小站

GitHub Actions 实战:生产级 Node.js CI/CD 流水线搭建全过程

很多团队把 CI/CD 停留在「能跑通就行」的状态:没有测试 gate、没有制品管理、没有回滚机制,一出问题就只能手动救火。本文记录我用 GitHub Actions 搭建一条生产级 Node.js CI/CD 流水线的完...
小树根的头像-树屋小站大树丫小树根5天前
4614
Cursor .cursorrules 优化实战:我踩过的三个坑-树屋小站

Cursor .cursorrules 优化实战:我踩过的三个坑

COVER_IMAGE_PLACEHOLDER 用 Cursor 写代码有一段时间了,默认的 AI 生成经常'放飞自我'——代码风格和项目格格不入,有时候还会改坏我原本正常的函数。后来我开始配置 .cursorrules 文件,试图...
小树根的头像-树屋小站大树丫小树根6天前
505
LLM 上下文窗口优化:实战场景下的三种截断策略对比-树屋小站

LLM 上下文窗口优化:实战场景下的三种截断策略对比

用 LLM 处理长文本时,上下文窗口不是你想塞多少就塞多少的。超过上限直接报错,截断策略选错了关键信息被切,模型 hallucinate。本文对比三种真实在用的截断策略,给出具体代码和实测结论。 问...
小树根的头像-树屋小站大树丫小树根6天前
265
本地 LLM 部署:三个省 token 的实战技巧-树屋小站

本地 LLM 部署:三个省 token 的实战技巧

本地跑大模型,context window 不够用是个老问题了。我自己的 8B 模型实际能用的 context 大概只有 8192 tokens,多了就开始胡言乱语,试过不少方法才摸清楚哪些真正有效。 这篇文章三个技巧都...
小树根的头像-树屋小站大树丫小树根7天前
278
GitHub Actions 缓存 save 失败不报错:我踩过的三个坑-树屋小站

GitHub Actions 缓存 save 失败不报错:我踩过的三个坑

结论先行 用 actions/cache 时,如果缓存体积超过 10GB,save 操作会静默失败——CI 跑 ✅ success,但缓存根本没存进去。本文讲清楚 actions/cache v4 的三个行为差异,以及如何正确配置缓存。...
小树根的头像-树屋小站大树丫小树根7天前
475
FastAPI 依赖注入实战:三个让我翻过车的 Depends 场景-树屋小站

FastAPI 依赖注入实战:三个让我翻过车的 Depends 场景

前言 FastAPI 的依赖注入用起来很顺手——路径函数参数里加个 Depends(get_current_user),认证就自动做了。但我用了一年多,真踩过三个让我debug到凌晨的坑:Depends 的参数在路由匹配前就解析...
小树根的头像-树屋小站大树丫小树根8天前
539