你们习惯将上下文长度控制在多少以内？ ...

我会想办法控制在 100k 以内，我不信所谓的 1m 长上下文，因为就我个人经验，150k 以上大模型就有概率出现幻觉，出现死循环，一旦出现又没人盯着，就导致浪费大量 token 和时间。
我询问了下 Claude ，回答是两个方面的因素。首先是 transformer 本身并不完美，上下文越长它的注意力就越涣散，最后会对重要的内容视而不见；其次是训练过程本身就鼓励大模型作出一副埋头苦干停不下来的样子，这使得大模型像极了在老板面前极力展现自驱力的员工，有时候甚至给我一种“它是不是也背了房贷要还”的感觉。
根据上面的了解，我觉得如果注意力机制不改进，那么将来很长一段时间可能都只能依赖 agent 工具的 harness 技巧来维持会话了。这些技巧我个人总结主要是三方面：
第一是控制思维链，例如 karpathy 指南，第二是控制记忆，例如及时清理读过不需要了的文件内容，第三是控制输出，例如要求输出文言文。最近发布的一些大模型都强调自己如何能胜任长时间任务，但我个人觉得，能不能运行长任务，agent 工具比大模型本身更重要。

你们习惯将上下文长度控制在多少以内？

热门主题

你们都没注意吗？？？？？？

看来抖音做炒美股的主播真的不能做，我看一

好奇火山方舟的 Coding Plan 风评为什么这

cwMarkdown - 原生 MacOS Markdown Viewer

一种船新的刷 V2EX 的方式

你们习惯将上下文长度控制在多少以内？

我想做一个影视站，如何寻找广告商挂广告，

vibe coding 了一个 cli 版本的阿里云 ecs

做了一个能高质量翻译扫描 pdf 的产品

[Maker Hub]: Vibe coding 了一个“收录 Vi

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

你们习惯将上下文长度控制在多少以内？

热门主题

你们都没注意吗？？？？？？

看来抖音做炒美股的主播真的不能做，我看一

好奇火山方舟的 Coding Plan 风评为什么这

cwMarkdown - 原生 MacOS Markdown Viewer

一种船新的刷 V2EX 的方式

你们习惯将上下文长度控制在多少以内？

我想做一个影视站，如何寻找广告商挂广告，

vibe coding 了一个 cli 版本的阿里云 ecs

做了一个能高质量翻译扫描 pdf 的产品

[Maker Hub]: Vibe coding 了一个“收录 Vi

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

在 Yoo趣儿投放广告