Skip to content

关于V4.3.0中更新的"新的历史上下文处理逻辑"的一点体验反馈 #439

@em9138730701-debug

Description

@em9138730701-debug

你好,我最近从 v4.1.2 升到了 v4.4.3——我看到这个改动好像是 v4.3.0 引入的——注意到一个现象,想反馈一下。也可能是我理解有误,但觉得还是值得提一嘴。

在 v4.4.3 上,我发现模型在思考模式里会花不少篇幅去解析那句"Continue from the latest state..."的提示词本身,比如理解文件结构、定位最新消息在哪。感觉多了一步跟我要问的问题没什么关系的操作。

而在 v4.1.2 上,模型基本上上来就直奔我真正的问题去了,没有这个绕路的过程。

我有点担心,这部分花在元指令上的额外开销,会不会挤占了模型本该用来处理真实问题的注意力。我知道 v4.3.0 的更新日志提到这个模板改动是为了减少幻觉,但实际用下来,v4.1.2 给我的感觉反而更"专注"一些——至少思考过程是紧紧围绕我要问的东西的。

我没有做过严格的对比测试,所以也说不好两个版本在幻觉上到底差多少。但如果减少幻觉的代价是每次都要在解析文件结构上烧掉一部分注意力,我会有点疑惑这是不是用一种损失换了另一种损失。

纯粹是个人使用感受,说得不一定对,供你参考。

Metadata

Metadata

Assignees

No one assigned

    Labels

    enhancementNew feature or request

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions