上下文长度

什么是上下文长度？

上下文长度指模型能在对话中"记住"和处理的信息量，类似于模型的短期记忆。它使模型能理解对话历史，生成更连贯的回复。

简言之，上下文长度越长，模型回答问题时可参考的对话内容就越多。

以下内容会占用上下文空间：

当对话内容超出上下文长度限制时，系统会从最早的消息开始自动移除内容，以容纳新输入。此时你可能会看到"部分消息已被移除以适应模型上下文长度"的提示。

在模型编辑器中配置上下文长度：

考虑以下因素：

当对话超出上下文长度限制时，系统会：

这可能导致模型"忘记"早期对话中的信息，影响回答的连贯性和准确性。

如果在删除所有历史消息后，当前对话的上下文长度仍然无法满足需求，则会终止此次推理。因为当前对话的文本和系统提示词不可删除。

有关系统提示词的配置，请参考这篇文章。

合理配置上下文长度对模型性能和使用成本至关重要。请根据实际需求选择最适合的上下文长度设置。