+
78
-

回答

在长上下文压缩中,裁剪与总结是两种核心策略,目标相同但路径迥异。

裁剪:直接截断文本(如保留首尾片段),优势是零计算开销、保留原文措辞,适合代码、法律条文等需字面精确的场景;

劣势是可能丢失关键信息(如答案在末尾),且无法跨片段保留语义连贯性。

总结:用新语言重述原文核心,优势是保留全局语义、压缩率高(万字→百字),适合长文档问答;

劣势是引入幻觉风险(数字/专有名词失真)、计算成本高,且丢失原始表述,不适用于需引用原文的任务。

关键差异:裁剪保“形”(字面准确),总结保“神”(语义主干)。

实践中常采用混合策略——近期上下文裁剪保细节,早期内容总结保概要,兼顾速度与语义完整性。例如聊天机器人保留最近512 token原文,将更早历史压缩为摘要。

选择依据任务需求:需精确措辞选裁剪,需全局理解选总结。

网友回复

我知道答案,我要回答