News

LLM如何公正总结议会辩论?新框架结合计算论证评估模型忠实度

LLM如何公正总结议会辩论?新框架结合计算论证评估模型忠实度

理解议会中政策如何被辩论和论证,是民主进程中一个非常核心的环节。然而,议会辩论的内容往往量大且复杂,这使得外部受众难以充分参与和理解。

与此同时,大型语言模型(LLMs)已经展现出在规模化自动摘要方面的强大能力。虽然通过摘要可以提高议会程序的可访问性,但评估这些摘要是否忠实地传达了原始的论证内容,仍然是一个巨大的挑战。现有的自动化摘要评估指标已被证明与人类对“一致性”(即摘要与源文本之间忠实度或对齐程度)的判断关联性较差。

为了解决这一痛点,一项新研究提出了一种评估议会辩论摘要的正式框架,该框架将论证结构根植于辩论中的有争议提案。这种由计算论证驱动的新颖方法,将评估重点放在了关于忠实保留用于论证或反对政策结果的推理形式属性上。

研究团队通过一项针对欧洲议会辩论及其LLM生成摘要的案例研究,成功展示了其方法的有效性。这意味着未来我们可以更准确、更客观地评估LLM在复杂政治文本摘要中的表现,确保信息传达的准确性和公正性。

↗ 阅读原文