本文为979字,建议阅读2分钟
人们日常工作中经常需要阅读和理解包含大量数据的表格文件。虽然大型语言模型(LLM)在自然语言理解方面取得了卓越表现,但对于表格这种结构化数据的处理能力仍显不足。谷歌AI团队研究人员提出了一种新颖的"Chain-of-Table"框架,旨在改善LLM在表格理解任务上的表现
Chain-of-Table 中表格推理过程的图示
"Chain-of-Table"的设计理念是指导LLM步步深入地通过一系列表格变换操作来推理和分析表格内容,就像人类解读表格的思路一样。具体来说,在提示中包含了问题Q、操作历史链以及最新的中间表格T这三个关键组件。例如,当被问及“哪个国家的选手在前三名完成比赛最多?”时,LLM会根据已添加国家列并筛选出前3名行的操作历史记录,以及经过变换的中间表格,来决定下一步操作,并逐步完善推理链条
“链式表格”框架巧妙地让LLM像人类解决问题那样,通过一系列原子操作,如识别相关列、基于共享内容聚合行、重排结果等,将原始表格转换为与问题更匹配的形式,并且每个迭代过程中产生的中间表格都清晰展示了推理过程,从而显著提升了模型对表格数据的理解和解释能力
研究人员解释说,与其让LLM直接对庞大的原始表格进行盲目推理,不如将复杂的表格切分成多个可管理的部分。每个中间表格使LLM能专注于当前子任务,逐步深化对表格内容的理解。同时,推理链也为模型提供了及时反馈,提高了解释性和可靠性。
实验结果显示,无论是在需要不同长度操作链的问题上,还是针对小型、中型和大型表格的基准测试(如WikiTQ、TabFact、FeTaQA),链式表格均实现了对已有基线方法的显著超越。尤其是面对超过4000个标记的大规模表格输入时,虽然性能普遍随着输入大小增加而下降,但链式表格的表现依然稳健,相较于第二优方法取得了10%以上的提升,充分验证了这一推理链机制对于处理长表格输入的有效性。
此外,链式表格的优势还体现在处理大规模表格时展现出的优雅衰减特性,即便面对操作数量增多的情况,其性能下降也相对较小,证明了此框架在复杂场景下的鲁棒性。在处理token数超过4000的大型表格时,其准确率比现有最佳模型高出10%以上
结语
Chain-of-Table为LLM处理表格数据提供了一种新的视角和框架。通过指导LLM系统化地构建推理链路并记录中间结果,能有效简化复杂表格推理过程
整体而言,链式表格通过对表格结构的充分利用,使LLM能够在表格推理中逐级细化思考过程,不仅提高了准确性和可靠性,还促进了对表格数据深度分析的能力,为LLM在表格式推理领域开辟了新的可能。
⭐星标AI寒武纪,好内容不错过⭐
用你的赞和在看告诉我~
不用做表了?👇👇