谷歌突破!大型AI模型理解表格数据有了新方法

2024-03-12 22:59#1 标记1

本文为979字，建议阅读2分钟
人们日常工作中经常需要阅读和理解包含大量数据的表格文件。虽然大型语言模型(LLM)在自然语言理解方面取得了卓越表现,但对于表格这种结构化数据的处理能力仍显不足。谷歌AI团队研究人员提出了一种新颖的"Chain-of-Table"框架,旨在改善LLM在表格理解任务上的表现

Chain-of-Table 中表格推理过程的图示
"Chain-of-Table"的设计理念是指导LLM步步深入地通过一系列表格变换操作来推理和分析表格内容,就像人类解读表格的思路一样。具体来说，在提示中包含了问题Q、操作历史链以及最新的中间表格T这三个关键组件。例如，当被问及“哪个国家的选手在前三名完成比赛最多？”时，LLM会根据已添加国家列并筛选出前3名行的操作历史记录，以及经过变换的中间表格，来决定下一步操作，并逐步完善推理链条
“链式表格”框架巧妙地让LLM像人类解决问题那样，通过一系列原子操作，如识别相关列、基于共享内容聚合行、重排结果等，将原始表格转换为与问题更匹配的形式，并且每个迭代过程中产生的中间表格都清晰展示了推理过程，从而显著提升了模型对表格数据的理解和解释能力
研究人员解释说,与其让LLM直接对庞大的原始表格进行盲目推理,不如将复杂的表格切分成多个可管理的部分。每个中间表格使LLM能专注于当前子任务,逐步深化对表格内容的理解。同时,推理链也为模型提供了及时反馈,提高了解释性和可靠性。
实验结果显示，无论是在需要不同长度操作链的问题上，还是针对小型、中型和大型表格的基准测试（如WikiTQ、TabFact、FeTaQA），链式表格均实现了对已有基线方法的显著超越。尤其是面对超过4000个标记的大规模表格输入时，虽然性能普遍随着输入大小增加而下降，但链式表格的表现依然稳健，相较于第二优方法取得了10%以上的提升，充分验证了这一推理链机制对于处理长表格输入的有效性。

此外，链式表格的优势还体现在处理大规模表格时展现出的优雅衰减特性，即便面对操作数量增多的情况，其性能下降也相对较小，证明了此框架在复杂场景下的鲁棒性。在处理token数超过4000的大型表格时,其准确率比现有最佳模型高出10%以上

结语
Chain-of-Table为LLM处理表格数据提供了一种新的视角和框架。通过指导LLM系统化地构建推理链路并记录中间结果,能有效简化复杂表格推理过程
整体而言，链式表格通过对表格结构的充分利用，使LLM能够在表格推理中逐级细化思考过程，不仅提高了准确性和可靠性，还促进了对表格数据深度分析的能力，为LLM在表格式推理领域开辟了新的可能。
⭐星标AI寒武纪，好内容不错过⭐
用你的赞和在看告诉我～

不用做表了？👇👇