ToB企服应用市场:ToB评测及商务社交产业平台

标题: 【Text2SQL 论文】PET-SQL:用 Cross-Consistency 的 prompt 增强的两阶段 [打印本页]

作者: 熊熊出没    时间: 2024-6-9 11:59
标题: 【Text2SQL 论文】PET-SQL:用 Cross-Consistency 的 prompt 增强的两阶段
论文:PET-SQL: A Prompt-enhanced Two-stage Text-to-SQL Framework with Cross-consistency
  ⭐⭐⭐
  arXiv:2403.09732,商汤 & 北大
  Code:GitHub
  一、论文速读

论文一开始提出了以往 prompt-based 的 Text2SQL 方法的一些缺点:

由此,论文提出了 Prompt-Enhanced Two-stage text2SQL framework with cross-consistency(PET-SQL)—— 通过两个 stage 来完成任务。
二、PET-SQL

2.1 Stage 1:few-shots prompt 天生 PreSQL

这个阶段构造出一个 few-shots 的 prompt 用来输入给 LLM。
2.1.1 prompt 的表现风格

有多种指导 LLM 天生 SQL 的 prompt 表现风格。以往研究发现,Code Representation(CRp)和 OpenAI Demonstration(ODp)这两种是很不错的选择,示比方下图:

论文基于 ODp 进一步丰富了 prompt 的信息,提出了 Reference-Enchanced representation(REp)的 prompt,改动如下:

提出的 REp 示比方下:

2.1.2 增加 few-shots examples

这里从 dataset 中检索出与 user question 相似的样原来作为 ICL 的 demonstrations。
留意,这里要对被检索的 NL-SQL pairs 做去语义化:也就是把 question 中与 table schema 相关的 tokens 用 <mask> 去掉,从而得到一个只呈现题目意图的 question skeleton。然后再对这些 question skeleton 使用 embedding 做语义嵌入,从而用于检索。
检索到的 top-K 被用作 demonstrations 用于 few-shots ICL。
这样,demonstrations 和前面的 REp prompt 结构,构成了用于输入给 LLM 的 prompt:

由此,可以得到一个 LLM 天生的 preliminary SQL(PreSQL)。
2.2 Stage 2:Schema Linking 与 FinSQL 天生

这里的实现基于一个简朴的原则:PreSQL 与 question 高度相关。
因此,剖析 PreSQL 以识别此中提到的 db tables 和 columns,并用于数据库的 schema linking。
然后 schema linking 的结果被用来简化 prompt 中的 schema 信息,去除掉无关的 table 和 column 信息,如下所示:

使用这个简化后的 prompt 用来天生 FinSQL。
2.3 Cross Consistency

以往做 Text2SQL 时每每会使用 self-consistency 来修正 SQL 结果,但这有一些题目:使用 self-consistency 每每是将 LLM 的题目调高使其天生多样化,然后多次天生后投票选出最终结果。但是研究也发现,高温下的 LLM 会增加幻觉、降低性能,且对于确定性任务(如天生 SQL),单个 LLM 的多样性也不足。
以是本文提出:在较低的温度下指导多个 LLMs 天生 SQL,然后在这些 SQL 的实行结果之间投票。这也就是 Cross Consistency。
关于投票的思绪,这里提出了两种:

三、实行

在 Spider 数据集上做了测试,使用 EX 作为评估,使用的 LLM 包罗 CodeLlama、SQLCode、IternLM、SenseChat、GPT-4 等。
在 Spider 上的体现,在所有非基于学习的方法中实现了最高的 EX,比 DAIL-SQL 高出 1%。
具体的实现可以参考原论文。
四、总结

PET-SQL 的两阶段思绪还是挺好理解上,prompt 设计上重要多了 db content 样例,整个过程中,使用 question de-semanticization 来提取题目骨架表现题目意图在实现上应该是整个流程里最复杂的。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4