【GenBI 动手实战】大模子 微调LoRA SFT 实现 Text2SQL 更好的结果 ...

打印 上一主题 下一主题

主题 895|帖子 895|积分 2685

引言
Text-to-SQL(文本转 SQL)作为 GenBI(天生式商业智能)的核心技能,旨在将天然语言查询主动转换为可实行的 SQL 语句,从而低沉数据分析门槛,赋能非技能用户。尽管预训练大语言模子(LLM)在 Text-to-SQL 使命上已展现出强盛能力,但为了在特定领域或数据集上取得更优结果,往往需要进行微调(Fine-tuning)。
本文将深入探讨怎样使用 LoRA 技能对大语言模子进行监督微调(Supervised Fine-tuning, SFT),以提升 Text-to-SQL 使命的性能。我们将详细介绍数据收集、预处理、模子微调、评估等关键步调,并提供丰富的代码示例,资助读者明白和掌握。
1. 数据收集与预处理
1.1. 数据集选择
Text-to-SQL 领域有多个公开数据集可供选择,其中最常用的包括:


  • Spider: 包罗 10,181 个问题和 5,693 个独特的复杂 SQL 查询,涵盖 200 个不同领域的数据库,是目前最常用的 Text-to-SQL 基准数据集。
  • WikiSQL: 包罗 80,654 个手工标注的天然语言问题、SQL 查询和表格

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

玛卡巴卡的卡巴卡玛

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表