论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
数据库
›
Oracle
›
YashanDB演讲实录|别彬彬:金融科技对智能化创新系统的 ...
YashanDB演讲实录|别彬彬:金融科技对智能化创新系统的机遇与路径 ...
大连全瓷种植牙齿制作中心
论坛元老
|
2024-12-11 10:50:41
|
显示全部楼层
|
阅读模式
楼主
主题
1399
|
帖子
1399
|
积分
4212
本文为“2024国产数据库创新生态大会”深算院采石矶、钓鱼城系统技术总监别彬彬的演讲实录分享,主题为
《金融科技对智能化创新系统的机遇与路径》
,欢迎阅读。
各位向导、嘉宾,下午好!非常荣幸今天能与大家一同探讨金融科技创新的话题。
智能化系统新范式:AI+ = 机器学习 + 逻辑规则
分享之前,我想先和大家讨论一个有趣的问题:成吉思汗和发现万有引力定律的牛顿之间有什么关系?这个问题我曾问过专业学者和大型语言模型,包括ChatGPT,得到的回答都是:二者都是影响人类历史的伟人。然而,它们之间的现实关系却并未展现出来。
我们信任这个天下上人、事、物总有着千丝万缕的关系,基于这种好奇心,我们试着用一些新方法、新技术寻找答案。通过图关联技术结合逻辑推理,我们发现成吉思汗对欧洲的征战导致物资交换频繁,引发鼠疫传播,进而引发伦敦瘟疫大发作,这使得牛顿被迫脱离剑桥大学,回到乡间度过了高产的两年,并在此期间发现了万有引力定律、微积分原理等重要理论。这样深层次的关系,专家做不到,千亿参数模型做不到,但可以被图关联分析展现出来。
在深算院,我们主要有三大核心产品:
崖山数据库系统、采石矶数据质量系统,以及钓鱼城数据分析系统
。今天我想着重先容后两者。
采石矶:自动数据质量冲突发现与可信修复
数据质量问题不停是困扰数据工作者的难题。OpenAI为了训练ChatGPT,花费了长达七年时间准备语料,而仅花费了一个月训练模型,这充分说明白数据质量的重要性,数据质量也是公认的大数据最难问题。樊文飞院士早年在贝尔实行室就不停研究数据质量的修复问题,随后提出了
大数据质量保证模型——REE理论,能够自动化地发现数据中的错误并举行可信修复
。采石矶系统可以完成两项重要任务:一是自动发现数据中的错误,二是根据发现的错误举行可信的修复。基于这些能力,采石矶系统在一些关键领域做出了很显著的成果。
首先是
数据毗连领域
,在与国内最大的物流集团公司的合作中,该物流公司希望对17万张数据表举行主题归整。人工方式举行了两年时间,且只能完成10%的进度。而采石矶系统在短短四天内就完成了这一任务,梳理了17万张数据表与三张主数据结构表之间的关系。
其次是
数据要素领域
,采石矶系统目前已在上海数据交易所上线,负责买卖双方的数据质量评估和提升。上海数据交易所目前是国内最大的、最乐成的数据交易机构之一,采石矶系统通过快速发现数据中的错误,资助客户增加数据资产的价值。我们不仅能发现错误,还能举行数据质量提升,实现数据资产价值进一步提升。
最后,在
大模型语料准备领域
,采石矶系统也有重要的应用,主要表现在三个方面:一是非结构化数据的解析与提取。大语言模型的训练需要大量HTML或文本数据,这些数据通常是非结构化的,需要举行解析提取,占据了数据准备工作量的40%。二是人机协同标注,据最新的实行结果,采石矶系统在辅助标注方面的准确率超过了美国独角兽企业Scale.AI。三是文本数据中的事实性错误发现,采石矶系统可以发现并修复文本语料中的事实性错误,减缓大模型在训练过程中产生“幻觉”。
钓鱼城:逻辑与统计结合的工业数据决策系统
钓鱼城数据分析系统通过将逻辑推理与机器学习相结合,在图数据结构上实现统一推理。
其核心理论GAR创新性地将机器学习推测结果和逻辑推断实现统一框架
,一方面,我们将机器学习的结果放在X中,可提高数据决策的准确性,另一方面,将机器学习的结果放在Y中可以实现对黑盒模型的可解释。在工业应用场景中,钓鱼城系统还展现出自动化水平高的优势,对比机器学习,其建模过程中需要大量的人工操作,如人工洗数据、人工特征工程、模型调参,这些工作非常依赖程序员的主观能动性,但钓鱼城系统的自动规则发现则使整个分析过程高度自动化。
钓鱼城系统已在两个主要的行业做了应用。首先是
制造业
,例如电池制造、化工、烟叶配方设计等,逻辑推理的可解释性使得钓鱼城系统能够辅助工业决策。特别是在锂电池生产过程中的化成分容环节,
钓鱼城系统已经在国内头部电池厂上线并跑,乐成处理了600万支电芯的容量推测
。逻辑推理方法的引入使得系统在面临复杂决策时具有更高的可解释性和可靠性。
其次是
银行金融领域,钓鱼城系统资助银行在商机与危急辨认方面取得了显著成果
。我们将银行的数据分析分为“商机”和“危急”两大类。商机方面,我们在零售营销、智能推送、投流拉新等环节取得了突破,系统的现实应用中将ROI从1.7提升到4.8。风险控制方面,我们与大型银行和消耗金融机构合作,在反敲诈和高危群体辨认等方面,将风险人群的辨认准确率从40%提升到71%。
未来,钓鱼城系统将致力于在银行领域构建企业级的新型数据谋划平台,依托樊院士的核心理论,将机器学习与逻辑规则结合,利用增量图盘算技术,形成“圈链群”思绪,为银行的商机和危急管理提供一站式服务,真正实现业务职员在系统上的自主操作,无需IT职员加入。
最后,我们希望通过钓鱼城、采石矶这两个底子软件平台实现真正的AI+,
只有高质量的数据与先进的智能系统相结合,才能从数据中发掘出深层次的价值
。谢谢大家!
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
正序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
发新帖
回复
大连全瓷种植牙齿制作中心
论坛元老
这个人很懒什么都没写!
楼主热帖
初识C语言
记一次 .NET 某汽贸店 CPU 爆高分析 ...
浅入浅出 1.7和1.8的 HashMap
Net core中使用System.Drawing对上传的 ...
业务安全发展的三个阶段
前后端分离项目(八):后端报错Field ...
java学习第二天
计算数学算式的值
Docker三种自定义网络(bridge、macvla ...
7.1 实现进程内存块枚举
标签云
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
人工智能
分布式数据库
快速回复
返回顶部
返回列表