南七星之家 发表于 2026-2-10 12:18:06

飞天发布时候:大数据AI平台产物升级发布



7月24日,阿里云飞天发布时候产物发布会围绕阿里云大数据AI平台的新本事和新产物举行详细先容。人工智能平台PAI、云原生大数据盘算服务MaxCompute、开源大数据平台E-MapReduce、及时数仓Hologres、阿里云Elasticsearch、向量检索Milvus等产物均带来了相干发布的深度解读。
大数据AI一体化趋势解读

在AI大模子发作的期间,怎样将大数据和AI举行更好的融合是阿里云本年重点探索的课题。阿里云大数据 AI平台产物负责人徐晟带来了阿里云大数据 AI一体化趋势分享和产物矩阵解读。

徐晟以为,大数据技能的履历了从传统数仓到数据湖,再到数据湖仓一体的演变历程。建立真正的数据湖仓一体,关键在于同一数据湖存储的数据表格式以及同一数仓读写湖数据的SDK。如许,数据湖上各类数仓引擎无需自建仓内存储,整个湖仓体系中只有一份大数据(One-Copy)被数仓调用,进而到达性能与本钱的优化。别的,在数据湖上,除了表格文件,另有文本、图片、视频等各类非布局文件,在大模子训练环节也是至关告急的生产资料,通过上述One-Copy的方案,可实现AI盘算引擎对数据的机动调用,推动大数据与AI更好地融合。


https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvNDUzMjJmZmRkYzRkNjM0NzNjNTk2MmU3MTUzZmJiMTAucG5n

阿里云大数据和AI产物体系中,包罗批处理处罚、流处理处罚、及时交互式查询在内的大数据盘算引擎服务,AI训练和推理引擎服务,以及上层的大数据和AI开辟平台。在此之上,本年阿里云将推出同一的大数据和AI湖仓本事支持,实现整个体系内数据的高效盘算和流转。将来,阿里云将继续在大数据和 AI 范畴深耕,为用户带来更优质、高效的服务和体验。


https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvYzUyMjlhNGE4MDU2MWJkYTMzOTdmMTBlNGNkZTQwMzEucG5n
人工智能平台PAI升级发布

阿里云人工智能平台PAI,是一款是面向开辟者和企业的呆板学习/深度学习工程平台,底层与阿里云根本办法无缝衔接,中心层即 PAI 的产物主体提供了数据标注、模子构建、模子训练、模子摆设、推理优化在内的AI工程全链路服务,上层无缝衔接 ModelScope、ModelStudio 等各类 MaaS 平台。人工智能平台PAI在训练服务、推理服务和AIGC场景化实践三方面带来了相应的本事升级。


https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvMWNmODM2OTFkYmZjZTNhOTNlOGYwMDVmMTUxMDk2MzkucG5n

AI训练服务




[*] 发布资源配额 (Quota) 2.0,提供基于 QuotaTree 全场景的可观测和干预操纵本事,支持对训练、推理、开辟等多范例使命举行同一的资源监控和管理,并新增了节点、用户、拓扑3大模块举行多维度展示。别的,PAI 资源配额模块增长了使命、节点、POD、GPU、CPU、Mem 等100多项监控 Metrics,满足常态监控和自界说监控和告警需求。企业内部的资源使用情况,通过多维拓扑图及时清晰显现。
[*] 发布训练竞价使命 (Spot) ,提供使命级别的高可用、高性价比算力,共同PAI平台的自动容错和状态规复本事,分身性价比与稳固性。该功能实用于处于探索期的新业务,以及对时延不敏感的使命。

https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvODY0ZjE2Mzc4YWQyMzYwYmYzYmI3ZDJkMzY2YzUxMzMucG5n
AI推理服务




[*] PAI-EAS 在日本 Region 开服,PAI-EAS 累计覆盖环球16个 Region,包罗欧洲、北美、东南亚等外洋地域。
[*] PAI 异构算力集群全面升级至第8代,支持 H20、L20 等全新机型。
[*] 推出多规格抢占型实例、GPU资源共享、serverless模子服务在内一系列全新的服务模式,包管业务在线率的同时低落摆设本钱,最高可降本90%。

https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvYzMzNzcyZjNmNTU0YTc0YWI3NDJhOGY4MjdhOTEyOTIucG5n

AIGC场景化最佳实践




[*] PAI-ArtLab 是为计划专业人士打造的AIGC智能计划平台。PAI-Artlab 支持 ComfyUI 创作工具,支持用户以workflow模式举行图像或视频创作。PAI-Artlab 提供单机版和 Severless 版两种模式,开箱即用。与开源社区版本相比,PAI-Artlab 举行了针对性的推理性能优化,模子加载速率和出图速率实现2~3倍提升。别的,PAI-Artlab 还提供主子账号管理、天生内容合规等企业级本事。
云原生大数据盘算服务 MaxCompute 升级发布

MaxCompute 是面向分析的企业级 SaaS 模式云数据堆栈,以 Serverless 架构提供快速、全托管的在线数据堆栈服务,为大模子期间提供大数据AI一体化的数据根本。

https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvMDE4MTg0ZjA2NDAwMTQ1YzkzODE4YzBiMDgxNDVlNzgucG5n

分布式盘算框架 MaxFrame


MaxFrame 是阿里云自研的分布式盘算框架,支持 Python 编程接口并可直接复用 MaxCompute 盘算资源及数据接口,用户可以以更熟悉、高效、机动的方式使用 MaxCompute 的海量数据盘算资源及数据举行大规模数据处理处罚,可视化数据探索分析以及科学盘算、ML\AI 开辟工作。

https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvZTQ2MGNiOTg1N2Q2NTQ2OTIzOTAxMWVkMjJjNGVhNGQucG5n

优化非布局数据管理 Object Table


湖仓一体为大数据AI提供了自研离线近及时数据处理处罚的盘算引擎,各类数据同一管理,盘算引擎同一对接。针对一些非布局化数据或半布局化数据,MaxCompute 通过 Object Table 举行相干抽像。
Object Table 上风特点:


[*] 使用机动,以表的情势管理非布局化数据,使用高效同一,通过 SQL、Python 对作业举行修改、发布,操纵简单。
[*] 缓存加快,缓存对象列表和元信息,淘汰直接访问 OSS,基于事件表记载每次更新,实现元信息版本化。
[*] 查询优化,查询实现列裁剪、过滤条件下推,淘汰数据访问,支持按照数据对象实际切分,消除数据倾斜。
[*] 写入支持,支持数据写入本事,形成数据流闭环。
EMR Serverless 产物升级发布

E-MapReduce(以下简称:"EMR")Serverless 为企业提供开源、开放、开箱即用的全托管免运维开源大数据产物。
随着数字化历程的加快,企业对数据分析的需求越来越剧烈,然而实际操纵中通常碰面对一系列标题及寻衅,常见的标题有数据栈割裂,数据整合同一难,形成数据孤岛,分析服从低下,差别数据栈有差别的元数据和管理模子。其次是自建难,须要投入大量的本钱和资源,以及平台优化与扩展复杂,版本迭代依靠开源社区,没有专业技能团队支持。此次 EMR 产物发布了 Serverless Spark 和 Serverless StarRocks 两项新本事。

https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvZDExOGZjODdjZGNlM2M1NDIxMTdmMDRlYmYxMGMxNmEucG5n

EMR Serverless Spark 面向企业数据分析的盘算产物

阿里云 EMR Serverless Spark 版是一款云原生,专为大规模数据处理处罚和分析而计划的全托管 Serverless 产物。它为企业提供了一站式的数据平台服务,包罗使命开辟、调试、调理和运维等,极大地简化了数据处理处罚的全生命周期工作流程。


[*] 内置 Fusion 引擎,性能相较开源 Spark 提升 200%,同时内置 Celeborn,使盘算总体本钱降落 30%,大幅进步盘算服从。
[*] 实现 DATA+AI 同一管理模子,将数据处理处罚和数据分析相联合,提供 SQL Editor、Notebook、Workflow 等工具,助力用户举行数据分析和 AI 应用开辟。
[*] 具有开放与兼容的生态,100%兼容开源 Spark 编程接口,支持多种数据访问方式和湖格式。
[*] 云原生特性明显,开箱即用、按需付费、弹性伸缩,低落使用门槛和本钱。
EMR Serverless Spark 联合 Fusion Engine 和企业级 Celeborn,为企业提供了全新的数据分析体验,助力企业更高效地发掘数据代价。

https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvYTE4NjJmZDA1ZTZhNjFjYjVmZGE0NDM5N2MxYjQxYzEucG5n

EMR Serverless StarRocks 数据湖分析版发布

EMR Serverless StarRocks 数据湖分析版是一款基于 StarRocks 技能构建的企业级数据查询和分析产物,具备开箱即用、弹性扩展、监控管理、慢 SQL 诊断分析等全生命周期本事。具备开箱即用、弹性伸缩、兼容 Trino/Presto 语法格式、同一的 Catalog管理、支持 Hive 格式 Paimon/Iceberg/Hudi/Delta Lake 等多种数据湖格式、极致的湖仓分析性能等本事。
此次 EMR Serverless StarRocks 数据湖分析版发布以下功能:


[*] 弹性伸缩发布,可按需使用,低落盘算本钱。可应用在业务负载存在时间周期性厘革场景,好比AdHoc即时分析场景和ETL加工等场景。
[*] 多盘算组(Multi-Warehouse)发布,实现资源隔离、数据共享、机动扩缩容,按需弹性伸缩功能。可应用在差别范例使命资源隔离,跨部分调和分析等场景。
StarRocks 的一系列创新,将为湖仓分析范畴带来全新厘革,为用户提供更高效、可靠、便捷的服务。

https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvZjZhZjcxMjlmMWZlOTk2Y2M4OTU2MmRhY2UzZWE0NWEucG5n


及时数仓 Hologres产物发布

Hologres 是阿里云自研的一站式及时数仓引擎,支持海量数据写入、及时更新、及时分析、写入即可查,支持尺度的SQL协议,支持PB级数据多维分析和即席分析,支持高并发、低耽误的在线数据服务。与 MaxCompute、FLink、DataWorks 无缝集成。与 DLF、OSS 深度融合,提供离在线一体全栈数仓和湖仓一体的办理方案。支持丰富的开辟接口,支持对接十余种主流BI。

https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvOGUwZmNkZTNiMDgxOGNiNjc2ZGNhMzg0Y2Y5ZjM4NDkucG5n
Hologres Serverless Computing

Serverless Computing,提供大作业隔离与弹性处理处罚,并低落 20% 本钱。通过共享 Serverless 资源实行DML使命,包管大使命隔离与高可用,低完工本并提升性能。同时支持设置单条 SQL 使用 Serverless 的资源上限,支持设置使用 Serverless 资源的SQL优先级。
Hologres 2.2 版本发布

引擎本事优化



[*] TPC-H 性能测试效果相对V1.X提升 100%
[*] 向量实行引擎 HQE 本事提升,Runtime Filter 本事加强
[*] 查询优化器性能提升,SQL 在 Plan 阶段的处理处罚速率提升 40%。
及时湖仓架构升级



[*] 湖仓一体,架构升级直读 OSS 性能提升5倍以上,支持 Paimon 湖格式,支持多级缓存和谓词下推过滤。
[*] 及时离线一体,直读 MaxCompute 存储、支持百万/秒 MaxCompute 与 Hologres 之间同步数据,及更多兼容性本事提升。
新增多种高级函数,举动分析、画像分析本事全场景覆盖



[*] 新增路径分析、留存分析、漏斗分析、画像分析等多种函数,提升分析性能与服从。
[*] Hologres 相比 ClickHouse 和 Doris 等开源技能栈在各场景分析上提供了完备函数,能高效实现举动分析和画像分析,助力业务获取贸易洞察。

https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvYWY5Mzk3YmMyZTZlMDkzZGRiMmI3YjQxZGVjMDY0ZmMucG5n
阿里云Elasticsearch-AI搜索产物发布

1.Elasticsearch-AI搜索

Elasticsearch-AI 搜索拥有丰富的 AI 搜索本事,基于效果更优的 RAG 全链路模子,加强数据预处理处罚及检索加强本事,支持差别场景的业务应用。以搭建 RAG 场景为例,在数据写入时对知识库内容分析处理处罚,在线查询时举行检索加强。使用自研模子正确分析多样化企业知识库数据,切分文档并天生向量,构建索引。用户搜索查询时,通过模子明白意图,举行三路混淆检索和重排获取相干内容,补全上下文形成终极答案。完成 RAG 全链路搭建后可举行测评。

https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvM2QwOTM1NjgyM2JlMmI3MzFhYzZlOGQ1MWJjNjlmZGQucG5n
2.搜索开辟工作台

阿里云搜索开辟工作台内置数据处理处罚、查询分析、排序、效果测评、大模子等服务,联合阿里云搜索引擎及开源引擎,同步打造场景化搜索服务,一键接入 AI 语义搜索及 RAG 本事,资助企业机动搭建符合自身业务须要的搜索体系。在实际应用中,AI搜索开辟工作台可以大概兼容主流开源生态,能快捷搭建语义搜索及 RAG 链路,客户全链路效果随使用本事加强明显提升。阿里云 AI 搜索支持三路混淆检索和多路召回,联合重排模子可使正确率达 95%。

https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvZmU4ODc3NDRmNjdlODc3ZTZlNjI3OGJjNTdjZmFmZmYucG5n


向量检索服务 Milvus 版新品发布

阿里云向量检索 Milvus 版是阿里云提供的 Serverless Milvus 全托管服务,100% 兼容开源 Milvus,提供高性能、可扩展、大规模 AI 向量数据库相似性检索服务,具备开箱即用、弹性可扩展、全链路监控告警的本事,同时提供开源 Attu 的可视化工具。
阿里云向量检索 Milvus 版具有以下上风:


[*] 云原生极速向量检索服务
阿里云向量检索 Milvus 版集成了 Vector 检索库,依附其高性能、高可用性的特点,支持混淆查询,为用户提供高效且稳固的向量数据检索本事。集成贸易化内核,雷同场景下引擎性能(QPS)是开源社区版的10倍,召回率同等的情况下QPS有5倍提升,而综合思量QPS和召回率也可实现8倍的提升。同时对盘算、存储资源进一步低落,可到达至少30%的自建Milvus上云本钱缩减。


[*] 企业级运维及易用性
云上全托管的向量数据库服务,不但极大地缩减了集群维护本钱,而且开箱即用,内置设置管理、安全管理等功能,并通过云原生架构实现高性能、可扩展性,支持按需节点化伸缩本事;同时,还提供了全面可视化的监控告警链路,以确保体系稳固运行及高效运维。


[*] 兼容开源 Milvus 生态
阿里云向量检索 Milvus 版全面兼容开源 Milvus 体系,提供了 Attu 等丰富的开源管理工具,更拥有丰富且活泼的生态社区资源。
在多模态检索方面,联合 AI 推理、训练等工程平台和 Embedding 模子的本事,Milvus 可高效索引和检索差别范例的数据,支持快速精准地跨媒体范例举行信息检索,并提供强盛的扩展性和机动的接口。
智能问答&大模子中,Milvus 联合大型语言模子实现智能问答体系,通过向量化处理处罚用户查询,使用其高效检索功能快速匹配“私有知识库”中的信息,并联合大模子,天生正确回应,提供即时、正确、交互式的天生式搜索服务。

https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9ibG9nX21pZ3JhdGUvNzhkZTVlYjE1NTdlZmQzZGE5YTA4Y2E3Mzc3Y2U0MTEucG5n

相识更多飞天发布内容:飞天发布时候20240724


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金
页: [1]
查看完整版本: 飞天发布时候:大数据AI平台产物升级发布