举世首款开源数字人模子duix.ai,全面解读!

[复制链接]
发表于 2026-2-10 09:20:09 | 显示全部楼层 |阅读模式
嗨,各人好,我是徐小夕。
近来不停在研究 AI大模子 在业务场景中的应用,刚好发现一款非常故意思的开源数字人模子——duix.ai.

   image.png  它是硅基智能打造的数字人智能交互平台。而duix-ai就是基于DUIX开源的举世首个2D真人级、AIGC及时渲染数字人模子,该项目不但提供了直观的结果展示,还支持用户举行二次开发.
项目从底层推理引擎及上层的商业化应用逻辑也都开放了代码,方便开发者可以深入相识其工作原理,并举行进一步的优化和创新。
github地点: https://github.com/GuijiAI/duix.ai
接下来我就和各人详细先容一下这款开源数字人模子.
话不多说, 先来看看模子结果:
配景先容


   image.png  硅基智能的焦点产物为AIGC数字人,是以数字孪生NLP知识图谱等AI技能构建,一比一真实还原真人形态,动作、心情、声音无穷逼近真人的硅基生命,以丰富生动的显现情势,提供涵盖各行业的服务。
硅基智能着眼于举世,专注于 AI 技能深度研发和落地应用。其目的是通过自主研发的焦点技能,致力于在 2025 年为举世输出 1 亿硅基劳动力,赋能企业数字化转型。在积聚了大量技能沉淀的底子上,为了进一步实现 “科技平权”, 便开源了 duix.ai
duix.ai 开源堆栈不但仅包罗数字人模子,对于配套的IOS/安卓的手机应用UI都已开源了, 我们可以基于它的开源代码轻松的改成本身的数字人APP.

   image.png  duix.ai 开源项目具有如下特点:


  • 摆设资本低: 无需客户提供技能团队举行共同,支持低资本快速摆设在多种终端及大屏。

  • 网络依靠小: 得当地铁、银行、政务等多种场景的假造助理自助服务。

  • 功能多样化: 可根据客户需求满意视频、媒体、客服、金融、广电等多个行业的多样化需求。

基于这个开源项目,硅基智能在苹果市肆也发布了一款名为DUIX.AI的应用。使用它可以资助我们轻松定制各种范例的数字人,接下来我们就来聊聊它能做什么。


duix.ai 能做什么(应用场景)

duix.ai 可以应用在爱情交际情绪陪伴内容创作知识学习等范畴.
实在数字人在我们的生存和工作场景中应用也非常广泛, 这里我举几个常见的案例.
1. 假造男/女友

   image.png  AI女友类的数字人现在市面上许多, 但是一样寻常都是收费的, 我们可以基于 duix.ai 实现低资本的假造男/女友应用, 让AI数字人普惠更多的人.
2. 假造交际

我们在交际场景上有许多应用范畴, 比如上面视频分享的“怼人小姐姐”. 

本人亲测, 根本吵不外~


同时如果各人想打造一款能资助本身发展的互动式交际呆板人, 比如假造锻练, 假造西席, 使用 duix.ai 也优劣常容易的下面我就来展示一下假造锻练的结果: 

3. 假造人直播带货


   image.png  现在抖音等短视频平台直播带货非常火, 如果我们有很好的视频脚本, 可以让假造人24小时资助我们直播和带货, 实现真正的“睡后收入”.
4. 克隆专家


   image.png  我们可以使用私有知识库 + 假造人打造某个行业的专家, 让假造人来面临面解答客户的咨询和标题.
5. 定制本身的数字人(最新更新)


它还支持非常故意思的个性化定制功能。之前比力火的AI复活亲人的场景,现在我们使用它, 只必要预备一个视频就可以实现。



>/ 只需一段尺度化的视频就可以恣意定制AI形象和对话场景

个性化打造专业形象IP等,各类场景无缝切换。


操纵界面也相称简单:视频+名字。


总体来说,它是一个非常酷的项目,Duix.AI 这个 APP,给我的感觉相认真实,精准同步动作、微心情、声音唇形。就算说是行业顶级真人拟真度也不为过,而毕竟也确实是如许。

焦点上风


   image.png  这里我分享一下这款开源项目的焦点上风, 供各人参考对比. 我会从两方面临比:


  • 技能亮点

  • 模子本领

在技能上它具有如下上风:


  • 全面开源:提供从底子推理到商业化应用的完备源码。
  • 机动摆设:支持Android、iOS等边沿装备,一键安装。
  • 丰富的形象模板:内置14个数字人形象模板,后续将推出更多形象。
  • 完满的SDK接口与文档:提供丰富的SDK接口和过细的开发文档支持个性化创造、自由定制
  • 超流通画面:支持50帧/秒的超流通画面,远超影戏级尺度。
  • 及时渲染本领:视频天生服从凌驾1:0.5,满意直播/及时交互需求(用于数字人直播/假造女友等应用)。
  • 真人级交互:行业顶级真人拟真度,精准同步动作、微心情、声音唇形。
  • 低算力要求:个人电脑、平板、车载体系、手机均能流通运行。
在模子对比上, 它接纳了自研的炎帝大模子, 可以看作多模态的行业脑,基于深度学习的多层神经网络布局,拥有凌驾百亿参数的多模态大模子,融合了数字人大模子、声音大模子、文本大模子、图像大模子等技能,可将明白复杂文本,高效正确地天生视频,视频中包罗数字人、声音、画面等内容元素,广泛应用知识生产(视频)、知识传播(直播)、知识创作(文娱) 等多个范畴,克隆凌驾50万数字人状师、老师、大夫、企业家、博主等,实现了AIGC产物在十多个行业数十个商业化场景的落地应用。
使用案例

现在 duix.ai 支持iosandroid 的 SDK 集成,  详细环境参数如下:

   image.png  SDK集成(1⃣以安卓为例)

  1. dependencies {
  2.     // 引用SDK项目
  3.     implementation project(":duix-sdk")
  4.     // sdk 中使用到 exoplayer 处理音频(必选)
  5.     implementation 'com.google.android.exoplayer:exoplayer:2.14.2'
  6.    
  7.     // 云端问答接口使用的SSE组件(非必选)
  8.     implementation 'com.squareup.okhttp3:okhttp-sse:4.10.0'
  9.     ...
  10. }
复制代码
权限要求, AndroidManifest.xml中, 需增长如下设置:
  1. <manifest xmlns:android="http://schemas.android.com/apk/res/android">
  2.     <uses-permission android:name="android.permission.INTERNET" />
  3.     <uses-permission android:name="android.permission.CHANGE_WIFI_STATE" />
  4.     <uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" />
  5.     <uses-permission android:name="android.permission.ACCESS_WIFI_STATE" />
  6.     <uses-permission android:name="android.permission.MODIFY_AUDIO_SETTINGS" />
  7.     <uses-permission android:name="android.permission.WAKE_LOCK" />
  8. </manifest>
复制代码
DUIX对象构建阐明:

   image.png  更详细的使用教程各人可以在 github 上查察:
https://github.com/GuijiAI/duix.ai
末了

如果各人想相识更多 duix.ai 的动态, 可以加下官方讨论群,接待交换~

接待star + 反馈~


往期精彩



  • 零代码+AI的阶段性复盘
  • 文档引擎+AI可视化打造下一代文档编辑器
  • 爆肝1000小时, Dooring零代码搭建平台3.5正式上线
  • 从零打造一款基于Nextjs+antd5.0的中配景管理体系

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

登录后关闭弹窗

登录参与点评抽奖  加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表