论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
软件与程序人生
›
云原生
›
Figure AI 公司和Figure 02呆板人技术深入挖掘(呆板人 ...
Figure AI 公司和Figure 02呆板人技术深入挖掘(呆板人架构) ...
饭宝
论坛元老
|
2025-3-30 18:21:35
|
显示全部楼层
|
阅读模式
楼主
主题
1708
|
帖子
1708
|
积分
5124
系列文章目录
Figure AI 公司和Figure 02呆板人技术深入挖掘(公司先容)
1、概述
Figure-02 举行了“彻底的硬件和软件重新设计”,包括对人工智能系统、计算机视觉、电池组、电子设备、传感器和实行器的升级,接纳了总共数千个部件,数百个独特部件,在外观、一体化关节、实行器、仿生足部、机灵手、头部及全身活动范围等方面均有显著提升,有望提升人形呆板人在工业制造和仓库物流领域的运动性能与工作服从。
Figure 02的应用场景包括但不限于:
医疗全愈:辅助举措未便的患者完成一样平常使命。
教育与研究:作为研究平台推进人机交互技术。
服务行业:在旅店、机场等场景下提供导航和咨询服务。
工业自动化:在伤害或复杂环境中取代人类实行使命。
2、硬件架构
2.1、机械设计
Figure 02 整机重量70kg,身高172cm,包含约 20-40 个关节自由度,覆盖头部、手臂、腿部等主要关节。
外骨骼架构
接纳类似飞机机身的集成化外骨骼结构,由高强度外壳承担负载和压力,替代传统内部框架设计。这种设计提升了整体刚性,同时减轻重量,优化移动性能。
内部集成定制化布线系统,隐藏电源和算力线路,减少故障风险并加强封装紧实度,以满足灰尘、腐蚀、防水等特别工业现场的应用。
仿生手部系统
第四代机灵仿生手,具备16个自由度,尺寸与人类手掌相当,可实行精密抓握和操作使命。
负载能力达25公斤,黑色点阵式皮肤或集成触觉传感器,加强抓握灵敏度和环境顺应性。
关节与实行器
关键关节扭矩参数:肩关节50Nm(运动范围148°)、膝关节150Nm(135°)、髋关节150Nm(195°),支持大范围灵活运动。
2.2、感知和交互系统
视觉模块 :配备6个RGB摄像头(分布于头部、前躯干和后躯干),支持360°环境感知和深度识别,结合AI视觉语言模型(VLM)实现快速常识性推理。并没有设置激光雷达用于感知,但不知道后期迭代版本是否会增加。
语音交互:内置麦克风与扬声器,搭载OpenAI定制的语音到语音推理模型,支持自然对话交互,语音作为默认操作界面。
2.3、计算模块设计
搭载NVIDIA RTX GPU模块,机载计算与AI推理能力较前代提升3倍,支持完全自主实行现实使命。型号未知,待补充。
2.4、 模块化与扩展性
接纳可更换组件设计(如腿部、电池组),便于维护和功能升级。
外骨骼结构预留模块化接口,支持未来拓展更多应用场景
2.5、 动力与续航系统
电池组:内置2.25千瓦时定制电池组,能量密度较前代提升50%以上,支持连续工作5小时,目标实现逐日有效工作时间超20小时
3、软件架构
3.1、全身控制算法架构
Figure 01:基于OpenAI VLM模型的分层控制架构
Figure 01 是 Figure AI 公司推出的第一代人形呆板人,作为技术验证和积累的早期产物。Figure 01呆板人发布时,Figure AI公司和OpenAI公司属于合作关系,因此呆板人接纳了分层控制架构。即:
顶层基于OpenAI 练习的大型视觉语言模型(VLM),用于语音识别和交互,提供高级视觉和语言智能。根据用于语音指令和图像传感器的感知情况,举举措作规划,通报到下一级神经网络中。此中,Figure 01 的VLM模型以10Hz的频率收罗图像。
Figure 01 神经网络模型同样以10Hz的频率获取图像传感器的图像,提供快速、低级、机灵的呆板人动作规划,并以200Hz的频率输出呆板人原子级别控制指令。在图像识别和感知中,Figure 01接纳了大量呆板学习算法。
底层为全身控制器,用于实现呆板人运动、抓取等作业中,电机的协同控制,底层控制器控制频率为1000Hz。公开资料表明,Figure 01的底层控制中险些没有采取任何呆板学习算法。
Figure 01呆板人已经完成十几种不同的行走算法,能有效解决行走中全身主动自由度的协同控制,且有效制止控制和机械不匹配引发的振荡问题。
相比于其他具身呆板人的demo视频,Figure 01具有更快的指令-实行的转换速度,大概得益于200Hz的全身指令控制设计,在没有视频加速的情况下指令实行已经非常的流畅和自然。然而从视频展示中也可以看出,Figure 01呆板人全身险些没有移动,桌面上非常的简便和干净,这大概是因为该demo从数千个预练习动作经心挑取的成功率比较高的场景,并且对环境和指令要求高,因此泛化性能依旧是挑战。
Figure 02:Helix VLA软硬件分层控制架构
2025年2月20日,Figure AI公司推出了Figure 02通用类人形控制的一个视觉-语言-动作模型Helix(Vision-Language-Action Model for Generalist Humanoid Control)。Helix统一了感知、语言理解和学习控制,以降服呆板人学中多个长期存在的挑战。
在架构上,Helix接纳了类Figure 01一样的分层控制计谋,即
预练习视觉-语言-动作模型(VLA)模型实行顶层思考和规划,用于场景理解和语言理解,能够实现跨对象和情境的广泛泛化,其参数目为7B。此中,该模型对关节电机传感器、图像的采样频率为7-9Hz,指令输出频率为7~9Hz,猜测采样和输出为同步举行。
80M的Transformer解码器举行快速的动作规划,快速反应的视觉运动计谋,将 VLA模型 产生的潜在语义表现转换为 200Hz 的正确连续呆板人动作。
底层为全身控制器,用于实现呆板人运动、抓取等作业中,电机的协同控制。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
继续阅读请点击广告
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
饭宝
论坛元老
这个人很懒什么都没写!
楼主热帖
53基于java的资源博客论坛系统设计与实 ...
zotero+坚果云实现多pc端及iPad同步管 ...
Android——一个简单的记账本APP ...
天涯神贴合集500篇(2023最新) ...
需求:清空三个月前的操作日志,并生成 ...
面试官:@Configuration 和 @Component ...
Python潮流周刊#5:并发一百万个任务要 ...
nginx 常用指令配置总结
【分布式计算】学习笔记(期末复习) ...
企业级数据治理工作怎么开展?Datahub ...
标签云
国产数据库
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
数据安全
快速回复
返回顶部
返回列表