论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
虚拟化.超融合.云计算
›
虚拟化与私有云
›
云盘算实战应用案例精讲-【深度学习】多模态融合(附pyt ...
云盘算实战应用案例精讲-【深度学习】多模态融合(附python代码实现) ...
去皮卡多
论坛元老
|
2024-12-7 22:34:58
|
显示全部楼层
|
阅读模式
楼主
主题
1941
|
帖子
1941
|
积分
5823
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
目次
前言
几个高频口试标题
为什么Transformer适合做多模态使命?
为什么现在大家会转向Transformer做多模态使命?
为什么Transformer可以做图像也可以做文本,为什么它适合做一个跨模态的使命?
算法原理
什么是多模态
多模态怎样实现
多模态融合办法
a) 简单操纵融合办法
b) 基于注意力机制的融合办法
c) 基于双线性池化的融合办法
CV方向多模态融合论文
Pretraining Objectives
多模态融合方法
1.1早期融合
1.2 晚期融合
1.3 混淆融合
多模态融合架构(神经网络模型的基本结构情势)
1.1联合架构
1.2协同架构
1.3编解码架构(自监督)
自动驾驶中的多模态融合感知
多模态融合感知的配景
数据格式
融合方法
数据级融合
特征级融合
对象级融合
不对称融合
当前存在的挑战
算法拓展
多模态融合的BEV目的检测AutoAlign V1
配景介绍
AutoAlign方法
多模态融合的BEV目的检测AutoAlign V2
配景
AutoAlignV2方法
代码实现
python
前言
多模态融合Multimodal Fusion也称多源信息融合(Multi-source Information Fusion),多传感器融合(Multi-sensor Fusion)。多模态融合是指综合来自两个或多个模态的信息以举行预测的过程。在预测的过程中,单个模态通常不能包罗产生准确预测效果所需的全部有用信息,多模态融合过程结合了来自两个或多个模态的信息,实现信息增补,拓宽输入数据所包罗信息的覆盖范围,提升预测效果的精度,进步预测模型的鲁棒性。
目前已有的多模态图像融合模型很多采用自编码器结构,如下图 a。
但是这种方式有三个缺陷:
1. CNN 的表明性较差,难以控制,对跨模态特征提取不敷充实,如上图 a 前两种都是多模态输入共享编码器,因此难以提取到模态特有的特征,而第三种双分支结构则忽略了各个模态共有属性;
2. 上下文独立的 CNN 结构只能在相对小的感受野内
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
去皮卡多
论坛元老
这个人很懒什么都没写!
楼主热帖
如何基于 ZEGO SDK 实现 iOS 变声/混响 ...
民间最大社区,倒闭了!
FPGA虚拟化:突破次元壁的技术 ...
Ribbon负载均衡的深度分析和使用 ...
仿京东严选商城项目,集购物+支付+发货 ...
Java 结构化数据处理开源库 SPL ...
基于Kubernetes(k8s)部署Dubbo+Nacos服 ...
Python生成字母对后写入文件
LyScript 实现应用层钩子扫描器 ...
驱动开发:内核R3与R0内存映射拷贝 ...
标签云
渠道
国产数据库
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
IOS
物联网
快速回复
返回顶部
返回列表