详细说说VIT架构和Transformer架构的异同

打印 上一主题 下一主题

主题 949|帖子 949|积分 2847

GPT-4o
Vision Transformer (ViT) 和 Transformer 架构之间的关系非常紧密,因为 ViT 是直接将 Transformer 应用到视觉任务中的一种方法。不过,由于图像数据与自然语言数据的特性不同,ViT 在实现上对标准 Transformer 架构做了一些调整。
以下是 ViTTransformer 架构的异同点详细分析:
<hr> 1. Transformer 架构的回顾

Transformer 是一种用于序列建模的架构,最初由 Vaswani 等人在论文《Attention Is All You Need》中提出,重要用于自然语言处置处罚(NLP)任务。其核心思想是通过注意力机制捕获序列中各元素之间的关系,同时摒弃了循环神经网络(RNN)中序列依赖的局限性。
Transformer 架构的关键组件


  • 输入嵌入
         
    • 将输入(如句子中的单词)  


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

雁过留声

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表