超强!10大开源大模子!

怀念夏天  金牌会员 | 2024-8-25 05:14:51 | 来自手机 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 871|帖子 871|积分 2613

大型语言模子(LLMs)无疑是此次AI革命的关键,它们基于Transformer架构,通过预训练大量文本数据,获得惊人的对话和任务处置处罚能力。
尽管云云,如今备受欢迎的大模子,**诸如ChatGPT和Bard,都建立在专有的闭源基础之上,**这无疑限定了它们的使用,并导致技能信息的透明度不敷。

然而,开源AI大模子(LLMs)正逐渐崭露头角,它们不但增强了数据的安全性和隐私掩护,还为用户节省了成本,减少了对外部依赖,实现了代码的透明性和模子的个性化定制。更紧张的是,开源LLMs积极支持社区的发展,推动着整个范畴的创新和发展!
在本文,我会具体介绍下,10个顶级开源LLMs大模子!
1. LLaMA 3


近期,Meta 重磅发布发布两款开源Llama 3 8B与Llama 3 70B模子,供外部开发者免费使用。Meta表现,Llama 3 8B和Llama 3 70B是如今同体量下,性能最好的开源模子。

LLaMA 无疑是开源模子的顶流,国内好多大模子都是基于它实现的! 它通过人类反馈的强化学习 (RLHF) 举行了微调。它是一种生成文本模子,可以用作谈天机器人,并且可以适应各种天然语言生成任务,包括编程任务。
从其分享的基准测试可以看出,Llama 3 400B+ 的实力几乎媲美 Claude 超大杯以及 新版 GPT-4 Turbo,固然仍有一定的差距,但足以证明其在顶尖大模子中占有一席之地。
模子下载链接:https://llama.meta.com/llama-downloads/
GitHub项目地点:https://github.com/meta-llama/llama3
2. Phi-3

Phi 是由微软 AI 研究院最新开发的一个开源「小型语言模子」,可商用,卖点是小,必要的资源少。
模子包括 Phi-3-Mini、Phi-3-Small 和 Phi-3-Medium。此中,Phi-3-Mini 最小,只有 3.8B 的参数,但在紧张的基准测试中的表现可与大型模子如 Mixtral 8x7B 和 GPT-3.5 媲美而更大的 Small 和 Medium ,在扩展的数据集的加持下就更牛逼了。

《Phi-3 技能陈诉:一个能跑在手机上的大模子》:https://arxiv.org/abs/2404.14219
链接:https://huggingface.co/microsoft(待上线)
3. BERT


BERT是早期大型语言模子的代表作,底层技能基于Transformer架构。谷歌于2017年开发并在《注意力是你所必要的一切》中介绍了它。作为测试Transformer潜力的首批实验之一,BERT在2018年开源后迅速在天然语言处置处罚任务中取得先进性能。由于其创新和开源性子,BERT成为最受欢迎的LLMs之一,有数千种开源、免费和预训练的模子用于各种用例。不可否认的是,比年来谷歌对开源大模子的态度变得较为淡漠。
链接:https://github.com/google-research/bert
所有资料 ⚡️ ,朋友们假如有必要全套 《LLM大模子入门+进阶学习资源包》,扫码获取~
   

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

怀念夏天

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表