论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
人工智能
›
人工智能
›
Llama 3.1深度解析:405B、70B及8B模型的多语言与长上下 ...
Llama 3.1深度解析:405B、70B及8B模型的多语言与长上下文处理能力 ...
去皮卡多
金牌会员
|
2024-8-28 07:11:24
|
显示全部楼层
|
阅读模式
楼主
主题
690
|
帖子
690
|
积分
2070
Llama 3.1 发布了!今天我们迎来了 Llama 眷属的新成员 Llama 3.1 进入 Hugging Face 平台。我们很高兴与 Meta 互助,确保在 Hugging Face 生态系统中实现最佳集成。Hub 上现有八个开源权重模型 (3 个底子模型和 5 个微调模型)。
Llama 3.1 有三种规格: 8B 得当在消耗者级 GPU 上举行高效部署和开发,70B 得当大规模 AI 原生应用,而 405B 则适用于合成数据、大语言模型 (LLM) 作为评判者或蒸馏。这三个规格都提供底子版和指令调优版。
除了六个天生模型,Meta 还发布了两个新模型: Llama Guard 3 和 Prompt Guard。Prompt Guard 是一个小型分类器,可以检测提示注入和越狱。Llama Guard 3 是一个掩护模型,能够分类 LLM 输入和天生的内容。
此次发布的一些功能和集成包括:
Hub 上的模型
Hugging Face Transformers 和 TGI 集成
Meta Llama 3.1 405B Instruct 的 Hugging Chat 集成
使用推理端点、Google Cloud、Amazon SageMaker 和 DELL Enterprise Hub 举行推理和部署集成
FP8、AWQ 和 GPTQ 的量化,便于推理
使用
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
去皮卡多
金牌会员
这个人很懒什么都没写!
楼主热帖
民间最大社区,倒闭了!
FPGA虚拟化:突破次元壁的技术 ...
基于Kubernetes(k8s)部署Dubbo+Nacos服 ...
驱动开发:内核R3与R0内存映射拷贝 ...
【必知必会的MySQL知识】⑤DQL语言 ...
如何基于 ZEGO SDK 实现 iOS 变声/混响 ...
聊聊简单又不简单的图上多跳过滤查询 ...
Ribbon负载均衡的深度分析和使用 ...
LyScript 实现应用层钩子扫描器 ...
Git分支
标签云
挺好的
服务器
快速回复
返回顶部
返回列表