论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com
»
论坛
›
软件与程序人生
›
DevOps与敏捷开发
›
garak - 开源的 LLMs 毛病扫描工具
garak - 开源的 LLMs 毛病扫描工具
鼠扑
论坛元老
|
2025-1-7 14:01:41
|
显示全部楼层
|
阅读模式
楼主
主题
1070
|
帖子
1070
|
积分
3210
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
3300
Stars
288
Forks
306
Issues
29
贡献者
Apache-2.0
License
Python
语言
代码
: https://github.com/NVIDIA/garak
主页
: https://discord.gg/uVch4puUCs
更多AI开源软件
:AI开源 - 小众AI
garak检查是否可以以我们不盼望的方式使 LLM 失败。 探测幻觉、数据走漏、及时注射、错误信息、毒性产生、越狱和许多其他弱点。假如您知道 or / Metasploit Framework,garak 的功能与它们有些相似,但实用于 LLM。garaknmapmsf
garak重点介绍使 LLM 或对话体系失败的方法。它结合了静态、动态和自顺应探针来探索这一点。
重要功能
现在支持:
Hugging Face Hub 生成模型
复制文本模型
OpenAI API 聊天和延续模型
利特尔姆
几乎所有可通过 REST 访问的内容
GGUF 模型(如 llama.cpp 版本 >= 1046
..以及更多 LLM!
安装和使用
garak是一个下令行工具。它是在 Linux 和 OSX 中开辟的。
标准安装pip
只需从 PyPI 获取它,您就可以开始了:
python -m pip install -U garak
复制代码
使用 安装开辟版本pip
的标准 pip 版本会定期更新。要从 GitHub 获取更新的版本,请尝试:garak
python -m pip install -U git+https://github.com/NVIDIA/garak.git@main
复制代码
从源克隆
garak有自己的依赖项。您可以在其自己的 Conda 环境中安装:garak
conda create --name garak "python>=3.10,<=3.12"
conda activate garak
gh repo clone NVIDIA/garak
cd garak
python -m pip install -e .
复制代码
好吧,假如一切顺利,您大概已经预备好了!
留意:假如您在迁移到 GitHub 组织之进步行了克隆,但您正在 URI 中阅读此内容,请按如下方式更新您的远程仓库:NVIDIAgithub.com/NVIDIA
git remote set-url origin https://github.com/NVIDIA/garak.git
复制代码
使用
一样平常语法为:
garak <options>
garak必要知道要扫描的模型,默认环境下,它将使用每个探测推荐的毛病检测器,尝试在该模型上知道的所有探测。您可以使用以下方法查看探针列表:
garak --list_probes
要指定生成器,请使用 和 (可选)选项。模型类型指定模型族/界面;Model Name 指定要使用的确切模型。下面的 “生成器简介” 部分介绍了一些支持的生成器。一个简单的生成器系列是 Hugging Face 模型;要加载其中一个,请在 Hub 大将 to 和 to 设置为模型的名称(比方 )。某些生成器大概必要将 API 密钥设置为环境变量,假如必要,他们会关照您。--model_type--model_name--model_typehuggingface--model_name"RWKV/rwkv-4-169m-pile"
garak默认环境下,会运行所有探测,但您也可以对此进行具体说明。 将仅使用 PromptInject 框架的方法。您还可以通过在 ;比方,将使用基于语言模型风险卡框架生成诽谤的模型的检查实现。--probes promptinject.--probes lmrc.SlurUsage
如需帮助和灵感,请在 Twitter 或 Discord 上找到我们!
例子
探测 ChatGPT 以进行基于编码的提示注入 (OSX/*nix)(将示例值更换为真实的 OpenAI API 密钥)
export OPENAI_API_KEY="sk-123XXXXXXXXXXXX"
python3 -m garak --model_type openai --model_name gpt-3.5-turbo --probes encoding
复制代码
查看 GPT2 的 Hugging Face 版本是否容易受到 DAN 11.0 的攻击
python3 -m garak --model_type huggingface --model_name gpt2 --probes dan.Dan_11_0
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
鼠扑
论坛元老
这个人很懒什么都没写!
楼主热帖
Java 基于Apache POI实现Excel读写操作 ...
Dapr 知多少 | 分布式应用运行时 ...
XAF新手入门 - 类型子系统(Types Info ...
springboot开启单元测试的方法分享 ...
记录一次NoSuchMethodError问题的解决 ...
C#生成putty格式的ppk文件(支持passph ...
5.15日 搭建青龙面板教程——狗东跑跑 ...
Python 封装SNMP调用接口
SQLSERVER大小写转换方法
风险洞察之事件总线的探索与演进 ...
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
Oracle
物联网
.Net
云原生
分布式数据库
网络安全
MES
移动端开发
虚拟化与私有云
Mysql
快速回复
返回顶部
返回列表