开源模型应用落地-安全合规篇-用户输入合规性检测(一) ...

打印 上一主题 下一主题

主题 1047|帖子 1047|积分 3141

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
一、前言

     在前面的“业务优化篇系列文章”的学习中,我们学会了怎样使用线程池、Redis和向量数据库等工具。如今,我们要加快学习的速度。一方面,我们会继续改进AI服务的性能瓶颈,另一方面,我们还要学习怎样进行合规操纵。
     接下来,我们将学习怎样使用开源组件来检测违禁词,使用云服务商的内容安全考核来检测内容是否合规,以及使用微调模型来检测变种违规词。
     希望各人能跟上我的步调,渐渐学习,最终取得丰硕的结果。
<hr> 二、术语

2.1、违禁词

     是指在特定情况或上下文中被禁止使用的词语或短语。这些词汇通常包含敏感、冒犯、侮辱、不雅或违法的内容,大概会引起争议、伤害他人或违反相关规定。
     违禁词的范围因文化、社会、国家和机构的差异而异。比方,在社交媒体平台或在线论坛上,违禁词大概包括种族鄙视、愤恨言论、色情、暴力、恶意攻击等内容。在法律层面,违禁词大概包括诽谤、詈骂、威胁、侵犯他人隐私或煽动暴力等。
2.2、内容安全考核

     是指对互

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

杀鸡焉用牛刀

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表