论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com
»
论坛
›
软件与程序人生
›
DevOps与敏捷开发
›
EmotionPrompt 论文精读
EmotionPrompt 论文精读
莱莱
论坛元老
|
2024-6-22 13:02:48
|
显示全部楼层
|
阅读模式
楼主
主题
1028
|
帖子
1028
|
积分
3084
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
EmotionPrompt: Leveraging Psychology for Large Language Models Enhancement via Emotional Stimulus 论文精读
核心观点:
提出 emotionprompt 作为一种使用情绪刺激来增强大语言模型性能的方式。该方法通过在原始提示中添加情绪刺激,比方“这对我的事业非常紧张”,来引导 LLM 的行为,从而进步其在各种任务上的表现。论文中的实验结果表明,EmotionPrompt 在 ChatGPT、Vicuna-13b、Bloom 和 Flan-T5-large 等不同模型上的 8 个任务中,均取得了显著的提升,并且在零样本和少样本设置下均优于原始提示和 Zero-shot-CoT。
配景:
配景重要介绍了一些心理学的情绪研究,包括情绪智力、情绪对决议的影响、情绪调节以及相干理论(社会认同理论、社会认知理论、认知情绪调节理论)。同时,作者也回顾 LLM 的发展和应用,并指出当前 LLM 提升方法重要会合在模型侧,较少关注交互侧。
EmotionPrompt
emotionprompt 是受人类情绪刺激影响行为的启发,心理学中的三种理论(社会认同理论,社会认知理论,认知情绪调节理论)中获取灵感,筹划了针对语言模型的情感刺激提示词,并将情感刺激分为两类:
社会影响: 使用群体认同、他人意见等社会因素来调节情绪。
自尊和动机: 关注个体的自尊、自大和目的。
每种情感刺激都包含了一些心理学上的词汇和短语,比方“信赖你的本领”、“目的”、“成功”等。这些词汇和短语能够引发 LLM 的内涵动力,使其更加积极地完成任务。
实验
在 8 个指令学习任务上评估 EmotionPrompt 的结果,包括:
情感分析
句子相似度
原因选择
求和
词语上下文
以…开头
更大的动物
首字母
使用 4 个 LLM 进行实验,包括:
ChatGPT
Vicuna-13b
Bloom
T5-Large
将 EmotionPrompt 与以下基线进行比力:
原始提示: Instruction Induction 论文中筹划的提示。
Zero-shot-CoT: Kojima 等人提出的简单而有用的零样本提示工程方法。
使用 Instruction Induction 论文中的 8 个任务进行评估,每个任务包含 100 个测试样本(除了原因选择任务,包含 50 个样本)。实验结果表明,EmotionPrompt 在所有任务和模型上都取得了显著的提升,并且正确性在超过一半的任务上进步了 10% 以上;在 TruthfulQA 数据集上评估了 EmotionPrompt 对真实性和信息量的影响。结果表明,EmotionPrompt 能够显著进步 LLM 的真实性和信息量。
分析
EmotionPrompt 为什么有用:情感刺激能够增强原始提示的表示,并进步 LLM 对任务的关注程度。
积极词汇的贡献:一些积极词汇在情感刺激中饰演了更紧张的角色,比方“自大”、“确定”、“成功”和“成绩”。这些词汇能够引发 LLM 的内涵动力,使其更加积极地完成任务。
人类研究:人类研究评估了 LLM 输出的其他指标,比方清晰度、相干性、深度、结构、构造、支持证据和到场度。结果表明,EmotionPrompt 能够显著进步 LLM 输出的清晰度、深度、结构、构造、支持证据和到场度。
总结
局限性:实验范围有限,只测试了4个LLM;情感刺激的泛化性并不清晰,可能不实用于所有任务,研究职员可能需要为特定任务筹划更合适的情感刺激。
将来工作:在更多 LLM 和任务上进行实验,以验证 EmotionPrompt 的有用性;研究怎样筹划更有用的情感刺激,以提升 LLM 的性能; 探索情感刺激影响 LLM 的内涵机制,以更好地理解其工作原理;研究情感刺激在 LLM 中的应用可能带来的伦理问题,并制定相应的办理方案。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
莱莱
论坛元老
这个人很懒什么都没写!
楼主热帖
SQL的约束
HCIA-OSPF协议
mac Error: EACCES: permission denied ...
MySQL 隐式类型转换导致索引失效问题 ...
红标devcpp6.3编译器下载及配置教程 ...
你选对了超融合,可能却买错了交换机! ...
攻防世界web 难度1新手练习
MySQL实战45讲 9
每日一练 数据库linux安装
老妈问我什么是超融合,我是这么和她解 ...
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
网络安全
云原生
快速回复
返回顶部
返回列表