1. 任务定义与形式化
属性级情绪分类的目的是:
- 对文本中的目的实体(entity)及其属性(aspect)进行情绪分析。
- 其形式化定义为五元组 (e, a, s, h, t):
- e:被评价的目的实体。
- a:目的实体中的某个属性。
- s:对实体属性的情绪倾向(正、负、中立或打分)。
- h:观点持有者。
- t:发表观点的时间。
- 属性抽取(Aspect Extraction,AE):从文本中识别出所有属性。
- 属性级情绪分类(Aspect-Level Sentiment Classification, ALSC):判定每个属性的情绪倾向。
此外,另有扩展任务:
- 观点抽取(Opinion Extraction,OE):从文本中提取与属性干系的观点词。
- 三元组团结抽取:同时完成AE、OE和情绪分类。
- 属性-观点团结抽取(Pair Extraction):抽取成对的属性和观点词。
2. 方法
在属性级情绪分类中,以下方法被提到:
(1) 属性抽取(AE)
- Seq2Seq模型:采用GRU门控单元,结合位置感知的注意力机制。
- 序列标注方法:使用BIO标注体系对属性进行标注。
(2) 属性级情绪分类(ALSC)
- 基于注意力的LSTM(ATAE-LSTM):
- 在句子中针对差别属性动态调解注意力的关注点。
- 属性信息可以拼接到LSTM的输入层或隐层中。
- TC-LSTM模型:结合上下文和属性信息进行分类。
(3) 属性导向的观点抽取(AOE)
- 使用Encoder-Decoder框架。
- 结合内向LSTM和外向LSTM,获取目的和上下文的全局信息。
(4) 属性抽取+情绪分类(AESC)
- Pipeline模型:通过先抽取后分类的框架实现,基于BERT的双向编码器。
- 预测属性的开始位置和竣事位置后,直接对属性进行情绪分类。
(5) 属性观点团结抽取(Pair Extraction)
- SpanMIT模型:基于多任务学习,结合BERT/BiLSTM对可能的跨度进行罗列和监督,提取属性-观点对。
(6) 三元组团结抽取
- 基于BERT的Span模型:在一个框架中处理所有ABSA子任务(AE、OE和情绪分类),通过检测句子中各个组件的位置和种别来完成任务。
- 同一生成框架(Unified Generative Framework):基于BART模型,将所有ABSA任务同一为概率计算问题。
(7) 基于大模型的方法
- Counterfactual数据加强:生成反究竟样本(比方将“Never bad”与“positive”虚伪关联冲破)来提升模型鲁棒性。
- Instruction Tuning:通过检索示例和语言模型推理相结合进行任务优化。
3. 总结与未来方向
属性级情绪分类的未来研究方向包罗:
- 复杂属性的多元组抽取。
- 团结学习(同时抽取和分类)。
- 引入外部知识(语义、词典、常识等)。
- 表示学习(基于Transformer、图神经网络GNN等)。
这些方法和技术的目的是提升情绪分析的精度与鲁棒性,同时应对更复杂的情绪分析场景。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |