编辑:LRS
以往的情绪分类研究由于数据的限制,只能局限于六种基本的情绪分类。好消息终于来了,Google最近发布迄今为止最强情绪分类数据集GoEmotions,情绪类别提升到28种,并且每个类别标签的质量都超高!互联网文化的兴起,让NLP研究员也是压力山大,不光要搜集传统的语料,新兴的各种梗表达的微妙情绪也只能让机器学习模型直呼看不懂。
情绪的表达在社交软件上十分关键,影响着人们的交流方式和社交关系的塑造,在语言方面尤其如此,只要几个词就能表达各种各样的微妙和复杂的情感。
因此,使机器能够理解上下文和情感一直是研究界的一个长期目标,这反过来又将支持各种应用,包括情感聊天机器人、检测负面情绪的网络行为模型以及改善消费者的互动反馈。
在过去的十年里,NLP研究界已经为基于语言的情感分类提供了一些数据,大多数都是人工标注的,涵盖了多个目标领域,如新闻标题、电影字幕、甚至童话故事,但规模往往相对较小,或者只