2020级博士宋瑞论文被中科院一区Information Processing & Management（IPM）接收-数艺网

资讯: 展览资讯大型展会灯光节大型盛典赛事中标捷报产品快讯热门话题艺术节活动演出新闻数艺报道俱乐部签约

观点: 大咖专访观点洞察书籍推荐吐槽设计观点企业访谈问答趋势创新论文职场方法薪资报价数艺专访

幕后: 幕后故事团队访谈经验分享解密评测数艺访谈

干货: 设计方案策划方案素材资源教程文案资源 PPT下载入门宝典作品合集产品手册电子书项目对接

2020级博士宋瑞论文被中科院一区Information Processing & Management（IPM）接收: 原创 2023-01-18

徐昊教授和Fausto Giunchiglia教授联合指导的2020级博士研究生宋瑞同学的论文Measuring and Mitigating Language Model Biases in Abusive Language Detection 近日被 Information Processing & Management（IPM）杂志接收。Information Processing & Management是Elsevier出版社旗下的中科院一区TOP期刊（CCF-B），SCI IF（2022）= 7.466。

宋瑞本科就读于吉林大学软件学院，2018年保送到计算机科学与技术学院，进入徐昊老师HAI（Human-Centered AI）实验室读研，2020年于人工智能学院攻读博士学位。

本篇论文的通讯作者为徐昊教授，其他作者包括Fausto Giunchiglia院士，人工智能学院的博士研究生石立达同学等。

文章详情

论文题目：

Measuring and Mitigating Language Model Biases in Abusive Language Detection

第一作者：宋瑞

指导教师：徐昊、Fausto Giunchiglia

收录期刊：Information Processing & Management

期刊类别：中科院一区，CCF-B

论文概述：

随着大规模预训练语言模型的兴起，基于预训练语言模型的分类逐渐成为辱骂语言自动检测的范式。然而，语言模型中固有的刻板印象对辱骂语言检测的影响仍然未知，尽管这可能进一步加强对少数弱势群体（妇女、儿童、移民等）的偏见，导致模型对包含上述群体的样本做出错误决策。为此，在本文中，我们使用多个指标来衡量语言模型中偏见的存在，并分析这些固有偏见对自动辱骂语言检测的影响。在此定量分析的基础上，我们提出了令牌去偏和句子去偏两种不同的去偏策略，在不降低分类性能的前提下，降低语言模型在辱骂语言检测中的偏见。具体来说，对于令牌去偏策略，我们通过随机概率估计来减少语言模型对特定群体的受保护属性词的依赖。在句子去偏策略中，我们利用反事实替换获得去偏样本，并利用原始数据与增强样本之间的一致性正则化消除语言模型句子层面的偏差。实验结果证实，我们的方法不仅可以降低语言模型在辱骂语言检测任务中的偏差，而且可以有效地提高辱骂语言检测的性能。

吉林大学｜人工智能学院

吉林省长春市｜吉林大学中心校区

正新楼｜7F

阅读原文 * 文章为作者独立观点，不代表数艺网立场转载须知: 本内容由数艺网主动采集收录，信息来源为 “吉林大学人工智能学院” 公开网络发布内容。第三方如需转载本内容，必须完整标注原作者信息及 “来源：数艺网”，严禁擅自篡改、删减或未标注来源转载。并附上本页链接：若您的内容不希望被数艺网收录，或认为此举侵犯了您的合法权益，敬请通过微信 ID：d-arts-cn 联系数艺网。我们将致以诚挚歉意，并第一时间为您办理下架或删除处理。

数字媒体艺术论文

19382