删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于BERT的民生问题文本分类模型——以浙江省政务热线数据为例

本站小编 Free考研考试/2023-11-25

基于BERT的民生问题文本分类模型——以浙江省政务热线数据为例

孔祥夫1,2,?, 董波1, 徐可2,3, 陶永亮1
1. 之江实验室, 人工智能社会治理研究中心, 杭州 3111212. 北京大学深圳研究生院, 城市规划与设计学院, 深圳 5180553. 浙江省发展规划研究院, 城镇发展研究所, 杭州 310030
收稿日期:2022-05-17修回日期:2022-06-23出版日期:2023-05-20发布日期:2023-05-20
通讯作者:孔祥夫, E-mail: 1601111702(at)pku.edu.cn

基金资助:浙江省软科学研究计划重点项目(2021C25021)资助

Text Classification Model for Livelihood Issues Based on BERT:A Study Based on Hotline Compliant Data of Zhejiang Province

KONG Xiangfu1,2,?, DONG Bo1, XU Ke2,3, TAO Yongliang1
1. Research Center for AI Social Governance, Zhejiang Lab, Hangzhou 3111212. School of Urban Planning and Design, Peking University Shenzhen Graduate School, Shenzhen 5180553. Institute of Urban and Rural Development, Zhejiang Development and Planning Institute, Hangzhou 310030
Received:2022-05-17Revised:2022-06-23Online:2023-05-20Published:2023-05-20
Contact:KONG Xiangfu, E-mail: 1601111702(at)pku.edu.cn






摘要/Abstract


摘要: 基于2017—2021年浙江省12345政务热线数据, 从居民视角构建细粒度的民生问题三级分类体系, 并利用BERT预训练模型来构建文本分类模型, 将居民诉求文本转化为民生问题标签。研究结果表明, 在政务热线数据中加入30%的人工生成诉求样本, 可以使模型的分类准确率提升约10个百分点, 准确率最高可达84.59%。对浙江省各类民生问题占比的分析结果表明, 环境保护、违规经营和市政服务等诉求的比例呈现下降趋势, 而公共服务、交通问题、购房问题和新兴消费模式的诉求比例呈上升趋势。研究结果有助于加强政府对于民情民意的了解, 提升数据驱动的社会治理能力。

引用本文



孔祥夫, 董波, 徐可, 陶永亮. 基于BERT的民生问题文本分类模型——以浙江省政务热线数据为例[J]. 北京大学学报自然科学版, 2023, 59(3): 456-466.
KONG Xiangfu, DONG Bo, XU Ke, TAO Yongliang. Text Classification Model for Livelihood Issues Based on BERT:A Study Based on Hotline Compliant Data of Zhejiang Province[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(3): 456-466.





PDF全文下载地址:

http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3870
相关话题/

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19