咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习的互联网金融投诉文本分类研究 收藏
基于深度学习的互联网金融投诉文本分类研究

基于深度学习的互联网金融投诉文本分类研究

作     者:王建梅 

作者单位:上海财经大学 

学位级别:硕士

导师姓名:郝晓玲

授予年度:2022年

学科分类:12[管理学] 02[经济学] 0202[经济学-应用经济学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 020204[经济学-金融学(含∶保险学)] 081203[工学-计算机应用技术] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:互联网金融 投诉 文本挖掘 深度学习 

摘      要:2013年后,互联网金融在我国风起云涌,总体发展态势是趋好的,但是也存在诸多问题。对于监管机构而言:法律约束的不完善、互联网金融产品交易结构的复杂性和多样性、深入了解行业的途径少、监管机构工作人员有限等等,这些都导致互联网金融监管难度大。虽然政府及时干预和加强防范化解金融风险,发布多项政策约束互联网金融各主体的规范经营,但是互联网环境下变化快、场景多,部分机构仍在非法营运,钻监管的空子。因此,本文思考借助公开的客户投诉数据进行分析,给监管机构提供更多管控的依据,也可以让企业自查自纠,更好的规范经营。本文使用Python技术爬取互联网投诉平台“聚投诉11268条、“黑猫投诉中15家互金平台的28055条数据。获取数据后,首先基于投诉问题类型维度对聚投诉数据词频分析,黑猫投诉基于不同互金平台维度词频分析,以及分析聚投诉数据中的媒介来源;然后,使用开源Pytorch框架构建三个经典深度学习文本分类模型Text CNN、LSTM、Fast Text;接着,通过100次循环训练模型(其中LSTM循环50次),调整不同超参,经过多组比对实验,找到最优分类器,同时分析各模型对于每个分类问题标签的性能;最后,人工随机挑选黑猫投诉200条投诉数据并打标问题类型,将聚投诉数据分类性能最好的模型LSTM应用到此打标数据。结果发现:(1)聚投诉的问题类型中,多数和互联网金融有关,其中暴力催收、电话骚扰、违规使用客户信息占比较大。黑猫投诉中借款支付服务费、逾期电话催收这两类问题尤为突出。对于App的投诉超过一半。(2)使用深度学习的三个模型Text CNN、LSTM、Fast Text,最优F1值分别为71.96%,84.93%,76.25%,其中LSTM最优时模型为单向,双层,隐藏层节点设置为100。执行效率从快到慢依次是:Fast Text、Text CNN、LSTM。LSTM对于金融诈骗类、骚扰信息类、色情赌博类预测效果较好,F1值均在75%以上,侵害个人信息类F1值稍低57.59%。这三个模型违禁品买卖类均无法预测。使用最优分类模型在黑猫数据上发现准确率达到84.5%,说明这个分类器基本可以应用于互联网金融投诉问题分类。LSTM模型可以更高效精准的对互联网金融投诉文本进行分类。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分