信息管理论文栏目提供最新信息管理论文格式、信息管理硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于深度学习的互联网金融投诉文本分类探讨

日期:2023年06月26日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:362
论文价格:150元/篇 论文编号:lw202306141520088522 论文字数:35222 所属栏目:信息管理论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇信息管理论文,本文的研究数据集中于两个互联网投诉平台,未来使用这个模型数据来源可以寻找更多的渠道比如平媒、门户网站、新闻媒体、行业网站、BBS、新闻App、微博、微信公众号、广播电视、音频、短视频、自媒体等渠道覆盖能力;

第一章 引言

第一节 研究背景

近年来,互联网金融得到大力发展,同时伴随着云计算、OCR、技术不断的推陈出新,互联网金融进一步融入到我们的生活,互联网金融正在重建我们的生活方式,比如大家出门只要带上手机就可以购买物品;年轻人不再把钱存入银行,而直接在互联网理财渠道投资;投资理财更方便了,投资者选择更多了。提供与互联网金融相关服务的平台通常称为互联网金融平台(以下简称“互金平台”)。虽然人们的生活被互联网金融的发展和广泛普及所改变,但问题也随之而来,由此也产生了很多的互联网金融乱象,归纳总结主要分为点对点借贷互金平台融资问题、线上交易的一些特殊商品(各类虚拟币)、诈骗、互联网安全问题与信息泄露等。虽然2010到2011年期间点对点借贷的互金平台在我国开展情况良好,发生风险事件的互金平台不超过十个,但在短短几年后的2017年是点对点借贷的互金平台聚集爆发风险事件的一个高峰期。在整个发展过程中也一直被人诟病打着高收益的幌子进行诈骗、提前收回本金需要支付高额违约金、校园贷等多个乱象问题。在2017年7月24日,中共中央政治局会议上首次提出“要深入扎实整治金融乱象,加强金融监管协调,提高金融服务实体经济的效率和水平”。由此可以看出政府对互联网金融发展的重视程度和整治乱象的决心。监管部门出台各项政策弥补监管漏洞。2019年1月负责互联网金融风险专项整治的政府部门发布《关于做好网贷机构分类处置和风险防范工作的意见》(即“175号文”)。在这个意见中表达了政府态度:非持牌网贷机构退出是行业的大方向,政府会加快这类互金平台的整治和退出,并在退出的过程给予建议。互联网新技术给特殊商品提供快速交易渠道,以赌博交易为例,骗取赌博者资金;还比如黄金交易,互金平台赚取佣金,但实际违法的互金平台,会经常出现卡顿,出金失败等情况;虚拟交易更是屡见不鲜。这种特殊商品交易不合法的情况直接造成交易者资金损失,更恶劣的情况诈骗行为导致交易者倾家荡产,家庭破碎,严重影响我国社会和经济的和谐发展。互金平台信息泄露问题,导致人们成为“无隐私”的用户,因为互联网这种线上化流程,需要用户提交很多个人以及家庭详细资料,不合规的互金平台利用收的资料,公开贩售个人隐私,导致用户收到各类垃圾短信和邮件,给用户的信息、财产安全和用户空间隐私权造成了严重侵害,信息安全问题愈演愈烈。种种乱象对人们的生活带来影响。

信息管理论文怎么写

第二节 研究目的与意义

一、研究目的

我国部分互金平台的服务的不完善,引发客户向互联网投诉平台投诉维权。一方面当今“流量为王”的互金行业,如果不及时处理投诉,也可能会损失宝贵的客户,影响收益,加之互联网信息传播速度快且范围广,对该平台在行业的口碑有一定负面影响;另一方面监管机构面对复杂多变的互金行业,难以快速了解行业问题,如果不及时治理,可能会影响社会稳定。所以本研究将从互金行业切入,利用互联网投诉平台黑猫投诉和聚投诉的投诉文本分析研究,通过深度学习将文本分类,一方面分类器可以帮助互金平台优化产品。另一方面,也可以提高监管制定政策的效率。

本文最终的目的都是希望互金平台和监管可以把问题快速分类,制定应对措施,做到事前管控。

二、研究意义

(一)理论意义

新的关注视角,之前学者对于民生关注行业更多的如电力、电信、医疗等行业,除了银行或者监管收到的投诉,还未有对互联网投诉平台中对互金平台的投诉分析。

新的决策依据,将投诉数据分析后得出的量化信息,应用到机构决策中,为决策者提供新的参考。

深度学习方法应用于互联网金融投诉文本分类,算法自动提取特征并减少繁杂的人工特征工程,得到较高准确率的分类器。

第二章 文献综述

第一节 互联网金融行业

随着人工智能、大数据、云计算、OCR等等互联网技术的高速发展。如今,互联网技术应用于金融的场景模式越来越多,这种新业态呈现出复杂、多样的特点。互联网金融推动金融的创新发展、转变经济发展方式、调整经济结构发挥积极作用。政府也提出大力发展互联网经济。那么对于这种非传统金融业态,国内外的学者也进行了大量的研究工作,取得了较丰富的研究成果,笔者归纳总结前人研究焦点在互联网金融业态、互联网金融对于原本传统金融的冲击、中美互联网金融差异与相同点的研究、金融体系中互联网金融风险探讨、学者对于未来学术研究方向的探索。

20世纪90年代,网络经济学理论分析首次被运用到金融交易与金融市场发展的分析中,其中最为经典的文献是国外研究Economides (1996),该研究的价值在于其分析的思路和框架启发了人们如何理解互联网金融发展以及互联网金融对金融市场和金融体系的影响。网络经济学框架下研究互联网金融发展的基本逻辑:在传统新古典经济学的效用函数理论和市场理论的基础上,结合金融交易网络具有的网络外部特征分析。Mishkin and Strahan (1999)回顾历史,认为20世纪70年代美国电子信息与通信技术的创新,这种创新大幅度地减少金融交易成本,也避免了信息不对称的问题,进而对美国金融市场的发展产生了重大影响。重要影响包括以下三个方面:第一,网络经济跨越了地域、国家等限制,使得金融市场规模被网络扩大,并加快了市场流动性;第二,企业和金融机构可以依靠迅速发展的衍生金融市场来应对市场风险;第三,金融支付体系逐渐发展到电子化和网络化,导致人们降低了对活期存款的投资需求,这也加快了金融脱媒。提出美国银行部门在90 年代加快竞争、并购与整合的根本原因在于信息网络技术的普及很大程度上提高了美国金融业尤其是银行部门的规模经济。Helen Allen, John Hawkins and Setsuya Sato(2001)分析电子交易对于金融的影响,认为有3个方面会影响电子交易:监管体系、网络和竞争、金融行业稳定。Economides(2001)认为新技术的创新常常对金融市场的结构产生重大的、有时是出乎意料的影响。

第二节 我国金融投诉客户研究现状

消费者行为研究中客户投诉是一个重要课题。研究客户投诉的意义很多,这体现了客户对企业的信赖和期待,并帮助公司获取到客户的需求,同时企业可以获取到变化的市场信息。只有发现了问题,才可以做的更好。另外,对于社会或者某个行业来说,客户没有投诉的途径,一方面企业没有机会纠正错误,另一方面可能会成为监管的缺失。

我国的金融领域投诉现状,各个银行以及银保监也开通了投诉热线,银保监也一直倡导消费权益保护普及金融知识,也定期在银保监官方网站将银行业、保险业投诉情况通报。通报内容也仅从统计分析角度去比较各个机构的投诉数量和变化,并对突出投诉做出说明。业务相关的制度法律体系不完善,导致执法依据含糊、法律保护空缺;监管机构数量的局限,监管保护缺乏,互联网金融监管粗放;金融消费者素养不高;纠纷处理机制不完备等,这些原因都造成了我国金融市场发展相对落后。

学术界在过去的30年时间,关于顾客投诉的研究领域已经出现了丰富的研究成果(朱美艳等,2006)。这些研究对于何为投诉、投诉发生的原因、如何解决投诉等关键问题进行了对应的研究(王军等,2016)。但是关于金融行业的投诉研究分析较少,笔者分析产生这个原因情况有两个,一是金融会产生的投诉环节较少,加上之前用户的金融消费者权益保护意识较淡;二是这些投诉信息基本流向政府,政府通常不会对外披露投诉细节,所以导致这些信息没有充分利用。从学者现有对于金融投诉研究来看,目前金融投诉分析多来源各银行或者监管研究员的分析,可以发现之前文献主要是关于金融征信。随着金融科技发展,导致征信查询和征信上报完成线上化流程,并在不断更新迭代,这个过程中难免会产生一些问题。李凯风等(2017)从多个角度分析我国金融消费者权益的保护和问题,通过理论分析给我国监管提出了金融消费者保护体系的思路和具体措施。

第三章 数据来源和初步分析 ......................... 17

第一节 数据来源 ........................ 17

一、 聚投诉 ................................... 17

二、 黑猫投诉 ................................. 18 

第四章 基于深度学习的投诉数据文本分类 ................................... 27

第一节 模型输入 .............................. 27 

一、 词向量介绍 .............................. 27

二、 训练词向量 .................................... 28

第五章 分类算法的实验及结果对比 .......................... 40

第一节 实验环境 ....................................... 40

第二节 训练过程 ................................. 40 

第五章 分类算法的实验及结果对比

第一节 实验环境

本文采用Facebook开源Pytorch深度学习框架的CPU版本,在Pytorch官网https://pytorch.org/根据电脑配置找到对应版本安装,在Anaconda的Jupyter Note上面完成实验。本文所需的实验环境及配置如表5.1所示:

信息管理论文参考

第六章 结论与展望

第一节 研究结论

文本分类一直是自然语言处理中经典的研究课