SCI论文发表栏目提供最新SCI论文发表格式、SCI论文发表硕士论文范文。详情咨询QQ:1847080343(论文辅导)

我国人工智能领域政策文本的量化研究

日期:2021年04月15日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:687
论文价格:150元/篇 论文编号:lw202104071012165717 论文字数:56955 所属栏目:SCI论文发表
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇SCI论文发表,本文通过对的我国人工智能领域政策文本,进行内容分析和主题挖掘,发现:第一,我国东部地区制定的人工智能政策比西部多、南部比北部多,发文部门涉及较多,但大多都是单独发文,联合发文的过少,各部门制定的政策间存在交叉性,指导性政策远多于规范性政策,《新一代人工智能发展规划》是我国人工智能领域政策核心,为制定其他人工智能政策提供参考。第二,我国人工智能政策重环境影响和供给推动,轻需求拉动分布有偏颇,供给型政策工具分配比较均衡,环境型和需求型政策工具分配有待调整,三大产业中仅一产运用了所有政策工具。


第一章 引言


第一节 研究背景及意义

一、研究的背景

当今世界人工智能技术被越来越重视,可以说它是决定世界未来发展方向的关键核心技术,大国间均把发展人工智能作为国家级重大战略,接连颁布相关政策规划,加大人财物投入力度,争取抢得先机。在当今大环境下,我国面临着挑战与机遇并存的局面,如何抓住机遇充分利用好人工智能发展潮,搭上创新改革的快车,在新冠疫情和中美贸易摩擦大环境下逆势发展,值得我们去好好思考。如何才能更好的发展人工智能?除了市场主体自我约束调节外,还需要有关部门出台发展规划进行指导,制定政策法规进行监管。通过阅读收集到的 64 条政策,我们可以发现,在我国发展信息技术方面人工智能技术已被提上了很高的地位,更是明确了人工智能的发展目标和发展要求,定下了分三步走的发展战略。

我国各省市从 2012 年开始发布人工智能领域政策的数量呈现逐年递增趋势,到2016 年发布数量到达峰值 276 篇。《新一代人工智能发展规划》出台后,引发了一轮政策制定热潮,各地的人工智能发展规划也相继出台,组成数量众多的人工智能领域政策文本。

面对我国繁多的人工智能领域政策,如何从中筛选有效信息,优化政策制定,是摆在我们面前急需解决的问题。本文采用文本量化研究相关方法对人工智能政策进行分析研究,希望分析结果能为我国人工智能技术发展提供建设性建议。

.....................


第二节 我国政策分析研究现状

一、研究对象

政策是由国家政权政党机关等组织为了达到某种目的,根据实际情况,按照一定要求而制定的条目化文件。通过观察表 1-1 我国政策分析研究情况列表发现,我国政策研究的对象包涵很广。

(一)公共服务类政策。如李鑫炜(2018)的研究对象为中国涉及到文化服务类政策文本[3]、朱振敏(2018)的研究对象为中国涉及到信息服务政策文本[5]、李亚京(2018)的研究对象为我国科学数据开放政策文本[6]等,这些政策都是作用于公共服务方面的。

(二)产业发展类政策。如胡志辉(2018)[7]和赵丽莉(2011)[55]的研究对象都为我国光伏产业政策文本、肖乐乐(2018)的研究对象为 2008 年北京奥运会后中国体育产业政策文本[17]、肖草(2019)的研究对象为我国房地产政策文本[2]、刘航(2015)的研究对象为我国新能源汽车产业政策文本[51]等,这些政策都是为某一产业能合理健康发展而制定的。

(三)民生事业类政策。如张罗娜(2017)的研究对象为我国生态补偿政策文本[18]、孙萍(2017)的研究对象为我国城镇弱势群体就业政策文本[44]、顾兵光(2018)的研究对象为我国劳动关系政策文本[14]、苟欢(2014)的研究研究对象为我国养老服务政策文本[53]、李健(2016)的研究对象为中国慈善事业政策文本[62]等,这些政策制定的目的都是为提高生活水平,改善民生。

(四)人才培养类政策。如于倩倩(2018)的研究对象为中国从海外引进高层次人才相关政策文本[4]、解佳龙(2019)的研究对象为国家自主创新示范区科技人才政策文本[28]、宁甜甜(2014)的研究对象为我国人才政策文本[52]等,这些政策都是为人才培养服务的。

(五)公共管理类政策。如柳利峰(2018)的研究对象为我国“双一流”建设的政策文本[8]、吕欣烨(2018)的研究对象为“互联网+政务服务”政策文本[9]、韩璐(2019)的研究对象为中国协商民主政策文本[15]、徐硼(2018)的研究对象为我国知识产权政策文本[58]、柳友荣(2019)的研究对象为我国高等教育质量的政策文本[24]等,这些政策可以有效提升公共管理水平。

...................


第二章 理论基础与研究方法


第一节 理论基础

一、人工智能产业

(一)人工智能产业

人们对于人工智能这个概念讲法不一,过去是通过让机器模拟人的行动方式从而实现智能化。而现在机器智能化方式,则是通过让机器模仿人脑解决问题模式,形成真正的人工智能。

(二)人工智能发展的三要素

大数据、计算力和算法是人工智能最基本的三个要素,如果将计算力比作引擎,那么大数据就像是汽油,算法则是驾驶技能,他们共同确保人工智能发展驶上快车道。

第一,大数据是源头。 和人学会某项技能一样,机器想要获得人工智能也必须通过不断训练,而大数据则是建设良好模型的基础,为训练提供了大量参考依据;

第二,计算力是保障。当数据收集完成后,再依托硬件设备——芯片不断地训练,从而实现智能化,不同芯片间的计算能力不同,算法的处理速度、能耗也不同;

第三,算法是工具。收集的大数据通过算法对人工智能进行训练,目前三要素中算法的获取成本最低,是各大公司争夺的主要阵地。

图 2-1 人工智能产业链图

...........................


第二节 研究方法

一、文本量化分析法

(一)文献调研法

文献调研法是指对研究问题收集和整理相关文献材料,了解之前研究情况并提出新见解的一种方法。为全面了解我国人工智能领域的政策文本的研究现状和政策文本分析方法,对我国有关人工智能领域的政策和政策文本研究的文献进行筛选和分析,为本文的政策文本研究打好前期基础。

(二)内容分析法

内容分析法是指对文本的内容、关键信息、本质性事实等进行量化分析和挖掘的一种科学研究方法。本文首先对人工智能领域政策文本的制定时间、制定主体、文本类型分析研究,其次构建二维分析框架,合理设置分析单元,然后对政策文本编码,按照分析单元进行归档,最后进行量化分析。

二、文本主题挖掘技术

文本挖掘就是运用计算语言和统计分析理论,从单文档或文档集中发现并提取有效、新颖、可用的信息,按照一定要求重新组织信息的过程,简单来讲就是将文本内容分解、筛选到整合的过程,最终得到想要的内容。

文本挖掘涵盖了数据挖掘、信息技术、文本分析、计算语言学、统计数据分析、线性几何、数据可视化、数据库技术、概率理论甚至还有图论。文本挖掘方法主要有文本分类和文本聚类,挖掘过程包括数据预处理、挖掘分析、可视化等。

图 2-2 文本挖掘一般过程图

............................


第三章 我国人工智能领域政策文本的内容分析················ 10

第一节 数据来源························ 10

第二节 政策的类型化分析················ 11

第四章 我国人工智能领域政策文本的主题挖掘················· 30

第一节 文本预处理·························· 30

一、文本分词处理·················30

二、停用词处理·················31

第五章 研究总结和展望···················· 51

第一节 研究总结··················· 51

第二节 研究展望························ 52


第四章 我国人工智能领域政策文本的主题挖掘


第一节 文本预处理

人工智能领域政策很多都是自然语言,包含文字、标点、数字、符号等,而且词语间没有明细的区分标记,它是非结构化的数据,需要先转化形式。字和词是构成政策文本的基础,所以要想对人工智能政策文本进行主题挖掘,就要将其分解成一个一个的字或词,使连续的内容分析为独立的字符串,去掉没用的词、数字、符号等,余下的词构成特征词集合。

一、文本分词处理

分词处理是文本预处理的第一步,它是把人工智能领域政策文本分解为独立的词,即把文本逆向还原,用通俗的语言来讲就是将词与词之间进行分离。

以对中央层面有关人工智能领域政策分词为例,具体实验过程如下:

首先,将前期共收集到中央层面有关人工智能领域政策 14 条,复制粘贴到 E 盘C000010 文件夹 11-24 记事本文件中;然后,打开 Spyder 软件,使用批量分词程序(附录一),将记事本文件从文件 11 开始每次文件名加 1,直到文件名小于等于 24截止,进行去停分词处理,得到的分词结果保存到 E 盘的 result 文件夹内,保存文件名从 1 开始每次加 1,共计 14 个,每个记事本内包含 1 个经过去停分词的政策文本;最后,使用遍历文件夹程序(附录一),将 E 盘 result 文件夹中 14 个去停分词处理后的政策文本进行遍历合并,得到的结果输出到 E 盘 result 记事本文件中。

二、停用词处理

停用词是指在文本预处理时为节省时间、提高效率,从而过滤掉对文本主旨内容分析无意义的词。本文在通用停用词基础上,根据人工智能政策特点并加入部分对研究人工智能领域政策无价值的高频词,停词表由被定义为停词的词构成。

所有词都能被视为是停词,但一般来讲,常见停词有三类:一是某些带有感情色彩的词或连词,这些功能词是非常普遍的,它们没有实际的含义。例如介词、连词,“是”、“阿”、“的”等。二是某些具体的词汇,这类词汇有实际的意义,但是在文本中出现了多次,但对文本的信息表达没有什么价值。三是标点符号、数字等。这类字符对文本的分析毫无意义。

...........................


第五章 研究总结和展望


第一节 研究总结

本文通过对的我国人工