税务信息化论文栏目提供最新税务信息化论文格式、税务信息化硕士论文范文。详情咨询QQ:1847080343(论文辅导)

数学策划的数据开发技术如何运用于税务定额定税

日期:2018年01月15日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:672
论文价格:150元/篇 论文编号:lw201404211703133514 论文字数:33478 所属栏目:税务信息化论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

第一章 前言


一、问题的提出

在税务管征中,大量中小企业和个体纳税户存在帐证不健全的情况,针对这种情况,税收征管法规定, 纳税人有下列情形之一的,税务机关有权核定其应纳税额:(一) 依照法律、行政法规的规定可以不设置帐簿的;(二) 依照法律、行政法规的规定应当设置帐薄但未设置的;(三) 擅自销毁帐簿或者拒不提供纳税资料的;(四) 虽设置帐簿,但帐目混乱或者成本资料、收入凭证、费用凭证残缺不全难以查帐的;(五) 发生纳税义务,未按照规定的期限办理纳税申报,经税务机关责令限期申报,逾期仍不申报的;(六) 纳税人申报的计税依据明显偏低,又无正当理由的;对存在以上六种情况的纳税人税务机关根据税收征管法,对帐证不健全的企业进行税额核定。这种税额核定的一般过程是1.由企业填报上年收入、成本、费用等数据。2.税务人员到企业进行实地调查,查看帐簿,提取企业的帐证情况。3.依据掌握的情况和经验判断,核定企业的营业额。

这种核定,除根据企业的帐证情况,还必须依赖于税务人员的经验判断,隐含着一定的规律,但也存在着比较大的随意性、不确定性和不科学性。人工税收核定存在以下主要问题:(1)主观判断的不同造成偏差的存在每个税管人员的主观经验判断都不可能完全相同,因此对同一家企业可能存在核定情况的偏差,如甲税管员核定该企业月营业额 50000 元,而乙户管员可能核定该企业月营业额 40000 元。经营情况相似的两家企业,由于各税管员的经验判断不同,也可能核定不同的定额。即使是同一个税管员,在进行经验判断时也不可能做到完全一致。这些都造成了偏差的存在。而税收的统一与公平原则是税收的基本原则之一,在实的税收管征中应尽可能做到同种产品、同种行为、同样或同类征税对象、相同纳税能力的纳税人纳一样的和同量的税,这种偏差的存在显然不符合税收的统一公平原则。如何消除这种偏差,体现税收的公平、公正原则,就需要一个确定的,合理的、平均的标准、规则,根据这标准来进行核定,才能实现真正的税收公平。


二、本文所作的工作及主要成果

本文分析了税务税额核定的数据特点,针对应用需求,提出了一种基于数学规划的数据挖掘算法,并将该算法运用于税务定额核定系统的开发设计中。本文共分为三个部分,第一部(第二章)介绍了数据挖掘的基本知识和技术。第二部分(第三章)介绍了数学规划和多目标规划的基本定义和求解方法,并具体介绍了一种基于多目标规划的数据挖掘方法。第三部分(第四章)主要介绍了运用基于多目标规划的数据挖掘方法的税务定额核定系统的开发设计和系统测试工作情况。由于本人水平有限,经验上也存在不足,所以文中难免有错误与疏漏之处,敬请各位老师和同学给予批评指正。

………………


第二章 数据挖掘技术概述


一、数据挖掘

1.1 知识发现

随着全球信息化的发展,计算机技术和数据收集技术的进步使人们可以从更加广泛的范围和以几年前不可想象的速度收集和存储信息。收集数据是为了得到信息,然而大量的数据本身并不意味信息。尽管现代的数据库技术使我们很容易存储大量的数据,但现在还没有一种成熟的技术帮助我们来分析、理解并使数据以可理解的信息表示出来。在过去,我们常用的知识获取方法是由知识工程师把专家经验知识经过分析、筛选、比较、综合、再提取出知识和规则。然而,由于知识工程师所拥有的知识有局限性,所以对于获得知识的可信度就应该打个折扣。


二、分类技术

机器学习方法:常见的是决策树法,对应的知识表示为决策树或判别树规则归纳。一个决策树是由内结点、叶结点和分支组成的树状流图结构。每一个内结点代表一个数据属性的测试,每个从该结点流出的对应测试的一个可能结果。每一个叶结点代表一个类。在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该点向下的分支,在决策树的叶结点得到结论。所以从根到叶结点的一条路径就对应着一条合理规则,整棵决策树就对应着一组析取表达式规则。常见的决策树算法有:ID3、CART、SLIQ 和 SPRINT。神经网络方法:利用神经单元可以构成一个很复杂的分类器。反向传播神经网络 BPN 是当前最普遍使用的,BPN 由一个输入层,一个或多个中间层或隐层和一个输出层组成。其实现的基本思路是:把网络学习时输出层出现的与“事实”不符的误差,归结为连接层中各结点间连接权及阈值的“过错”,通过把输出层结点的误差逐层向输入层逆向传播以“分摊”给各连接结点,从而可算出各连接结点的参考误差,并据此对各连接权进行相应的调整,使网络适应要求的从输入层到输出层的映射。粗糙集:粗糙集理论的要点是将分类与知识联系在一起,它使用等价关系来形式化地表示分类。这样知识就可以理解为:使用等价关系集对离散表示的空间进行的划分。粗糙集能够有效地处理下列问题:不确定或不精确知识的表达、经验学习并从经验中获取知识、不一致信息的分析、根据不确定信息进行推理、近似模式分类、识别并评价数据之间的依赖关系。

………………


第三章 算法的实现……………17

一、 数学规划………………17

二、 多目标规划………17

三、 基于多目标规划的分类器方法 …3

第四章 系统功能概述及主要设计思想 …32

一、系统需求………………………….32

二、系统总体设计…………………………….32

三、系统总体结构……………………………….34

四、系统模块结构………………………….35


第四章 系统功能概述及主要设计思想


一、系统需求

系统的总体需求是:实现企业税额核定的电脑化。具体系统需求描述(1)企业定额核定:根据输入的企业基本情况和经营情况,按照一定的算法给出核定的营业额,给出的核定营业额应能满足下列要求:a.反映企业的经营状况;b.与税管人员人工核定的营业额相差不大;c.与同类型同等规模的其他企业营业额大体持平。(2)企业定额数据保存查询:能够保存输入的企业基本情况和经营情况,以及定额核定情况,并能对保存下来的历史数据进行查询。从而可以了解企业的历史经营情况和核定情况。

……………


结论

为了实现系统需求,在税务征管人员的帮助下,我们选取了 600 户纳税户2003 年的企业定额审批表,通过对这些数据的分析我们发现,一些纳税户具有相同或相近的核定营业额,而我们的系统设计目标就是给出企业的核定营业额,因此我们考虑营业额落在某个区间内的纳税户归为一类,将纳税户按核定营业额的大小进行分类,对企业进行纳税核定时根据企业的信息给出分类,就给出了企业核定营业额的参考区间,然后取区间的中间值做为输出核定额。因此如何根据纳税户的信息进行模式分类就成为系统的设计目标。由于这 600 户企业都是成功核定的实例,因此将它们作为正例样本,从中进行数据挖掘,设计分类器。


参考文献(略)