税收筹划论文栏目提供最新税收筹划论文格式、税收筹划硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于粗SVM理论的相关关系预测算法在税收领域中的应用

日期:2018年01月15日 编辑: 作者:无忧论文网 点击次数:1119
论文价格:免费 论文编号:lw201109231721275383 论文字数:2436 所属栏目:税收筹划论文
论文地区:中国 论文语种:中文 论文用途:职称论文 Thesis for Title

摘要 粗糙集理论(RST)与支持向量机(SVM)作为模式识别,数据处理的有效工具,已成为机器学习的研究热点。结合粗糙集理论和支持向量机各自的特点,提出了基于粗SVM理论的相关关系预测算法,并运用到税收领域中,实验表明,该算法取得了良好的效果。

 

关键词 粗糙集理论 支持向量机 数据预测

 

1 引   言
国家的税收值能反映一个国家或地区的国民经济总量,表明该国或地区的经济实力,它是衡量国民经济发展速度的重要指标。在实践中使用的较多的是参数法,用参数法需要构造显式的函数形式,而一般都隐含着线性关系的假设,而实际问题中却多为非线性关系;同时,作为一种具有很强非线性问题描述能力的建模工具,神经网络在预测领域得到了广泛的应用,但是神经网络技术也存在着一些固有的缺陷:网络结构的确定没有统一准则;对样本在数量和质量上有一定要求;容易出现过拟合现象,模型泛化能力不强等。因此,文中提出了一个基于粗SVM的预测算法,有效的解决了这个问题。
2 粗支持向量机的相关概念及算法
2.1 粗糙集理论与知识的依赖性和重要度
粗糙集理论(RST)是Z.Pawlak于1982年提出的,是一种处理不精确,不确定与不完全数据的新的数学理论,为研究不完整数据进行分析、推理、发现数据间的关系,提取有用属性,简化信息处理,研究不精确、不确定知识的表达、学习、归纳方法等提供了一个有力的工具[1]。假设R、Q均为U上的等价关系,它们确定的知识系统分别为U/R,U/Q,如任意的[y]∈(U/R),有Q-([Y])=Q([y])=[y],则称知识R完全依赖知识Q,即当研究对象具有Q的某些性质,这个研究对象一定具有R的相应的一些特征,说明R与Q之间是确定性关系,否则,称知识R部分依赖知识Q,即研究对象的某些Q特征不完全确定其特征R,说明R与Q之间是不确定关系。
2.2 支持向量回归机
支持向量机(SVM)是含有一个非线性单元隐藏层的前馈网络的一种技巧和高度原则化的学习方法。它由根植于VC维理论的结构风险最小化原则导出。SVM克服了神经网络和传统方法的诸多缺点,不需要特定问题的先验知识,在有限的训练样本情况下,可以

3 SVM预测方法
3.1 基本分类方法
在进行数据预测过程中,往往要使用得属性都很多,但并不是所有的属性对预测结果都是同等重要,过多的冗余属性会导致计算量过大。基于以上问题,提出了粗支持向量回归机预测方法,通过把粗糙集理论对属性的约简方法引入支持向量回归机,提高了预测精度。算法基本步骤如下:
(1)据预处理:对所选的样本进行预处理,去掉不完全数据,使余下的样本都是全部属性具有属性值的样本。
(2)属性约简:用粗集理论中的属性的依赖性和重要度对样本集进行处理,得到一系列的约简属性。
(3)建立训练模型:对新属性集的样本进行处理,根据式(1)和(2)解二次优化问题,得到决策函数f(x),最后得到训练模型。
(4)数据预测:用得到的训练模型对测试样本进行预测,得出预测精度。
3.2 新属性的产生方法
该预测方法把粗糙集理论的约简方法应用到支持向量回归机中,消除冗余属性,其中条件属性与决策属性之间的依赖度用它们之间的信息熵来度量,这样能比较准确地反映出条件属性与决策属性之间相互依赖的程度,从而比较准确地判断一个属性是否为重要属性。通过对属性的处理,在减少一定的属性同时也保证了训练模型的可靠性。  
产生新属性集的具体方法如下:(1)计算由每个条件属性与决策属性之间的依赖度,再由依赖度计算出该条件属性的重要度。(2)如果属性的重要度高于事先设定的阈值,则该属性为重要属性,否则为冗余属性。
4 应用实例
税收值可以用以下公式来计算[7]:各项税收=税务部门组织收入+农业税务+关税;税务部门组织收入=f(第二,三产业增加值,税率)+f(企业利润总额,税率);农业各税=f(第一产业增加值,税率);关税=f(进出口总额,税率)。
公式中的税率均为综合税率。税收部门组织收入指消费税,增值税,营业税,所得税等主要税收收入。其它流转类的税收如资源税等,因比重小,故不作专门计算。
文中选取了我国1980~2001年的税收统计(如表1所示)。以税收值为预测指标,第一,二,三产业增加值,税率,企业利润总额,进出口总额为条件属性。把1980~1995年的数据为训练样本,1996~2001年的数据为测试样本,选取径向基函数为核函数。C=5000,σ2=95,ε=0.2。应用Matlab编程得到的实验结果如表2所示。


5 结   论
通过实验可以看出,粗SVM能更有效的对税收值预测,该理论克服了传统的非线性回归预测方法的诸多缺点,只需要少量的训练样本,就能得到比较理想的效果。所以,该算法是对传统算法的有效改进。  

 

参考文献
1 张文修,吴伟志,等.粗糙集理论与方法[M].北京:科学出版社,2003.36~39.
2 蒋铁军,李积源.基于支持向量机的武器系统费用预测分析[J].系统工程理论与实践,2004(9):121~124.
3 许建华,张学工,李衍达.支持向量机的发展[J].控制与决策,2004(5):481~484.
4 邓乃扬,田英杰.数据挖掘中的新方法-支持向量机[M].北京:科学出版社,2004.235~243.
5  Simon Haykin.Neural networks:a comprehensive foun-dation (Second Edition) [M].Beijing:Tsinghua Univer-sity Press,2001.
6  Vapnik V. The nature of statistical learning theory[M].New York:Springer Verlag,1995.
7 刘云忠,等.粗糙集理论在我国税收预测中的应用[J].系统工程理论与实践,2004(10):98~103.
8  2001年中国经济年鉴[M].北京:中国经济年鉴出版社,2001.