拟定学位论文题目 基于物联网的环保数据清洗技术研究
开题报告具体内容:(可另附页)
一、论文选题的目的和意义
由于现在经济发展越来越快,人口的不断增加,环境问题也逐渐暴露出来,当前对环境的保护是人们重点关注的问题,我国相关部门颁布了《关于落实科学发展观加强环境保护工作的决定》,有关单位在国内的大城市设立了检测大气质量的站点、对于污染严重的地方建设检测系统以及对水源水质等都设立了检测网络,以此来保障人们的居住环境。对环境的测定 主要包括对空气、地表水、土壤以及饮用水、噪音等多方面。需要测定信息的范围很广、数量多。随着对环保工作的重视程度加深,需要环境测定的数据也越来越多,但是由于在我国非常多的部门一直采取传统的方法,比如手工和仅使用一台电脑来进行检测操作,环境测定网络、测定系统以及数据的管理的建立还不是很完善,安全方面还不能完全保证。在现在的这个社会,随着互联网的飞速发展和电脑的升级改良,应用电脑对测定的数据进行管理,这种方式将安全性大大提高,而且贮存信息容量大、也便于查询,成本也降低了。想要提高环境测定的先进化程度,为管理的相关单位供应基本信息,就需要借助互联网,建设网络化得数据管理,随时了解环境的情况。
二、国内外关于该课题的研究现状及趋势
RFID 把无线通信、数据的管理以及信号处理等三者结合起来,借助无线射频信号来实现读写器和电子标签的信息对接,以此来检测带有标签的目标的逻辑方位。RFID技术在很多领域都得到了普遍运用,比如物流方面、供应链、生产制造、交通等方面。但是RFID读写器在搜集信息时,常常会收到射频信号和附近环境等的干扰,导致收集的信息不能确定是否正确。一般情况下,收集的最初的信息正确率在60%~70%,对于高级处理没有什么作用[1]。为了能给使用者的业务提供不断地、高效率的,质量好的信息,让使用者更好的进行操作,对最初的RFID信息的处理来说十分关键。
当前,相关研究人员对怎样清理最初的FRID的信息流已经开展了很多工作,并且小有成效。文献[2]依照信息的空间关联性提出了一种ESP数据清理的原理。由于取样原理文献[3]中提到一种能从最初的收集的信息中确定标签方位的粒子过滤技术。文献[4]根据信息遗漏问题并且以机器学习为基础,提出适应的时间开支、全体优化方法。文献[5]提到的清理方法关键在于RFID信息的顺序,主要用来处理收集信息时顺序打乱的问题。文献[6}根据事件和概率研究出一种动态事件几率清理模型。在RFID的清理办法的基础上,重点举几个例子:
(1)基于平滑的模型
对于RFID搜集信息遗漏的问题,平滑机制应运而出。这种构造主要是通过信息在时间和空间相互弥补来补救遗漏的信息。时间平滑趋势指依据在接近的一个时间段里搜集信息,利用相邻的时间窗口填补该窗口的标志的刻度数目。空间平滑机制是在空间上对信息进行加工,它的加工主要是读写机在相同的空间里的别的机器搜索到的目标进行标记。无论是空间或者时间的平滑机制都能独立进行操作,然而仅仅是针对指定的时间和空间才会产生作用。因为计算方法的窗口的大小都是无法更改的,所以算法过滤的方法不是非常完美。
对于平滑模型出现的一些情况,静态滑动窗口计算方法利用扩大滑动窗口来弥补遗漏的信息,然而不能准确设定窗口的大小会造成多余的信息读取[7]。对于这种情况,文献[16]中记录了填补计算方法SMURF,这种方法依据读写率的变化情况对窗口的大小进行调节,有效的缓解了信息读取的错误的情况出现,相比静态滑动窗口效果更好。
(2)基于事件的模型
RFID事件处理技术是系统根据一开始设置好的事件的的原则来对特定事情进行检查[8]。事件模型把读写机和标志的每次对接当做一件事情。事件处理模型在处理复杂事情时得到充分的使用,其通过一种新的途径来完成RFID的筛选和合并,制造出真正可以充分解决使用者实际需要的,比较难的复合事情。这个模型借助多余事情过滤机、EPC编码清洗器以及时间清洗器,它们之间相互结合对最初的标签信息进行加工筛选,以此来完成信息的清洗。
(3)基于机器学习的模型
目前,工作人员通过RFID现在能有的资料包,研究出一种包括很多样的过滤方法的信息处理结构。模型结构是由清洗办法和最优策略组成。其中清洗办法里面有一个通过标签做输入的办法分类设备。标签实例里包括标志的特点、读写设备的特点以及标记对象的特点。把这些特点作为办法归类的基础,详细的要求需要在学习中提取。一般的清洗办法主要是静态滑动窗口、董涛滑动窗口以及别的使用者自己设定。清洗计策对于清洗的条件有要求,针对不同的数据对应不同的方法,可以降低清洗的成本[10]。其中决策树和贝叶斯是典型的方法。
上文写到的计算方法大对数是对单独的读写设备来说的,针对很多个读写设备和标志结合而产生的环境,相关研究人员针对该情况也进行探索。文献[11]概括了RFID在获得最初的信息中出现的几种错误,指出对于RFID信息提取是否准确以及提出对路径限制的定义,利用规定概念来解决出现的标签信息不准确的情况。文献[12]对于RFID读写设备利用原有的办法来得到脏信息这一点,在多个原有的读写环境上研究出了指定路径的方法。该方法先假设好路径,在确认好路径上读写设备的排列顺序,设置子路径的范围。该方法把标志信息的时序和指定路径排列保持同步,当做路径对应的条件。为一条有噪音的路径S,搜索现有的路段,将该路段和子路段进行组合成为新的路段,以此来填补路径中出现的遗漏等问题。
三、本人的研究计划
(一)研究目标
在本文中,首先介绍了RFID数据的相关概念和特点,以及RFID数据的不确定性,同时概括了RFID数据清洗的一些主要技术。在借鉴国外清洗多读算法的基础上,提出一种基于计数的RFID数据多读的清洗算法;进一步,在吸收国外数据清洗技术的基础上,提出基于运动时效性的数据填补算法;在考虑到现实情况中,多逻辑区域参与的复杂应用增多,引入自学约束以及实际应用中存在的用户指定约束条件,提出基于约束的数据清洗算法。
(二)研究内容
本文的主要研究工作及成果如下:
综合分析环境监测系统中RFID系统组成与数据流的特点,分析常用RFID网络数据清洗策略并着重介绍几个经典的RFID数据清洗算法。为满足RFID网络中数据的完整性,提高漏读数据的填补正确率,在研究SMURF算法的基础上,提出一种自适应窗口大小调节的ADCLM算法。该算法结合统计抽样理论,根据数据完整性和动态性检测条件进行决策,在满足动态窗口调节的同时针对标签边缘化处理、大窗口污点效应以及小窗口抖动效应等问题上做更为深入的处理。为最大限度的减少RFID网络中数据的冗余数据,在研究RRE和LEO算法基础上,提出一种不依赖于特定拓扑与特定阅读顺序的基于中间件的混合去冗余阅读器的算法。该算法保证在满足对数据完整性的要求上对整个RFID应用系统中的激活阅读器最少。
(三)技术路线
(四)拟突破的难点或攻克的难关
本文主要研究环境监测海量RFID数据处理问题,论文涉及难点如下:
(1)分析RFID数据流的特点,对海量RFID数据的主要的复杂事件处理算法进行深入研究。
(2)针对RFID数据静态窗口清洗算法与基于二项统计分布的SMLTRF清洗算法,提出自适应的动态窗口清洗算法;
(3)在深入分析RRE与LEO算法的基础上,提出一种混合去冗余阅读器处理算法;
(4)最后对本文中的算法应用到管桩信息溯源系统中,结果表明算法能够很好在实际的RFID系统中运行。
(五)创新点
(1)针对静态窗口数据填补算法与动态SMURF算法的缺陷,在标签边缘效应、大窗口污点效应与小窗口抖动效应方面提出相应改进,提出一种基于滑动窗口技术的自动RFID原始数据流清洗算法。
(2)在深入分析RRE与LEO算法的基础上,针对RRE算法与LEO算法对拓扑结构、阅读顺序的要求严格的缺点,提出一种对阅读器和标签的拓扑结构、阅读顺序无关的去冗余阅读器MXREO算法。
(六)写作计划
......................................
四、主要参考文献目录
[1]王社坤,苗振华. 环境监测数据的证据属性与证据能力研究[J]. 环境保护,2016,(22):53-55.
[2]魏晶茹,马瑜,白冰,任贵召,贺青. 基于PSO-SVM算法的环境监测数据异常检测和缺失补全[J]. 环境监测管理与技术,2016,(04):53-56+68.
[3]施黎莉. 复杂类型海洋环境监测数据的空间抽样方法优化[D].上海海洋大学,2016.
[4]何跃君,韩秀茹,凌盼. 环境监测数据综合分析与评价技术研究[J]. 青海环境,2016,(01):16-20.
[5]杨盛,刘华,甘洪江. 一种环境监测数据的传输方法[P]. 重庆:CN105424093A,2016-03-23.
[6]解鹏飞,刘玉安,赵辉,朱容娟. 基于大数据的海洋环境监测数据集成与应用[J]. 海洋技术学报,2016,(01):93-101.
[7]陈艳,王子健,赵泽,李栋,崔莉. 传感器网络环境监测时间序列数据的高斯过程建模与多步预测[J]. 通信学报,2015,(10):252-262.
[8]Gu, Y., Gao, B., Wang, J., Yin, M., & Zhang, J. (2015). A rfid data-cleaning algorithm based on communication information among rfid readers. International Journal of u- and e- Service, Science and Technology, 8(1), 9.
[9]