SCI论文发表栏目提供最新SCI论文发表格式、SCI论文发表硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于领域本体的农药信息语义查询系统研究与实现

日期:2020年10月13日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:819
论文价格:150元/篇 论文编号:lw202010062115263857 论文字数:33639 所属栏目:SCI论文发表
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇SCI论文发表,本文在介绍了关于本体和中文分词的背景与研究现状以及相关的一些方法、难点、重点后,从系统研究的主要内容和实际需求出发构建了农药和农作物领域本体以及基于中毒症状本体、中毒症状用户词典,主要实现了对农药使用信息的语义查询以及未知农药中毒急救的语义查询,以及设计并实现了以此为主要内容的基于领域本体的农药信息语义查询系统。


1 绪论


1.1 研究背景

自古时起,我国就是一个人口大国和农业大国,而农药则是农业生产活动中不可或缺的农用物资,劳动人民很早就懂得利用一些天然的矿物源农药和生物源农药来杀灭虫害,古代的农药使用虽然缺乏一定科学理论依据,但在丰富的实践经验基础之上人们总结出了关于农药的使用方法、优点、缺点和适用对象等各项信息。这种对天然农药的使用作为农业生产实践经验,从口口相传逐渐到编成书籍得以进一步地流传,早期的农药科学属于从生产实践中归纳总结的经验科学。在进入近现代社会后,生物学、现代医学、化学等学科得到快速发展,化学合成农药得以问世,各种农药的种类和数量也日渐庞大,关于农药的使用也变得更加科学、精准,其作用和副作用也更加明确,农药科学也就变得更加系统化、理论化。

随着科技的发展产生了许多不使用化学合成农药的技术和方法,用于防治农作物病虫害,例如基因工程、生物防治、绿色农业及有机农业等。但目前尚未出现可大规模推广并完全取代农药或者不使用广义上的农药的技术和方法,而农药使用的安全性也被各国所重视。随着我国的《农药管理条例》的贯彻落实与不断完善,农药的相关安全性标准和各种剂型的组成比例也越来越符合国际标准,这对我国环境的保护和农药接触与使用者的生命健康都有重大意义。
有了现代科学理论的支撑和指导后,结合科学实验和生产经验,农药科学发展得更加全面,农药种类也更加丰富,其种类不仅涵盖传统的在农林牧副业生产方面防治有害生物的农药,广义上还包括植物生长调节剂等调节植物生长的药品以及用于作物卫生、改善有效成分物化性质的各类助剂。在 2018 年,随着《农药管理条例》的贯彻实施,我国各部门对农药的风险管理不断强化,使农业的绿色发展理念更加深入人心。截至2018 年 12 月 31 日,我国有效登记状态的农药有效成分达到 689 个,而农药产品则多达41514 个,其中大田用农药 38920 个,卫生用农药 2594 个。从 2013 年到 2018 年间,农药登记数量年均增长速度达到了 6.90%。且这 6 年的农药登记数量有三种变化:1.农药毒性:低毒和微毒农药数量占比稳步提升,高毒、高残留的农药正被逐步替换和淘汰,如 DDT、六六六等早已被禁用,这类农药虽然低价有效,但其有害物质不仅直接危害接触者,还在自然界里难以分解,会继续在食物链中流动和积累,长久来看对于环境和人类自身的危害极大。

...........................


1.2 研究目的及意义

农药种类的大量增加和经济水平的不断提高以及我国相关政策的贯彻落实使得人们在农药选择上不再局限于传统的几种农药,人们的安全意识和环保意识日益增强,会在选择农药时除了注重有效性以外,也更加注重农药使用的安全性。也就是说在防治病虫害时不仅需要注重农药的效果,还要选择毒性较低、危害性较小,有中毒急救措施的农药。

而现在市面上常见的有关作物病虫害和农药的农业网站及应用,多是关于作物病虫害的识别诊断、防治方法,以及农药的价格信息、厂家信息,查询方式也多是基于关键字的查询且信息较为分散,比较缺乏系统性和语义关联性,如基于关键字的查询输入洋柿子则不易搜索到番茄的有关信息而是有可能搜出柿子等关联性不大的信息,尤其缺乏对于未知农药中毒急救的查询。我国每年都有大量的农药中毒案例,其中有很多都是接触了名称不明的农药,中毒急救的目的就是采用一定的有效措施在送医救治前把中毒者的损伤尽量降低,刚刚中毒的这段时间往往是救治的黄金时间,知道了农药的名称与有效成分才能根据其化学特性采取有效的针对性措施,而对于名称不明的农药则要根据其中毒症状来缩小可能的范围乃至最终确定农药的名称。

本研究的主要目是设计并实现一个基于领域本体的农药信息语义查询系统,实现农药使用信息查询、对未知农药的中毒急救查询、农药和农作物的分类体系浏览等功能,以方便农业生产人员、农药使用人员和其他相关人员的使用。
图 1 技术路线图

............................


2 相关理论与技术


2.1 领域本体相关理论与技术

本体(Ontology)最早源于哲学概念,意为对事物的客观存在作出描述。而随着信息科学的发展,本体有了新的含义“本体是共享概念模型的明确的形式化规范说明”,其特征是共享、明确、概念化、形式化,利用本体知识创造出的资源描述能够使机器更容易理解(赵蔚等,2015)。

2.1.1 本体的种类和主要描述语言
本体的几大特征分别是,共享:本体概念中的知识应该是被广泛认同的而不是主观的个人认同;明确:本体中的概念、属性以及关系等应该定义明确;概念化:本体中的概念抽取自现实世界;形式化:本体中的信息应该能被机器所读取、理解与处理。通俗地来讲,本体就是一种对领域术语集合及其关系的结构化、规范化的描述,它注重概念间的语义联系,因此本体不仅能被人类所理解,也能被计算机所识别与处理,在人工智能、语义 Web、知识工程等多个方面发挥着重要作用。

本体作为一种知识建模工具,自被提出以来就受到了众多国内外研究人员的关注(杨月华等,2015)。Perez 等人归纳了本体的 5 个基本建模元语:类(Classes)或概念(Concepts)、关系(Relations)、函数(Functions)、公理(Axioms)以及实例(Instances)。所谓概念就是对知识领域中的对象实体进行的抽象化描述,而概念划分就是通过分析概念的特征将其划分为类或属性(黄奇等,2015)。实例是概念中的具体化例子,概念的关系有很多,如等同关系、上下位关系(父子类关系)以及兄弟类关系(并列关系)等。

本体按照对领域的依赖程度可以分为:顶层本体(Top-level Ontologies)、领域本体(Domain Ontologies)、任务本体(Task Ontologies)和应用本体(Application Ontologies)四类。顶层本体:描述的是最普遍范围的概念与概念间的关系,比如时间、地点,与具体的领域无关。领域本体:本系统构建的农药和农作物领域本体就属于此类本体,描述的是特定领域的概念及其概念间关系,如农业领域、医学领域、军事领域等。这里的“领域”是根据本体构建者的需求来确立详细范围的(杨涛,2019),可以是某一个学科领域,也可以是某几个学科领域的一种结合,或者是一个或几个领域中的部分范围等。任务本体:描述特定任务中的概念及其概念间关系(杨丹丹,2010)。

............................


2.2 中文分词相关理论与技术

中文分词就是将一个汉字序列按照某种规则进行切分,并重新组合成新的词序列的过程。相比于英语等词汇间有明显间隔的字母文字,中文除了标点符号外没有停顿,且具有难以确定字词组合、一词多义、一字多意以及经常需要联系上下文等特点,使得词汇准确分割和词义消歧的难度大大增加。中文分词中最主要的难点还是歧义词和未登录词(Out-of-vocabulary)的处理,虽然分词词典可以减小这两者的影响,不过对于面对情况复杂、处理内容较为广泛的分词系统来说还是有些力不从心。

中文博大精深、灵活复杂,同一词语在不同的语境中的含义不尽相同,相邻字之间的词语组合方式多种多样,甚至单个字也可以当作词语,这就是中文歧义的特点,比如“农作物理应被关注”就有“农作物/理应/被”和“农作/物理/应被”等多种切分方式,意思也差别很大;再比如“一行/行/行行/行”,这里的单字“行”就有两种含义分别是“可以”和“行业”的意思,而且行也可以成为叠词。歧义句在理解上会产生多种可能的含义,会导致语句表达的含义不明确,有些语句即使是汉语母语者也难以确定其具体含义,也就更难以被机器所正确识别与处理,所以汉语经常被外国学者称为最难的语言之一。

1.歧义词
歧义词的切分和处理是影响汉语自动分词系统精度的重要因素(代建英,2005),歧义问题通常可分为交集型歧义问题、真歧义问题以及组合型歧义问题三类,不同的消除歧义方法针对的歧义问题种类也有所差异。

真歧义问题:系统切分后的语法与语义都正确,即使人工切分也会产生这种歧义,只能通过联系上下文语义环境的方式才可以给出正确的切分结果。交集型歧义问题:系统采用不同的方式切分后,前后词语有多种组合方式,但是只有一种组合语义上是正确的,其他组合在语义上是错误的,这种是人工切分一定能解决的问题。组合型歧义问题:即交集型歧义问题和真歧义问题在一段语句中同时存在的情况。

..............................

3 农药和农作物领域本体构建研究............................. 15

3.1 领域本体的构建流程.............................15

3.2 获取领域关键概念和术语............................17

4 中毒症状本体和用户词典的构建............................ 27

4.1 中毒症状本体构建.........................................27

4.1.1 对中毒症状与急救措施的搜集与整理.................................27

4.1.2 对中毒症状输入文本的统计与筛选...........................