5.1系统需求分析
进入21世纪以来,人工智能与我们的生活息息相关,越来越多的产品走向智能化,人工智能算法也离不开大规模数据集。机器学习作为人工智能领域的核心,在图像识别领域有着巨大的作用,例如车牌号码的识别,图像标注,手写数字识别等方面都有着广泛的应用。这些人工标注的大量格式化样本数据,为机器学习算法提供了支持和保障。然而随着标记数量不断地增加,以及标注成本也越来越高,现有的图像标注方法存在如下几个问题:
1. 数据标注是一个非常耗时耗力的任务,例如在人工给一副图片打标注时,与该图片相关的标记可能有几十或者几百个,并且图片可能有成千上万个,光凭人工标注图像难免会产生错误,并且效率低下。
2. 由于工作人员标注标准不一,通过人工标注难以实现较高质量,并且企业对标注人员的培训也需要一定的成本。
3. 如果采用图像标注算法,现有的算法大多是基于没有噪声的样本进行学习的,然而实际应用中,很难获得这样完美的数据集,通常同时含有特征噪声和标记噪声,这样会导致标注的不准确,难免会影响图像标注的质量。
针对上述问题,设计开发一个图像标注原型系统迫在眉睫,图像标注系统最为核心的部分就是实现对图像数据的自动标注,系统需要提供多标记数据的预处理,训练,预测,存储和可视化等服务。图像数据预处理是系统能够对图像数据进行标准化处理,从而消除异常样本数据的影响。训练是利用第三,四两个章节提出的模型在图像数据集上进行训练,并且能够调整模型超参数以便达到最佳性能。图像数据预测是利用训练好的模型来对未知图像数据进行预测。图像数据存储是系统能够将图像数据以及模型资源进行持久化操作,利于多次使用,也保证了数据的完整,并将预测的标记进行保存,以到达自动标注功能。可视化是系统直观的展示图像标注结果的好坏,方便用户后续改进。
第六章 总结与展望
6.1.1 工作总结
多标记学习作为机器学习中重要的一个部分在各个领域都取得了应用,但是在实际应用中,我们很难获得完整的监督信息,并且我们获得的数据集往往是同时含有特征噪声和标记噪声,现有的多标记学习方法往往是基于训练样本是完美的或者只考虑其中一种噪声,在这种情况下,多标记学习算法分类结果往往是不准确的,因此如何构建一个噪声容错的多标记学习算法也是一个巨大的挑战。此外,由于许多对象兼具丰富的语义信息,构成多个视图,且视图信息有缺失,如何充分利用这些视图信息也成了关键。
针对上述问题,本文充分调研了现有的多标记学习算法,分析了这些算法的优缺点,针对弱监督场景下的多标记学习算法进行了研究,并围绕弱监督多标记学习问题提出了两个噪声容错多标记学习模型,以及设计并实现了一个图像标注的原型系统。具体来说,本文的研究内容如下:
(1)本文充分调研了多标记学习算法的国内外研究现状,介绍了目前常用的多标记学习算法和多视图多标记学习算法,并且阐述了现有多标记学习算法的具体技术原理以及其存在的不足之处。
(2)针对单视图并且混合噪声存在的场景,提出了一个图趋势过滤诱导的噪声容错多标记学习模型。该模型通过组稀疏约束桥接增强的标记同时解决了特征噪声和标记噪声,模型的关键就是标记增强矩阵的学习,为了在混合噪声场景下学习到合理的标记增强矩阵,我们采用图趋势过滤代替传统的基于𝑙2范数的图拉普拉斯,这样一来可以容忍含噪示例特征与标记之间关联的不一致性,同时引入标记关联矩阵的稀疏约束来刻画标记之间的局部关联特性,从而在混合噪声场景下解决标记缺失问题。
(3)针对不完全多视图并且标记噪声存在的场景,提出了一个基于潜在公共表示的不完全多视图多标记学习模型。该模型将多标记学习问题拓展到了多视图多标记学习,相比于单视图,多视图学习可以提升多标记学习的性能,该模型利用多视图信息的一致性和共享性,在样本视图缺失情况下,学习得到一个潜在的公共表示,这个公共表示可以对多视图数据进行完整的表示,通过自适应学习标记关联关系来增强标记信息,并用𝑙1,2组稀疏约束减轻少量人工难以辨别的标记噪声的影响,从而在不完全多视图场景下解决标记缺失问题。
参考文献(略)