市场营销论文栏目提供最新市场营销论文格式、市场营销硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于热点标签学的可视化时尚商品搜索引擎策划和实现

日期:2018年01月15日 编辑:ad201203011400045776 作者:无忧论文网 点击次数:1110
论文价格:150元/篇 论文编号:lw201209231042048652 论文字数:59200 所属栏目:市场营销论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

第一章概述

本章的内容主要介绍了本论文背景和意义,国内外的研究现状以及本论文的主要工作和贡献,最后对本论文编写的基本组织结构进行说明。

论文的背景和意义

    伴随着互联网的飞速发展,网络己逐渐成为类似水电、煤气的公共基础设施,根据中国互联网络信息中心(CNNIC)‘最新披露数据表明,2012年中国将进入"5亿网民”时代。不仅仅是在中国,而且在全球,上网用户数量也呈指数级增长的发展态势,这种发展趋势为电子商务即利用计算机技术、网络技术和远程通信技术,实现整个商务(买卖)过程中的电子化、数字化和网络化提供了应用条件。电子商务凭借其快捷、安全、低成本的特点吸引了广大网民的关注,为消费者提供了一种新型的购物环境一网上商店,消费者通过网络进行在线购物、网上支付,避免了传统购物环境带来的不便,如:交通、餐饮等。自1997年底诞生中国第一家专业电子商务网站以来,目前己有淘宝网、焦点科技、慧聪网等在内的多家电子商务上市公司。
    现今,网购市场无疑成为了互联网新经济形式下最强大的增长引擎。传统购物环境下人们需要依靠买卖货品的实体进行认购,包括对颜色、款式、纹理的分辨;而在新型购物环境中,在无法依托实体的情况下,只能借助图像和文本描述商品达到吸引买家眼球的目的,而由于商家受文化、教育等环境的影响,以及采集图像信息设备的差异性,都导致了商品文本描述以及商品图像的多样性。因此,如何在互联网中准确、快速检索出与网民提供的商品图像相同或类似的商品,为网民提供一项有效的购物指南成为了现今各大电子商务公司研究的热点。
    目前主流电子商务平台主要分两种检索商品的方式为用户提供服务,一是依靠纯文本检索商品,但同一商品由于商家文化差异等方而的影响,并不能保证文本描述信息的相同或相似性,导致依靠文本检索商品的准确率较低;二是采用图像检索商品的方式,随着移动互联网的快速发展,手机也日益成为人们生活中不可或缺的工具之一,功能也从通话、短信阶段发展成为结合拍照、上网等智能阶段,即拍即搜也成为了广大手机用户的普遍需求,相比依靠文本检索商品而言,在一定程度上消除了商品文本描述的不准确性,但仅单一依靠商品的纯图像特征进行检索,又会在一定程度上丢失用户对商品图像特征的语义理解。
    本论文的重点则在于提出一种基于时尚元素标签自动学习的检索模型,并验证该模型在服装频道的可行性,设计与实现了针对服装频道的时尚检索系统。本论文所构建的系统主要是在己有ISimila:架构基础上进行开发,ISimila:是来源于广州电信研究院的项目,全称为云计算现场试验可视搜索能力研究,它以云计算为基础,结合利用Map Reduce2分布式计算的特点,解决大规模可扩展问题。
    本论文的主要贡献在于:一是利用互联网半标注图片库,提出了一种基于时尚标签自动学习的检索模型;二是为深入研究图片简单视觉特征与用户检索丰富语义之间的对应关系提供了丰富样本集;三是为相关服装频道检索系统提供海量数据集;四是结合Nutch和Hadoop开源项目,完成了具有通用性的网络数据抓取模块和提供了在单机条件下无法支持的大规模数据处理问题。

1.2首先

本文研究内容简述本文主要针对目前用户查询意图与系统检索结果之间存在的问题进行研究,,提出了一种基于时尚标签自动学习的检索模型,主要指利用HoG}I}(Histograms of Oriented Gradients)特征抽取图像低层特征,结合机器学习中的SVM}2} (Support Vector Machine)建立服装频道中时‘尚标签与图像低层特征的对应关系,并通过实验验证方法的可行性。其次,依据实验结果,将模型运用于生活中的实际场景之中,完成了一个基于服装频道的时尚检索系统。


摘要 4-6
Abstract 6-7
目录 8-10
第一章 概述 10-16
    1.1 论文的背景和意义 10-11
    1.2 本文研究内容简述 11-15
    1.3 本论文结构 15-16
第二章 基于内容的图像检索技术(CBIR) 16-27
    2.1 图像检索技............ 16-17
    2.2 低层图像特征 17-20
    2.3 相似性度量 20-21
    2.4 语义鸿沟 21-26
    2.5 本章小结 26-27
第三章 基于时尚............27-34
    3.1 引言 27-28
    3.2 数据准备 28
    3.3 对象—本体 28-29
    3.4 图像预处理 29-30
    3.5 特征提取(HoG) 30-31
    3.6 分类器训练 31-33
    3.7 本章小结 33-34
第四章 系统需求分析 34-42
    4.1 系统的功能和性能需求分析 34-35
    4.2 图像抓取............ 35
    4.3 分类器训练............ 35-36
    4.4 分类标注模块的功能和性能分析 36
    4.5 系统详细数据流分析 36-40
    4.6 系统............ 40-41
    4.7 本章小结 41-42
参考文献 69-74
致谢 74

总结
    随着互联网的不断普及,以及第三次互联网产业革命“云计算”的蓬勃发展,大规模数据处理成为研究者们趋之若鹜的方向之一。作为数据的重要代表一“图像”不仅能绘声绘色的描述人们生活中的所见所闻,更能利用“图像”为人们的生活带来便捷。
    基于图像的检索系统,历经了从依靠文本到低层图像特征,从低层图像特征到高层图像语义两次跨越。而应用于服装场景的检索系统,为更直接的扑捉用户查询意图,相继出现了淘淘搜、必视谷等应用,以“商品图片”搜索“商品”的形式进行检索,通过大量的试用,发现这样的应用仍然无法彻底解决用户查询语义与图像特征之间的语义鸿沟问题。因此,本论文提出了一种基于时尚元素自动学习的检索模型,从基本时尚元素出发,解决图像特征描述的单一性与语义丰富性之间的距离。