4.2.6 中文分词的................ 46-47
4.3 企业级搜索应用................ 47-49
4.3.1 Solr服务器................ 47-48
4.3.2 Solr的索引................ 48
4.3.3 Solr的查询................ 48-49
4.4 系统界面展示................ 49-50
4.5 本章小结................ 50-51
结论
随着互联网的快速发展,综合搜索引擎已经越来越不能够满足特定专业、特定领域人士的需求,而垂直搜索引擎由于更新速度快、面向特定专业、索引规模小、查询更加相关等特点受到了更多的关注。本文围绕垂直搜索引擎实现所需的相关技术,主要进行了一下几个方面的工作。
第一,首先介绍了垂直搜索引擎的研究背景,探讨了国内外垂直搜索引擎的研究现状,对目前垂直搜索引擎的用户情况、国内外典型的搜索引擎和垂直搜索引擎的未来发展做了详细调查和分析,然后介绍了垂直搜索引擎的体系结构、主题爬虫及全文检索技术。
第二,介绍了网页去重的相关研究,包括网页重复的原因、网页重复的类型、网页去重的意义以及常用的网页去重算法。