1绪论
1.1研究背景及意义
1. 1. 1研究背景
微博(Micro-blog)是一种微型博客,用户在微博中可以及时的编写简短文本(例如新浪微博要求少于140字)并根据自己意愿公开发布,微博可以被任何人或者只能由用户选择的可见阅读群组阅读。与传统的博客(Blog)相比,微博文本容量较小,文字更加简短,用户可以随时随地更新,而且传播速度十分迅速。现在的微博不仅仅是社交平台,还是不可忽视的社会媒体。在微博平台中,用户通过关注形成的人际关系网,用户发布的信息通过转发等方式以病毒的方式飞速传播。这使得微博不仅仅是扩大人际圈实现社会交往的社交网络,更是获取最新资讯和各方评论信息的重要媒介。
随着移动互联网技术的不断进步和发展,更多的用户选择手机和其他移动终端设备连接到网络当中。由于其便捷性和可以随时随地更新的特性,微博作为社交网络服务( Social Networking Service, SNS)的后起之秀渐渐引起了人们的关注。与其他社交网站相比,微博具有很多其他网站所不具备的优势:第一,微博文字较少,入门门槛低,不需要太多的时间,任何人都可以轻松使用;第二,微博中用户的联系是有强弱之分的,主动和被动的形式建立起有方向的联系,能够同时满足用户多层次的社交需求;第三,微博强大的信息传递能力吸引了很多网站和机构等的参与和加入,微博已经不仅仅是朋友之间建立联系的平台,通过广告投放、名人效应等策略成功地吸引了用户;第四,微博利用用户之间的关系和信息的传递形成了巨大的信息网络,信息以病毒传播式的快速并大范围的扩散,使得微博比现有的媒体有更好的时效性和影响力,这为微博带来了大量有信息需求的用户,推动了微博发展。这些特点使得微博在多种社交网站中异军突起,短时间内聚集起大量用户。截至2012年2月国内最大的微博网站—新浪微博,注册用户数量已经超过3亿,用户日均发布微博数量超过1亿条,每天活跃用户占全站用户9%以上
流蕴含商机,微博庞大的川户数量和信息的飞速传播使得微博成为十分高效的广告平台。微博营销成为许多学者研究的垂点和众多企业不可忽视的新型营销手段。推出而向微博营销的服务和广告产况:可以为微博网站带来利润。Twitte推出了PromotedTweets告产品(信息流广告),调研公司Lab42的报告显示,Twitte用户对信息流厂一告产的反馈较好。约一半以微博用户关注了1-10个品牌。大多数Twitter用户对信息流一告比较支持的态度:24.8%用户称他们接触到的信息流广告与他们相关;21.6%的用户通过信息流广告得到了实惠;21.2%用户通过信息流广告发现了喜欢的新品牌。认为信息流广告对他们的正常使用造成干扰,对此比较反感的用户只占不到10% 另外,14%的被访问者表示曾经转发过信息流广告内容。通过以上数据可知,对于微博网站,帮助用户更迅速的找到他们感兴趣的信息,减少用户不感兴趣的信息,以更好的提高用户的满意度。想要提高用户体验,增加网站的盈利需要投放的广告更加精确。
精准广告的投放需要了解用户的兴趣,用户兴趣建模是微博营销的基础,是实现精准广告投放不可或缺的前提条件和核心要素,因此本文对微博用户兴趣挖掘和建模方法展开了研究。
1.1. 2研究意义
本文的研究从理论层面和应用价值两方面考虑,均具有重要的意义:
(1)理论意义:
从理论层面,本研究充分的考虑了微博不同于其他网站的特性,提出了用户兴趣建模的新思路。用户使用微博时点击较少,微博博文的文本信息也较少,单纯将传统用兴趣研究中使用的用户兴趣信息(如点击,浏览时间和文本)引入微博用户兴,哑研究并不适合。本文提出了用关注的特殊用户作为微博用户兴趣信息的新思路,然后根据微阵用户兴趣信息的特点给出了更适合微博用户的兴趣建模方法。
(2)应用价值:
微博网站可以通过提供微博营销服务和投放广告获得利润。调查显示精准一告能帮助用户找到自己感兴趣的商品又不会影响用户的体验,精准广一告投放技术的好坏直接影响用户的满意度和广告的效果,从而影响微博网站的利洁况。精准广琦,投放需要了解用户的兴趣,因此用户兴趣建模技术是精准广告的荃础和实现的条件。好的用户兴趣建模技术可以得到更加准确的用户兴趣模型,为网站来史大的利润。因此,微博用户兴趣挖掘和建模方法的研究,对微博网站提高,满怠度,实现撤利和发展有很大的作。
2用户兴趣建模相关研究综述
对于用户兴趣建模问题困外的学者相对较的研究,取得的成果也比较多。Fragoudis和Likothanassis通过对应JLIRA, Letizia等儿个经典的个性化务系统,的用户兴趣建模方法进行了分析和综述,得出兴趣建模方法。Huang He等提出一种通过形式概念分析技术从鉴的行为链接(URL)的点击,获取用户感兴趣和不感兴趣的,对上进行训练,然后关键词的期望信息增益.
2 微博用户兴趣信息................15-29
2.1 微博中的信息................ 15-18
2.1.1 用户信息................ 16
2.1.2 微博信息................ 16-18
2.2 微博用户行为................ 18-22
2.2.1 微博用户行为................ 18
2.2.2 面向微博用户................ 18-22
2.3 微博用户兴趣信息................ 22-26
2.3.1 微博博文................ 22-24
2.3.2 微博用户标签................ 24-25
2.3.3 微博用户相关................25-26
2.4 微博用户兴趣................ 26-27
2.4.1 微博用户兴趣................ 26
2.4.2 微博用户关注................ 26-27
2.4.3 微博用户兴趣................27
2.5 本章小结................ 27-29
3 微博用户兴趣................ 29-45
3.1 微博用户兴趣................ 29-30
3.2 微博用户兴趣................ 30-34
3.2.1 微博中的特殊................ 30-32
3.2.2 用户兴趣获取................32-34
3.3 微博用户兴趣模型的................ 34-37
3.3.1 用户兴趣模型................ 34-36
3.3.2 基于向量空间模型................ 36
3.3.3 基于细兴趣粒度................ 36-37
3.4 微博用户兴趣................ 37-40
3.4.1 用户兴趣分................38-39
3.4.2 用户兴趣分...............