管理工程论文栏目提供最新管理工程论文格式、管理工程硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于视频弹幕的视频流行度和用户关注度影响因素探讨

日期:2023年09月04日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:360
论文价格:150元/篇 论文编号:lw202308311539462102 论文字数:38555 所属栏目:管理工程论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇管理工程论文,本文基于国内具有代表性的弹幕视频网站Bilibili的个人用户,考虑用户参与中最重要的两个方式——弹幕和评论,探究视频社区中用户互动行为和视频贡献行为对视频流行度和用户关注度的影响。

1 绪

1.1 研究背景及意义

1.1.1 研究背景

根据CNNIC(中国互联网信息中心)在2021年6月发布的《中国互联网网络发展状况统计报告》[1],截止2021年6月,与2020年12月相比,网友的数量规模已经突破了10亿大关,来到了10.11亿,其中网络视频用户表现趋势如图1-1所示,从2018年至2021年,我国互联网视频用户规模、用户使用率都有了大规模增长,相较于2018年来说,用户规模增长了2.3亿人,提升了32%。

管理工程论文怎么写

近年以来,网络视频的形式得到了极大的发展,发展成了包括短视频、自创视频、长视频等多类型、高丰富度的视频体系。同时视频行业更加注重用户在观看视频时的用户体验,增加了包括吐槽、泡泡圈、弹幕等视频功能,也让视频的内容体系极大发展,扩展了视频维度。

1.2 研究内容

本文基于相关理论,提出关于视频流行度和用户关注度影响因素的相关研究假设与理论模型。通过对评论和弹幕的情感分析,得到评论和弹幕的情感强度,并且基于视频弹幕的短文本口语化特点,构建适用于弹幕的情感词典,考虑羊群效应加成效果,并融合情绪衰减模型,计算弹幕的情感强度。最后以哔哩哔哩网站视频数据为例,进行回归分析,验证假设。

本文用到的研究方法主要有情感分析、实证分析等。

(1)  情感分析

本文利用情感分析的方法,分析计算视频评论和弹幕文本的情感强度,得出情感强度的具体得分数值,以此作为自变量的数据。

(2)  实证分析

本文通过SPSS数据分析软件对用户互动行为和视频贡献行为等变量进行实证分析,以此来验证本文提出的关于视频流行度和用户关注度影响因素的假设。 

2 国内外研究综

2.1 视频流行度相关研究

视频流行度指视频网站中视频受网站用户的欢迎程度,通过视频流行度可以衡量视频的影响面等诸多信息,视频流行度有很多的指标来进行综合衡量,常见的指标包括:视频点击量、视频点赞量、视频分享量、视频收藏量等等[2]。同时学术界的研究发现,视频流行度基本处于幂律分布,即投稿刚开始时视频流行度会大幅度增长,达到阈值之后增长速度会慢慢减弱,直至出现边际效应[3]。随着研究的进行,学者开始探索视频的不同因素对于视频流行度的影响以及视频流行预测模型,比如Yoganarasimhan[4]等人的研究发现视频制作的专业度和视频流行度呈现负相关,人们更加倾向于自制的视频。

区别于电商、出行、本地生活等传统的互联网应用场景,B站作为二次元起家的视频网站,相对其他视频网站来说具有得天独厚的发展优势,而随着4G、5G的发展,视频媒介渐渐更让大众所熟知,同时随着剪辑软件的普及,短视频的普及,视频的制作成本逐年降低,使得每一个用户不论身份阶级的高低,都能快速地制作视频、传播视频、浏览视频,每个用户在社交网络中处于平等的地位,也拥有了更高的自我实现表达需求[4]。

对于视频流行度来说,学术界一方面会侧重于视频流行度的衡量,综合考虑包括视频播放量、视频分享量、视频投币量、视频收藏量等影响因素,另一方面会侧重于通过模型预测流行度;也有学者通过模型来预测视频流行度随着时间的变化趋势。在网络视频领域,通常使用视频点击量来表示视频流行度。在此基础上多集中在视频流行度的分布形式、视频流行度的预测以及影响视频流行度的因素这些方面。但是用户参与内容的生产、消费和互动对于企业的发展至关重要。因此在宽容的网络环境下,每个人作为传播者,加剧了传播裂变的速度。而B站作为社交氛围很浓厚的视频社区来说,视频遇上热点事件,通过一键三连(点赞、收藏、投币)可以实现了“滚雪球”式的连续增长。

2.2 用户关注度相关研究

关注度起源于认知心理学,指用户从其他人获取的认可度以及认同感[6],用户为了增强其关注度,一般会通过信息分享、信息传播、信息推广等手段进行个人关注度的增强并且实现个人影响的最大化。对B站等视频网站而言,用户关注度有很多维度的衡量,同时关注度也可以作为一种粉丝与用户之间的关联性[7],两者通过关注实现关联关系,粉丝对于用户的关注,增加关注度可以实现现有信息效益的最大化,同时对于粉丝群体、粉丝社区的形成有影响作用。 对于新型的B站等网络社区而言,用户关注度往往有很多直观的指标进行衡量,包括:视频播放量、视频收藏量、视频投币量、视频充电量、视频点赞量等等,在网络社区的关注度与up主个人收益、个人影响力、商业价值息息相关,这也就造成了关注度成为了一种稀有资源[8],也成为了大家争相追逐的对象。

在以往学术界对于关注度的研究上,主要关注于客观对象的关注度,类似于:房产关注度、股票关注度[9]、公司关注度、媒体关注度[6]等等。Ding等学者[10,11]研究了股票市场中股票的成交价格与交易者对于股票的关注行为之间的关联,短期来说,股票的关注度与股票的成交价格之间并没有显著的影响,往往以波动的方式来展示,长期来说,股票关注度和股票价格之间有着显著的正向影响。陈晶璞等[12]学者探寻了企业环保表现与媒体关注度之间的关联,两者之间存在明显的正向关联,当某段时间内媒体对于企业的关注度比较高时,企业会感受到环保宣传方面的压力,进而积极推进环保治理,从而企业在环保方面的表现更好。Long等[13]研究发现了旅游关注度与旅游景点的客流量之间的关系,当旅游景区周中的旅游关注度更高时,其影响力会进行辐射状扩大,进而周末的客流量也就更加客观。

3 研究模型与假设........................... 11

3.1 视频流行度的影响因素研究探究......................... 11

3.1.1 弹幕对视频流行度的影响......................... 11

3.1.2 评论对视频流行度的影响............................ 11 

4 考虑羊群效应融合情绪衰减的弹幕情感强度计算模型..................... 18

4.1 基于情感词典的情感倾向计算方法....................... 18

4.1.1 弹幕文本语句分析.......................... 19

4.1.2 否定词分析........................... 20 

5 实证分析与假设验证........................... 25

5.1 数据获取与变量测量..................... 25

5.2 描述性统计分析........................... 28

5.3 相关分析.................................. 36 

5 实证分析与假设验证

5.1 数据获取与变量测量

5.1.1 数据获取

通过Python来进行整体爬虫框架的组织,通过Requests的方式来访问B站的API获取B站的up主及其视频信息,而后通过视频的Bvid获取视频的弹幕文件和评论文件。具体的流程如下:

爬虫线程池——爬虫架构——B站鉴权——B站id转化——请求网页——解析内容——本地写入 爬虫线程池:单个线程访问爬虫的时间要耗费较长的时间,为了提高效率,本文使用了多线程来实现B站数据的高效爬取,预先创建一个线程池,在爬虫运行过程中,从线程池中拿线程运行爬虫,运行完成之后将线程资源返回给线程池,实现基于上下文管理协议的线程管理。

爬虫架构:大多数网站都会有风控策略来限制单个IP的访问,为了能够并发获取网站的内容,本文采用了IP池来实现高并发下对于网站数据的访问和解析,而后配合线程池进行并发的爬取。

B站的鉴权,本文采用web端的Bilibili来获取公开的弹幕和评论,需要在web端完成鉴权,通过B站Cookie中SESSDATA来构造B站的cookie,其中的值在访问登录接口成功的时候使用set-cookie写入,完成B站用户的鉴权。

B站的id转化:在B站中存在各种类型的id,对于视频来说存在Avid、Bvid、cid,Avid为之前B站使用的视频id, cvid为投稿稿件中分P视频的id,用于获取视频的弹幕池等等,需要设计不同id之间的转换。

请求网页内容: 通过访问B站API的方式获取B站的内容,认证方式为鉴权的Cookie,访问方式为:GET、POST等,其中url参数包括视频的Avid、cid、Bvid、up主id、up主空间id等参数,使用Requests作为爬虫的标准库,Requests 继承了urllib的所有特性。

管理工程论文参考

6 结论与展望

6.1 结论

本文基于国内具有代表性的弹幕视频网站Bilibili的个人用户,考虑用户参与中最重要的两个方式——弹幕和评论,探究视频社区中用户互动行为和视频贡献行为对视频流行度和用户关注度的影响。主要有以下研究成果:

第一, 对于现在新兴的用户参与方式——弹幕,弹幕用户具有从众性,并且弹幕具有时间属性的特点,与视频内容紧密相关,本文提出了考虑羊群效应融合情绪衰减的弹幕情感强度计算方法,考虑了弹幕的从众效应与时间属性特点,首先构建了弹幕情感词典,并考虑了羊群效应带来的加成效果,融合了随时间的情绪衰减模型,最终计算弹幕的情感强度。

第二, 对于视频流行度影响因素研究,弹幕数量、弹幕情感、评论数量、评论情感、用户关注度对视频流行度具有正向的影响,并且弹幕对视频流行度的影响大于评论对视频流行度的影响,而视频发布时长对视频流行度具有负向的影响。同时进一步探究了不同发布时长对视频流行度的影响,结果显示,