用户网络行为多样性的统计规律研究
作者单位:北京邮电大学
学位级别:硕士
导师姓名:毕科
授予年度:2020年
学科分类:0810[工学-信息与通信工程] 02[经济学] 0202[经济学-应用经济学] 020208[经济学-统计学] 07[理学] 08[工学] 080402[工学-测试计量技术及仪器] 0804[工学-仪器科学与技术] 081001[工学-通信与信息系统] 0714[理学-统计学(可授理学、经济学学位)] 070103[理学-概率论与数理统计] 0701[理学-数学]
主 题:统计分析 多元线性回归 网络行为 知识传播 HSM模型
摘 要:随着信息社会的飞速发展,大量的用户行为从线下转移至线上,用户网络行为数据呈现出爆炸式的增长。在这数以亿计的数据规模背后,隐藏着大量的人类行为规律。一直以来,基于网络数据的用户行为研究受到海内外学者的广泛关注,有效利用与挖掘用户网络行为数据,对用户的行为规律进行分析,可以更加智能地改善用户的网络体验,个性化地提高用户生活质量。为此,本文从线上饮食与知识传播这两种线上基本行为入手,结合数据挖掘技术与多元线性回归模型,对用户线上行为的多样性规律及其演化机制展开研究。本文第一步主要研究了用户网络行为中的饮食行为多样性。首先,介绍了 Python软件与基于Requests和BeautifulSoup的数据采集原理,并借助大众点评平台,详细说明了数据采集步骤,最终获取到了 1809个用户的饮食信息。然后,以这批用户为样本,系统分析了饮食行为多样性与用户群体特征之间的相关性,并通过多元回归分析,深入探究用户饮食行为多样性与消费水平之间的关系。经研究发现,饮食行为多样性与群体的消费水平之间呈现出明显的“倒U型关系,即消费水平较低时饮食行为多样性也较为单一;随着消费水平的提高,用户的饮食行为多样性逐渐上升;当消费水平到达一定高度时,饮食行为多样性会再次趋于单一化;此外,用户性别、年龄、婚恋情况等因素与饮食行为多样性也具有相关性。基于上述研究得到的饮食行为多样性结果,可以看到用户的线上行为总是与知识的传播密不可分的,因此,本文进一步探寻了用户线上行为与知识传播之间的影响关系及其演化机制。首先介绍了基于Fiddler的手机端数据采集方式,并以抖音短视频平台为例进行了详细的步骤说明。然后,使用HSM模型,对用户线上行为与知识传播之间的关系进行分析。研究证明,在知识短视频的传播过程中,用户会更倾向于关注传播内容的本身而不是传播的情景,即社交短视频平台通过对情景式信息的弱化,向个体赋权,激励个体参与知识生产和传播。本文在需求层次理论和启发式-系统式理论模型的基础上,结合多元线性回归模型,为用户网络行为的研究提供了新的思路,并结合具体项目对常用的数据采集技术进行了详细总结,进一步促进了数据挖掘与统计分析技术在用户行为方面的应用。