通信业务的分布特征及建模
作者单位:北京邮电大学
学位级别:硕士
导师姓名:崔鸿雁
授予年度:2017年
学科分类:080904[工学-电磁场与微波技术] 0810[工学-信息与通信工程] 0809[工学-电子科学与技术(可授工学、理学学位)] 08[工学] 080402[工学-测试计量技术及仪器] 0804[工学-仪器科学与技术] 081001[工学-通信与信息系统]
主 题:移动互联网业务 时间间隔分布 流量分布 重尾分布 人类行为模型
摘 要:研究人类行为分布对社会的发展、城市建设、市场经济发展、信息传播、技术革新等都有着极其重要的作用,例如通过分析用户收发邮件的时间间隔分布判断病毒传播机制,通过分析用户移动步长的分布来规划交通等。对于人类行为分布的研究,经历了从人类行为分布服从指数分布到最近几年的主流思想——人类行为分布服从重尾分布,从群体到个体,从最初的简单排队模型到现在可以综合考虑多种因素的复杂模型的过程。自2005年BARABASIA L在Nature上发表的一篇名为The origin of bursts and heavy tails in human dynamics 的文章中提到人类行为具有非泊松特性,越来越多的研究表明人类行为分布符合重尾分布而不是指数分布。对于使用何种函数能够更好地拟合人类行为分布这一问题,大多数学者认为幂律分布能够很好地对其进行拟合,但针对不同业务,也有学者提出Lognormal分布、两段分布等能较好拟合。对于人类行为非泊松特性是如何产生的这一问题,研究人员又提出了许多模型来解释。如经典的任务队列模型、基于人类兴趣的模型、基于记忆的模型、偏好返回模型、周期性随机游走模型以及一些混合模型。随着智能手机的普及以及移动互联网业务的飞速发展,越来越多的人们开始使用手机浏览网页、观看视频、上网聊天、网上购物等等。因此,分析用户使用移动互联网业务分布对于深入研究人类行为特性具有重要意义。同时,新兴移动互联网业务呈爆炸性增长,大规模移动互联网业务的涌现很大可能会带来新的分布规律。因此,本文分析了两个城市所有移动网络业务用户的上网记录,从时间域、流量域来研究不同通信业务的分布规律,具体如下:首先,本文研究了两个城市用户访问即时通信业务的时间特性,分析了用户使用不同类型即时通信业务的时间间隔分布。发现该分布可以用指数和幂律分布相混合的分布来拟合,并可通过指数模型和兴趣模型相混合的模型来模拟,经验证该模型模拟效果较好。同时,发现不同地区、不同业务两段分布的拟合参数并不相同,推出这与业务的流行度有关。一般情况下,流行度越高,分布的拟合参数越大。其次,本文研究了用户使用流媒体业务、即时通信业务的流量特性,分析了用户使用不同类型业务的流量分布。发现这些业务的流量分布均服从两段幂律分布,同时用户行为具有周期性特征,分析这是造成流量分布重尾特性的原因之一。最后,研究了用户使用不同业务的流量比重分布,发现业务类型的使用流量比重分布符合三种分布类型:U型分布、跳尾分布和长尾分布,并分析了不同业务和分布的对应关系。