校园WiFi用户轨迹数据聚类算法研究与应用
作者单位:天津理工大学
学位级别:硕士
导师姓名:王法玉;朱玉来
授予年度:2022年
学科分类:080904[工学-电磁场与微波技术] 0810[工学-信息与通信工程] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 0809[工学-电子科学与技术(可授工学、理学学位)] 08[工学] 080402[工学-测试计量技术及仪器] 0804[工学-仪器科学与技术] 081001[工学-通信与信息系统]
主 题:聚类算法 DBSCAN算法 Hausdorff距离 Frechet距离 WiFi数据
摘 要:随着学校无线网络的覆盖以及移动智能终端的广泛普及,师生在使用无线网络的过程中,产生了大量的无线网络数据,其中蕴含着师生的校园轨迹数据。为了高效地从这些纷繁复杂的数据中提取有价值的轨迹数据,挖掘轨迹移动规律,进行聚类分析并应用到实际教育教学中,选择合适的轨迹聚类算法尤为重要。基于此背景开展相关研究工作,主要工作如下:(1)依据轨迹数据特征,选择DBSCAN算法进行优化,提出HFDBSCAN算法模型。首先,采用Hausdorff距离和Frechet距离相结合的距离公式,优化应用在DBSCAN算法的邻域距离计算上;其次,引入宫格法搜索邻域范围,降低算法时间复杂度;最后,提出改进的动态特征轨迹提取方法适应校园复杂的轨迹,灵活精准地提取聚类之后的特征轨迹,高效定量地描述轨迹整体运动规律。以校园Wi Fi数据为例,实验结果表明,对比其他聚类算法,本文提出的算法在运行效率、存储空间、准确度、内聚度和分离度方面更适合轨迹分类,优于其他算法。(2)对HF-DBSCAN算法开展应用研究。应用Fin BI清晰直观地展示轨迹聚类路径和特征轨迹提取效果。应用Superset连接数据库,根据实际应用场景对轨迹聚类数据进行查询,对查询结果进行可视化展示,进一步探索学生群体行为和个体行为的规律。运用改进的算法训练轨迹预测模型,提高预测准确率。结果表明,本文提出的改进的聚类算法有较好的应用效果。本文的研究有助于挖掘校园内轨迹移动规律,丰富和详实轨迹聚类方面的研究与应用,为相关科研工作提供思路。