咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于社交网络数据的不可忽略无响应问题研究 收藏
基于社交网络数据的不可忽略无响应问题研究

基于社交网络数据的不可忽略无响应问题研究

作     者:李凯鑫 

作者单位:东北师范大学 

学位级别:硕士

导师姓名:王晓飞

授予年度:2022年

学科分类:050302[文学-传播学] 12[管理学] 02[经济学] 03[法学] 05[文学] 07[理学] 030301[法学-社会学] 0303[法学-社会学] 1204[管理学-公共管理] 0202[经济学-应用经济学] 020208[经济学-统计学] 0714[理学-统计学(可授理学、经济学学位)] 0503[文学-新闻传播学] 

主      题:完全非随机缺失 不可忽略的无响应 MLP 半监督分类 社交网络 GNM 

摘      要:数据缺失可以分为完全随机缺失、随机缺失和完全非随机缺失,前两种缺失机制早已有一些比较成熟的参数估计或补值方法,对于完全非随机缺失问题,至今仍比较棘手,因为通常情况下不知道真正的数据缺失机制,建立联合估计模型是处理完全非随机缺失问题的一种有效手段。大数据时代的到来让人们及时、全面地接触到了来自各行各业的各类数据,其中图结构能灵活高效地反映出数据间的复杂关系,具有良好的表现能力,涵盖了生物、化学、社交等多个领域,基于图结构数据进行的研究越来越多,对于图结构数据中出现的完全非随机缺失的研究却历历可数,大部分基于图的缺失数据问题研究还是针对完全随机缺失和随机缺失。本文针对完全非随机缺失问题,引用了现有的Graph-based joint model with Nonignorable Missingness(GNM,一种响应机制和缺失机制的联合估计模型),同时利用图数据的特殊结构结合深度学习优秀的特征提取等技术在社交网络数据集上进行半监督分类问题的研究。将原有的性能优越的GNM联合估计模型加以调整,用多层感知机取代原模型中的多元logistic分类器,灵感源于近年来多层感知机(Multi-layer Perceptrons,MLP)的重新崛起,谷歌和Facebook两大科技巨头在2021年相继提出了 MLP-Mixer和Re-parameterized Multi-layer Perceptron(RepMLP)以及国内国外的其它相关工作让人重新发现了 MLP的潜力。本文以社交网络数据集为切入点,首先将原来的两分类模型修改为适应不同数据集的多分类模型,使用单层感知机将每一类标签的非随机缺失的概率设置在90%左右,然后用多层感知机代替了原来模型中的logistic部分,调整后的模型在分类的准确率和准确率的标准差两方面都有不同程度的提升,是一次针对完全非随机缺失问题的有效尝试。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分