基于两层异质网络的社交短文本扩展研究
作者机构:河北大学数学与信息科学学院 河北大学管理学院
出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)
年 卷 期:2023年
核心收录:
学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:“河北省人文社会科学研究重大课题攻关项目”(项目编号:ZD202102) “河北省自然科学基金项目”(项目编号:F2022511001) “河北省教育厅科学研究项目”(项目编号:SQ2022134) “河北大学哲学社会科学重大培育项目”(项目编号:2021HPY004) “河北大学数据安全与风险防范创新团队”的研究成果之一
摘 要:[目的]为了解决社交短文本碎片化、网络用语化的问题,利用社交网络中的异质关系实现对社交短文本的扩展。[方法]基于离散度度量社交信息中热点词的不均匀度,以此改进TF-IDF方法,获取初始特征;依据社交网络中的异质关系,构建包括三个子网络的两层异质社交网络,量化网络中用户的重要程度、文本相似度以及用户对社交文本的认可度,获得多源扩展源,实现对社交短文本的扩展。[结果]与已有社交短文本扩展方法相比,本文提出的方法在准确率、召回率、F1值上最高分别提升了约13%、19%、18%。[局限]未考虑间接关系对异质社交网络构建的影响。[结论]利用社交网络中的异质关系能获得更为合理的扩展源,有效扩展社交短文本。