微博用户兴趣主题抽取方法
A Method of Micro-Blog Users' Interests Topic Extraction作者机构:电子科技大学计算机科学与工程学院成都611731 电子科技大学大数据研究中心成都611731
出 版 物:《电子科技大学学报》 (Journal of University of Electronic Science and Technology of China)
年 卷 期:2018年第47卷第4期
页 面:633-640页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 0808[工学-电气工程] 0809[工学-电子科学与技术(可授工学、理学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(61433014 61673085) 中央高校基本科研业务费专项资金(ZYGX2014Z002)
主 题:兴趣抽取 微博 Single-Pass 文本聚类 主题模型
摘 要:根据社交媒体短文本特征改进了词袋模型,利用特征之间的语义关系提出了语义表示模型,采用句子中特征先后顺序构建了次序图模型,在此基础上引入时间因素,提出了基于Single-Pass算法的用户兴趣主题模型用于抽取微博用户关注的话题。实验结果表明,该方法的FM、AA和F指标相比FSC-LDA方法分别提高了200.40%、46.50%、80.05%。