基于依存句法分析的社会媒体文本挖掘方法——以饮食习惯特色分析为例
Dependency Parsing-Based Social Media Text Mining——a Case Study in Analysis of Weibo Users'Eating Habits作者机构:哈尔滨工业大学社会计算与信息检索研究中心黑龙江哈尔滨150001
出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)
年 卷 期:2014年第28卷第6期
页 面:208-215页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点基础研究发展计划(973计划)(2014CB340503) 国家自然科学基金面上项目(61370164) 国家自然科学基金重点项目(61133012)
摘 要:在进行社会媒体文本挖掘时,传统的基于词表的方法,存在准确率较低、词表难获得等问题。该文提出一种基于依存句法分析的文本挖掘方法,通过规则匹配的方式从社会媒体文本中提取信息。该方法不依赖词表,且实验证明了相比基于词表的方法在准确率上有大幅提高。应用基于依存句法分析的文本挖掘方法,我们在微博文本上进行了饮食习惯特色分析,实现了性别、地区、时间等维度的饮食习惯特色分析并可进行交叉分析,最终用词云的方式展示了结果。