基于语义相似度的标签优化
Tag optimization based on semantic similarity作者机构:南京理工大学计算机科学与工程学院江苏南京210094
出 版 物:《山东大学学报(工学版)》 (Journal of Shandong University(Engineering Science))
年 卷 期:2015年第45卷第2期
页 面:37-42页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:江苏省"六大人才高峰"资助项目
主 题:社交媒体 标签优化 电影标签 语义相似度 内容相似度
摘 要:为解决社交媒体中标签的缺失、错误等问题,提出一种基于内容相似度和语义相似度的标签优化方法。首先利用TF-IDF(term frequency—inverse document frequency)计算文本间相似度,然后利用文本间相似度与标签相似度的一致性定义了目标函数,最后加入了修正项来减少优化前后用户提供标签的偏差。将目标函数应用到豆瓣电影标签进行优化,并将结果与原标签进行比较分析。与原标签相比,优化后的标签准确性得到了提高。试验结果表明,该方法能够有效地优化标签,有效解决标签缺失和错误等问题。