基于DPI的用户兴趣实时分类
A real time approach to user interest classification using DPI作者机构:中国电信股份有限公司广州研究院广东广州510630 广东工业大学计算机学院广东广州510006 广州优亿信息科技有限公司广东广州510630
出 版 物:《电信科学》 (Telecommunications Science)
年 卷 期:2016年第32卷第12期
页 面:109-115页
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:DPI URL分类 文本分类 n-gram Doc2Vec
摘 要:近年来,随着大数据发展热潮兴起,电信运营商能获得的DPI数据规模越来越大。如何对如此海量的DPI数据进行实时的挖掘和分类是运营商研究的热点。设计了一种基于混合n-gram特征的URL分类算法和基于Doc2Vec模型的文本分类算法相结合的DPI数据分类方法,大大提高了DPI数据的分类速度和分类准确率,为电信运营商进行精准营销提供了良好的基础。