社交网络挖掘方案研究
Data mining scheme of social networks作者机构:南京理工大学江苏南京210014
出 版 物:《现代电子技术》 (Modern Electronics Technique)
年 卷 期:2015年第38卷第4期
页 面:25-29,34页
学科分类:11[军事学] 0810[工学-信息与通信工程] 1105[军事学-军队指挥学] 08[工学] 0835[工学-软件工程] 081002[工学-信号与信息处理] 110503[军事学-军事通信学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:新浪微博 数据挖掘 Android SDK 新浪API 网络爬虫 信息采集
摘 要:随着社交网络普及,社交网络的数据获取成为首先要解决的问题。针对如何获取社交网站的数据,提出了基于API和网络爬虫的两种方法。通过采取对比试验,分别用两种方式在单位时间内抓取微博,比较抓取的微博条数。实验结果表明,基于API抓取的速度比较快,但是稳定性和数据完整性欠佳;基于网路爬虫方式抓取的速度比较慢,但是稳定性和数据完整性较好。最后提出通过采用两种方式相结合的方式,能够进一步提高抓取效率。