文件名称 大小(KB) 上传作者 上传日期 下载积分 下载次数 文件描述 下载
sina_msg_2014_04-06.tar.gz 25006861 admin July 9, 2014, 4:51 p.m. 840000 27 截止2014年7月4日止,第二轮新浪微博采集结果中,发布时间为2014年4月至6月的共1.57亿条微博
2014-06-10.weibo2.tar.gz 391599 admin June 10, 2014, 7:14 p.m. 2935 97 2014-06-10当天,所有爬萌用户采集的新浪微博内容
2014-06-09.weibo2.tar.gz 412393 admin June 10, 2014, 7:14 p.m. 3089 22 2014-06-09当天,所有爬萌用户采集的新浪微博内容
2014-06-08.weibo2.tar.gz 399107 admin June 10, 2014, 7:13 p.m. 2971 23 2014-06-08当天,所有爬萌用户采集的新浪微博内容
2014-06-07.weibo2.tar.gz 498624 admin June 10, 2014, 7:12 p.m. 3703 19 2014-06-07当天,所有爬萌用户采集的新浪微博内容
2014-06-06.weibo2.tar.gz 550187 admin June 10, 2014, 7:12 p.m. 4061 65 2014-06-06当天,所有爬萌用户采集的新浪微博内容
2014-06-05.weibo2.tar.gz 360841 admin June 10, 2014, 7:11 p.m. 2683 16 2014-06-05当天,所有爬萌用户采集的新浪微博内容
2014-06-04.weibo2.tar.gz 555539 admin June 10, 2014, 7:10 p.m. 4111 13 2014-06-04当天,所有爬萌用户采集的新浪微博内容
2014-06-03.weibo2.tar.gz 462300 admin June 10, 2014, 7:09 p.m. 3457 14 2014-06-03当天,所有爬萌用户采集的新浪微博内容
2014-06-02.weibo2.tar.gz 531759 admin June 10, 2014, 7:08 p.m. 4008 8 2014-06-02当天,所有爬萌用户采集的新浪微博内容
说明项目 详细说明
数据内容

本栏数据为采集到的新浪微博微博内容按天打包数据,所有打包仅包含当天所有爬萌用户采集的微博信息,不包含之前的数据

包含字段

消息ID,用户ID,用户名,屏幕名,用户头像,转发消息ID,消息内容,消息URL,来源,图片URL,音频URL,视频URL,转发数,评论数,发布时间,@用户(在第二轮微博采集(weibo2)中取消本字段,并增加  赞数,地理坐标  两个新字段)