80 83591

新浪微博_博主主页

ym 于 2015-8-13 15:22 发表 [复制链接]
AliciaXing 新手上路 发表于 2016-3-10 20:48:17 | 显示全部楼层
为什么显示抓取规则不合适或者超时时间设置太短
举报 使用道具
Fuller 管理员 发表于 2016-3-10 21:51:34 | 显示全部楼层
超时时间设置了多少?不要太短了。另外,抓微博一定要登录了微博以后再抓
举报 使用道具
Fuller 管理员 发表于 2016-3-11 08:32:56 | 显示全部楼层
微博工具箱已经上线两个工具了,这个规则可以不用下载,工具箱更好用:http://www.gooseeker.com/land/weibo.html
举报 使用道具
Wenson 新手上路 发表于 2016-3-13 15:25:46 | 显示全部楼层
总是会超时报错,然后连数据也无法导出,请问可以手动停止吗?
举报 使用道具
ml1691221 初级会员 发表于 2016-3-14 11:20:29 | 显示全部楼层
博主,是不是新浪微博的网页结构发生变化了,上周抓的还好好的,今天来抓最后的70多个用户,一套抓下来能用的就10个,其他的都在第一页翻页失败了,完了就超时跳过去了,有时间管理员测试下?
举报 使用道具
Fuller 管理员 发表于 2016-3-14 12:17:42 | 显示全部楼层
ml1691221 发表于 2016-3-14 11:20
博主,是不是新浪微博的网页结构发生变化了,上周抓的还好好的,今天来抓最后的70多个用户,一套抓下来能用 ...

我们检查一下,昨天晚上还是好的。

我最担心你的账号是不是被封锁了?一个微博账号一天控制在2000个网页以内。要换账号,清cookie
举报 使用道具
ym 版主 发表于 2016-3-14 14:24:12 | 显示全部楼层
ml1691221 发表于 2016-3-14 11:20
博主,是不是新浪微博的网页结构发生变化了,上周抓的还好好的,今天来抓最后的70多个用户,一套抓下来能用 ...

网页结构没有变化,博主的采集规则也是正常的,你的情况应该是新浪微博反爬虫监测造成的,检查一下微博账号是否被封了,并且要定期清理cookies,定期切换微博账号(1或2天),或者换台电脑采集
举报 使用道具
ml1691221 初级会员 发表于 2016-3-14 15:01:51 | 显示全部楼层
ym 发表于 2016-3-14 14:24
网页结构没有变化,博主的采集规则也是正常的,你的情况应该是新浪微博反爬虫监测造成的,检查一下微博账 ...

我换了三个账号同样的问题。。可能是电脑因素吧。。哎。。解决地头好大
举报 使用道具
Fuller 管理员 发表于 2016-3-14 16:28:01 | 显示全部楼层
ml1691221 发表于 2016-3-14 15:01
我换了三个账号同样的问题。。可能是电脑因素吧。。哎。。解决地头好大 ...

加入QQ群,让GooSeeker的技术支持人员协助一下,比如这个群:GooSeeker网页抓取工具 242144153
举报 使用道具
lovegooseeker 新手上路 发表于 2016-3-30 14:12:58 | 显示全部楼层
爬虫
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 03:11