或者说抓取的文件不保存了
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2016-4-18 21:23

沙发
willgowell 初级会员 发表于 2016-4-17 22:21:56 | 只看该作者
1355条线索抓取了95条后就停住了,我在重新激活所有的线索后直接是一个都不抓取了。或者是不保存到本地
举报 使用道具
板凳
Fuller 管理员 发表于 2016-4-17 23:36:19 | 只看该作者
截个图看看DS打数机的界面,DS打数机的日志窗口中有什么信息
举报 使用道具
地板
ym 版主 发表于 2016-4-18 09:56:47 | 只看该作者
willgowell 发表于 2016-4-17 22:21
1355条线索抓取了95条后就停住了,我在重新激活所有的线索后直接是一个都不抓取了。或者是不保存到本地 ...

你是单搜采集的话,就要再输入线索数量。用爬虫群采集的话,再重启一下爬虫群试试
举报 使用道具
5#
willgowell 初级会员 发表于 2016-4-18 13:00:08 | 只看该作者
ym 发表于 2016-4-18 09:56
你是单搜采集的话,就要再输入线索数量。用爬虫群采集的话,再重启一下爬虫群试试 ...

我是激活后重新输入的线索数目啊,可是还是不行,没有数据保存
举报 使用道具
6#
Fuller 管理员 发表于 2016-4-18 15:39:20 | 只看该作者
截个图看看吧
举报 使用道具
7#
Fuller 管理员 发表于 2016-4-18 15:57:47 | 只看该作者
DS打数机窗口的下部是日志窗口,在那里会显示具体失败原因,截个图看看
举报 使用道具
8#
willgowell 初级会员 发表于 2016-4-18 18:40:28 | 只看该作者
Fuller 发表于 2016-4-18 15:57
DS打数机窗口的下部是日志窗口,在那里会显示具体失败原因,截个图看看

截图显示SERVER(IO)ERROR。今天我在抓取的过程中13000+条的数据,但是抓取到800来条就停止抓取了,我把DS控制台关了重启,输入剩余的线索15107,点击单搜,就不进行抓取了,一直显示抓取失败
举报 使用道具
9#
Fuller 管理员 发表于 2016-4-18 21:23:55 | 只看该作者
willgowell 发表于 2016-4-18 18:40
截图显示SERVER(IO)ERROR。今天我在抓取的过程中13000+条的数据,但是抓取到800来条就停止抓取了,我把 ...

SERVER(IO)ERROR 是不是你在DS的浏览器中看到的?这是目标网站出问题了。
可能是你采集速度太快了。你先停半天试试。

另外,在会员中心,可以为这个规则定义调度参数,里面有控制速度的参数:1,线索间等待最短时间 和 2,线索间等待最长时间,第一个数值应该小于第二个数值,这样才有效
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 02:27