【启动采集前的配置】

  • 预先登陆网站:是
  • 配置打码平台:否

【运行方法】— 详见数据DIY图文教程

  • 用GS爬虫浏览器或者是安装了爬虫软件的火狐浏览器访问知乎_他的所有回答列表采集页面;
  • 输入一个或多个搜索结果网址,然后点击“获取数据”;
  • 点击“启动采集”按钮,采集完成后点击“打包”按钮,就可以下载数据了。

【常见问题】— 欢迎跟帖留言
举报 使用道具
| 回复

共 20 个关于本帖的回复 最后回复于 2023-3-26 11:44

林Bobbi 新手上路 发表于 2017-4-22 18:48:17 | 显示全部楼层
他的所有回答列表采集出来的结果都是null,试了好几个用户的都这样
举报 使用道具
ym 版主 发表于 2017-4-22 19:43:57 | 显示全部楼层
林Bobbi 发表于 2017-4-22 18:48
他的所有回答列表采集出来的结果都是null,试了好几个用户的都这样

因为这个网页结构改变了,规则失效导致的,现在已经更新好规则,能正常抓数据了。
举报 使用道具
shixiaooooo 新手上路 发表于 2017-12-27 19:16:04 | 显示全部楼层
为什么问题内容不显示?下载下来的数据问题列全是空白
举报 使用道具
wangyong 版主 发表于 2017-12-27 19:22:09 | 显示全部楼层
你添加的链接是什么?  要和样本页面一致
采集知乎要先修改GS浏览器的useragent,还要在GS浏览器上登录知乎
QQ截图20171227192006.png
举报 使用道具
shixiaooooo 新手上路 发表于 2017-12-27 21:36:12 | 显示全部楼层
wangyong 发表于 2017-12-27 19:22
你添加的链接是什么?  要和样本页面一致
采集知乎要先修改GS浏览器的useragent,还要在GS浏览器上登录知乎 ...

按照所说的修改useragent+登录知乎,但是重新抓取的数据内容里仍然没有问题内容><

举报 使用道具
bowieD 金牌会员 发表于 2017-12-28 09:22:24 | 显示全部楼层
shixiaooooo 发表于 2017-12-27 21:36
按照所说的修改useragent+登录知乎,但是重新抓取的数据内容里仍然没有问题内容><

...

把你采集下来的数据截图看一下。
举报 使用道具
shixiaooooo 新手上路 发表于 2017-12-28 13:49:35 | 显示全部楼层
OK 麻烦看一下,此处抓取下来的【问题】列是空白,同样地,如果抓取【他的所有提问列表】也会出现空白,或不全的情况

1514439920(1).png
举报 使用道具
shixiaooooo 新手上路 发表于 2017-12-28 14:01:16 | 显示全部楼层
【抓取提问列表】刚有再尝试一下没有问题,但是这个回答列表采集还是有些问题的喔
1514440850(1).png
举报 使用道具
何波波 金牌会员 发表于 2017-12-28 14:38:55 | 显示全部楼层
你加的是什么链接?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 22:47