翻页抓取,选择“下一页”时,出现这种情况,怎么办   


举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2016-11-10 13:13

沙发
HJLing 版主 发表于 2016-11-10 11:40:17 | 只看该作者
直观标注只适用于抓取内容的映射 对于线索不能像你那样 要在DOM里找到“下一页”对应的text节点 然后做映射
详细看教程《翻页采集

举报 使用道具
板凳
Fuller 管理员 发表于 2016-11-10 11:45:37 | 只看该作者
你选择的记号是哪一个?截个图看看。我看看是什么内容需要转义
举报 使用道具
地板
Fuller 管理员 发表于 2016-11-10 11:48:13 | 只看该作者
根据你第二张截图看,你做记号映射的时候没有精确地选择DOM节点,而是选了一个A节点,你的截图虽然不全,但是可以看到这个节点含有@href属性,所以,应该是A节点。 元素节点不能用于记号映射,应该用A中的text,或者@href等属性
举报 使用道具
5#
A2467800302 初级会员 发表于 2016-11-10 13:10:48 | 只看该作者
HJLing 发表于 2016-11-10 11:40
直观标注只适用于抓取内容的映射 对于线索不能像你那样 要在DOM里找到“下一页”对应的text节点 然后做映射 ...

恩恩,我按你说的试了试,可以了,谢谢
举报 使用道具
6#
A2467800302 初级会员 发表于 2016-11-10 13:13:42 | 只看该作者
Fuller 发表于 2016-11-10 11:48
根据你第二张截图看,你做记号映射的时候没有精确地选择DOM节点,而是选了一个A节点,你的截图虽然不全,但 ...

恩恩,可以啦,谢谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 16:00