本帖最后由 langjunlan 于 2018-9-21 14:47 编辑

在做规则的时候,碰到一个定位标记映射的问题,想用对列表做定位映射,
找到的class值为jltem恰好是需要抓取的7个商品才有,但是测试的结果如下:


但是清楚定位标志映射后,再测试就正确了:

不知道这个问题在哪里?
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2018-9-25 14:48

沙发
Fuller 管理员 发表于 2018-9-20 15:24:39 | 只看该作者
主题名是什么?那个使用了定位标志映射的主题
举报 使用道具
板凳
langjunlan 初级会员 发表于 2018-9-21 15:12:12 | 只看该作者

哈哈,已经修改规则解决了,自己的定位做的太好。现在有个新的问题,有7个商品就第三个的商品名空缺
举报 使用道具
地板
Fuller 管理员 发表于 2018-9-21 16:52:54 | 只看该作者
可以在网页上观察一下空缺的商品有什么特点,比如,颜色不一样,字体不一样,内容有多有少等。如果有区别,要调整规则,提高适应性。也可以扩大内容映射选择的节点的范围,比如,本来用text()做映射,可以选择包含text()的div节点,只要没有引入不需要的内容,可以适当扩大
举报 使用道具
5#
langjunlan 初级会员 发表于 2018-9-25 14:48:20 | 只看该作者
好的,谢谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 03:52