本帖最后由 tuesday1 于 2018-9-22 08:25 编辑

规则名:汽车_亚马逊商品表              亚马逊的商品搜索列表,对不同的搜索词,页面的显示有稍稍不同,也做了嵌套,但是规则还是不能通用。
对于这个网址是可以的:   https://www.amazon.cn/s/ref=amb_link_1?ie=UTF8&bbn=1774808071&rh=i%3Aautomotive%2Cn%3A2126200051%2Cn%3A1774808071%2Cn%3A%212146614051%2Cn%3A%212146613051%2Cn%3A1947899051&pf_rd_m=A1AJ19PSB66TGU&pf_rd_s=merchandised-search-left-9&pf_rd_r=T9WWTQ3H46E0WQZ2K46T&pf_rd_r=T9WWTQ3H46E0WQZ2K46T&pf_rd_t=101&pf_rd_p=a0c4b942-e3cf-4771-ba92-67136b3ea67e&pf_rd_p=a0c4b942-e3cf-4771-ba92-67136b3ea67e&pf_rd_i=1947899051

对于这个网址就不行:https://www.amazon.cn/s/ref=amb_link_85?ie=UTF8&bbn=1774812071&rh=i%3Aautomotive%2Cn%3A1947899051%2Cn%3A%212146613051%2Cn%3A%212146614051%2Cn%3A1774812071%2Cn%3A255995071&pf_rd_m=A1AJ19PSB66TGU&pf_rd_s=merchandised-search-left-9&pf_rd_r=T9WWTQ3H46E0WQZ2K46T&pf_rd_r=T9WWTQ3H46E0WQZ2K46T&pf_rd_t=101&pf_rd_p=a0c4b942-e3cf-4771-ba92-67136b3ea67e&pf_rd_p=a0c4b942-e3cf-4771-ba92-67136b3ea67e&pf_rd_i=1947899051


举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2018-9-25 22:36

沙发
Fuller 管理员 发表于 2018-9-22 09:45:35 | 只看该作者


样例复制的那个子容器,虽然没有做定位标志映射,也会自动选择一个,因为是偏好是class,所以,选择了这个很长的class,亚马逊网站上的class都很长,而且会变化,可能是这个原因造成的,应该设置定位偏好为只用id
举报 使用道具
板凳
Fuller 管理员 发表于 2018-9-22 09:54:24 | 只看该作者


我前一个跟帖说的方法还是不行,发现代表产品列表的网页区块的那个div的id是变化的。可能要在同一个主题下做多个规则
举报 使用道具
地板
xyxiong007 中级会员 发表于 2018-9-25 11:29:47 | 只看该作者
我是觉得奇怪,在中国 amazon.cn又不是主流平台,为什么研究它? 何不研究淘宝天猫,京东?莫非是先拿amazon.cn练手,然后再在amazon.com或者欧洲站点上去试?
举报 使用道具
5#
文学作品动态扫描 金牌会员 发表于 2018-9-25 22:36:05 | 只看该作者
xyxiong007 发表于 2018-9-25 11:29
我是觉得奇怪,在中国 amazon.cn又不是主流平台,为什么研究它? 何不研究淘宝天猫,京东?莫非是先拿amazon ...

研究目的各不一样,说不定楼主用这些数据做很酷的事情
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 21:37