52 52836

泰國網頁資訊爬取問題

Wei_AA25 于 2020-9-22 10:22 发表 [复制链接]
wangyong 版主 发表于 2020-9-23 16:41:10 | 显示全部楼层
Wei_AA25 发表于 2020-9-23 16:18
管理員您好!

我剛剛試著做了一次

是现在数据管家中点击一下按钮,出来右侧弹窗后,启动谋数台进行定义规则
aa222.png
举报 使用道具
Wei_AA25 中级会员 发表于 2020-9-23 16:57:34 | 显示全部楼层
wangyong 发表于 2020-9-23 16:41
是现在数据管家中点击一下按钮,出来右侧弹窗后,启动谋数台进行定义规则

...

我是這麼做沒錯!
不過我需要採集下一筆的資訊進行複製樣例卻無法顯示QQ
举报 使用道具
wangyong 版主 发表于 2020-9-23 17:20:48 | 显示全部楼层
Wei_AA25 发表于 2020-9-23 16:57
我是這麼做沒錯!
不過我需要採集下一筆的資訊進行複製樣例卻無法顯示QQ
...

这种情况就需要用到连续动作的点击动作了,看这个教程:https://www.gooseeker.com/doc/article-288-1.html
举报 使用道具
Wei_AA25 中级会员 发表于 2020-9-24 09:21:39 | 显示全部楼层
wangyong 发表于 2020-9-23 17:20
这种情况就需要用到连续动作的点击动作了,看这个教程:https://www.gooseeker.com/doc/article-288-1.ht ...

我試過了
這個網頁使用使用點擊操作
他的XPATH讓我有點搞不懂是怎麼回事
举报 使用道具
wangyong 版主 发表于 2020-9-24 09:46:38 | 显示全部楼层
Wei_AA25 发表于 2020-9-24 09:21
我試過了
這個網頁使用使用點擊操作
他的XPATH讓我有點搞不懂是怎麼回事

用这个xpath就可以
  1. //*[@class='clickable-row']/td[position()=1]
复制代码


举报 使用道具
Wei_AA25 中级会员 发表于 2020-9-24 10:32:05 | 显示全部楼层
wangyong 发表于 2020-9-24 09:46
用这个xpath就可以

您好!

我採集到的資料是HTML檔而不是XML檔Q___Q
請問我是哪裡有設置錯誤 ?
附上圖片
擷取.PNG
举报 使用道具
wangyong 版主 发表于 2020-9-24 14:43:48 | 显示全部楼层
Wei_AA25 发表于 2020-9-24 10:32
您好!

我採集到的資料是HTML檔而不是XML檔Q___Q

这不是采集的最终结果,最终结果是xml还是在你之前的目录下
举报 使用道具
Wei_AA25 中级会员 发表于 2020-9-24 14:53:26 | 显示全部楼层
wangyong 发表于 2020-9-24 14:43
这不是采集的最终结果,最终结果是xml还是在你之前的目录下

您好!

我的資料夾內是沒有任何資料的
我在想會不會是我設置錯了
我想請問我在點擊這個步驟這樣的設置是對的嗎 ?

擷取.PNG
举报 使用道具
wangyong 版主 发表于 2020-9-24 16:03:09 | 显示全部楼层
Wei_AA25 发表于 2020-9-24 14:53
您好!

我的資料夾內是沒有任何資料的

不对,你再看一下我之前发的连续动作的教程,第一级规则是做动作,第二级规则是执行抓取,所以目标规则名应该填的是另一个

举报 使用道具
Wei_AA25 中级会员 发表于 2020-9-24 16:32:44 | 显示全部楼层
本帖最后由 Wei_AA25 于 2020-9-24 16:33 编辑
wangyong 发表于 2020-9-24 16:03
不对,你再看一下我之前发的连续动作的教程,第一级规则是做动作,第二级规则是执行抓取,所以目标规则名 ...

您好!謝謝您的指導
我照著做後,還是抓不到
以下附上我目前所做的規則
再麻煩您不吝指教!

(圖片附註打錯了抱歉><)

做動作-1

做動作-1

做動作-2

做動作-2

做抓取-1

做抓取-1

做抓取-2

做抓取-2

做抓取-3

做抓取-3
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 15:58