21#
Fuller 管理员 发表于 2019-9-13 17:47:14 | 只看该作者
虽然我没有仔细去想这个题怎么解,但是我认为解这个题不需要太多数据,最多用数据验证一下。而且从网站上下载的数据不一定真实。这个题是个典型的决策模型,没有数据都能把海盗分金子的策略做出来,这个也照样可以做
举报 使用道具
22#
Fuller 管理员 发表于 2019-9-13 17:50:45 | 只看该作者
ghhh_ioi 发表于 2019-9-13 17:49
一直显示我没有线索是什么意思?怎么解决这个问题呢,求大佬解答

因为只有一个网址,采集完一遍就没有了,要重新激活。虽然有自动激活方式,但是免费版的激活频率比较低
举报 使用道具
23#
SHUXUEJIANMOHAIWO 新手上路 发表于 2019-9-13 17:55:12 | 只看该作者
Fuller 发表于 2019-9-13 17:38
这个网页特别简单,自己用python写个小程序就能采集下来,也可以用我们的网络爬虫,不过要用旗舰版才能定时 ...

怎么写python的小程序 爬取首都机场的数据呀,求能说的清楚一点吗

举报 使用道具
24#
Fuller 管理员 发表于 2019-9-13 18:05:37 | 只看该作者
SHUXUEJIANMOHAIWO 发表于 2019-9-13 17:55
怎么写python的小程序 爬取首都机场的数据呀,求能说的清楚一点吗

有个最简单的方法是用这个例子:https://www.gooseeker.com/doc/thread-1688-1-1.html

把里面的网址替换成目标网址,用到的xslt规则可以从集搜客爬虫上拷贝出来。就是先下载我共享出来的规则,然后用集搜客爬虫加载这个规则,加载规则方法:https://www.gooseeker.com/doc/article-124-1.html

然后点击工作台上的测试按钮,就能看到数据规则,拷贝出来就行


你的程序要写成一个循环,每分钟循环采集一次
举报 使用道具
25#
狸子 新手上路 发表于 2019-9-13 18:25:53 | 只看该作者
请叫我范坚强 发表于 2019-9-13 17:43
能提供数据吗,非常感谢

我也想问问能不能提供一下数据;w;
一生平
举报 使用道具
26#
1475997981 新手上路 发表于 2019-9-13 18:54:09 | 只看该作者
Fuller 发表于 2019-9-13 18:05
有个最简单的方法是用这个例子:https://www.gooseeker.com/doc/thread-1688-1-1.html

把里面的网址替换 ...

请问下载规则之后怎么查看原始抓取数据的网址
举报 使用道具
27#
策马奔腾向前冲 新手上路 发表于 2019-9-13 19:00:01 | 只看该作者
Fuller 发表于 2019-9-13 17:07
下载我这个规则,上面有目标网址:https://www.gooseeker.com/secure/me/Fuller_preview/share465638.htm ...

必须购买会员才能下载出租车数据吗?
举报 使用道具
28#
Fuller 管理员 发表于 2019-9-13 19:05:32 | 只看该作者
策马奔腾向前冲 发表于 2019-9-13 19:00
必须购买会员才能下载出租车数据吗?

运行爬虫本来是免费的,为了答题,可能需要高频率地重复采集,这个高频率采集功能是旗舰版的。

但是,我觉得这个数据帮助不大。

如果确实想采集一下试试,回复一下“申请试用旗舰版”,管理员会帮你开通几天试用期
举报 使用道具
29#
Fuller 管理员 发表于 2019-9-13 19:07:54 | 只看该作者
1475997981 发表于 2019-9-13 18:54
请问下载规则之后怎么查看原始抓取数据的网址

下载规则以后,这个规则就是你的了,按照这个教程,可以把规则加载到工作台上,就能看到规则定义的情况,也能做测试,也能把自动生成的xslt脚本拷贝出来:https://www.gooseeker.com/doc/article-124-1.html
举报 使用道具
30#
策马奔腾向前冲 新手上路 发表于 2019-9-13 19:22:53 | 只看该作者
Fuller 发表于 2019-9-13 19:05
运行爬虫本来是免费的,为了答题,可能需要高频率地重复采集,这个高频率采集功能是旗舰版的。

但是,我 ...

申请试用旗舰版
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 14:59