1241#
scraper 论坛元老 发表于 2021-3-24 11:34:09 | 只看该作者
15754307820 发表于 2021-3-24 11:11
任务是新建的,之前没有打包过,数据下载中没有可以下载的数据包,好几次任务都是这样,不知道是哪里出了 ...

你用的是最新的数据管家吗
https://www.gooseeker.com/pro/gooseeker.html

再检查一下服务器地址是否是https开头的

你采集的网络有什么特殊吗?例如是不是学校的网络
举报 使用道具
1242#
15754307820 初级会员 发表于 2021-3-25 14:02:40 | 只看该作者
scraper 发表于 2021-3-24 11:34
你用的是最新的数据管家吗
https://www.gooseeker.com/pro/gooseeker.html

我从10.3版本升级到10.5版本之后就恢复正常了,谢谢!
举报 使用道具
1243#
PBUHHUBP 新手上路 发表于 2021-4-7 16:33:12 | 只看该作者
为什么一键打包打不全数据呢?因为我一共采集了55个话题,但是一键打包只打包出了25个话题的数据呢,我重新试了一遍也一样。而且我的积分也没有使用完。
举报 使用道具
1244#
Fuller 管理员 发表于 2021-4-7 16:38:30 | 只看该作者
PBUHHUBP 发表于 2021-4-7 16:33
为什么一键打包打不全数据呢?因为我一共采集了55个话题,但是一键打包只打包出了25个话题的数据呢,我重新 ...

很有可能是上一次打包已经打了一部分了,那么直接下载就行了


举报 使用道具
1245#
PBUHHUBP 新手上路 发表于 2021-4-7 16:43:52 | 只看该作者
Fuller 发表于 2021-4-7 16:38
很有可能是上一次打包已经打了一部分了,那么直接下载就行了

谢谢,我是打包了两次,但是这两次压缩包里的数据是一模一样的。第二次和第一次的25个话题是一致的,剩余的打不出来。

截屏2021-04-07 下午4.42.04.png (38.56 KB, 下载次数: 499)

截屏2021-04-07 下午4.42.04.png
举报 使用道具
1246#
PBUHHUBP 新手上路 发表于 2021-4-7 16:47:53 | 只看该作者
Fuller 发表于 2021-4-7 16:38
很有可能是上一次打包已经打了一部分了,那么直接下载就行了

解决了,谢谢!!还要再问您一下,是打包过的数据,下次再打包就不会重复了吗,我怕浪费积分
举报 使用道具
1247#
Fuller 管理员 发表于 2021-4-7 17:11:54 | 只看该作者
PBUHHUBP 发表于 2021-4-7 16:47
解决了,谢谢!!还要再问您一下,是打包过的数据,下次再打包就不会重复了吗,我怕浪费积分
...

打包过的数据,下次打包不会重复,也不会扣积分。每次打包只打最新采集到的数据
举报 使用道具
1248#
PBUHHUBP 新手上路 发表于 2021-4-15 13:56:37 | 只看该作者
请问怎么抓取某一个时间段的话题数据?想设定从某时间节点开始抓取
举报 使用道具
1249#
wangyong 版主 发表于 2021-4-15 14:03:29 | 只看该作者
PBUHHUBP 发表于 2021-4-15 13:56
请问怎么抓取某一个时间段的话题数据?想设定从某时间节点开始抓取


微博关键词采集工具中输入话题,可以设置采集的时间范围
举报 使用道具
1250#
秋汐 新手上路 发表于 2021-4-19 13:51:50 | 只看该作者
不能爬取图片的url吗
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 07:33