1301#
gz51837844 管理员 发表于 2021-11-4 07:09:04 | 只看该作者
mistds 发表于 2021-11-3 23:58
你好,我想请问一下数据管家如何启动多个爬虫群,谢谢!

下图示例如果通过”设置“->”爬虫群“来做配置:


这篇教程《用爬虫群采集数据》介绍了如何启动爬虫群
举报 使用道具
1302#
12345wjl 新手上路 发表于 2021-11-12 15:55:04 | 只看该作者
如何爬取在博主主页中搜索关键词后的结果
举报 使用道具
1303#
wangyong 版主 发表于 2021-11-12 16:34:36 | 只看该作者
12345wjl 发表于 2021-11-12 15:55
如何爬取在博主主页中搜索关键词后的结果


在博主主页中选择全部后,在搜索框中进行搜索,搜索完后,把网址输入到博主主页采集工具
https://weibo.com/dfjb?profile_f ... 7%BE%8E%E5%9B%BD#_0
举报 使用道具
1304#
12345wjl 新手上路 发表于 2021-11-12 17:12:28 | 只看该作者
wangyong 发表于 2021-11-12 16:34
在博主主页中选择全部后,在搜索框中进行搜索,搜索完后,把网址输入到博主主页采集工具
https://weibo. ...

好的,谢谢你
举报 使用道具
1305#
18555330731 新手上路 发表于 2021-11-16 16:47:44 | 只看该作者
请问想要采集某位博主含有某关键词的所有微博,但在博主页面搜索后,网址不变,还是和原状态一样,那这样怎么采集含关键词的微博呢?谢谢
举报 使用道具
1306#
内容分析应用 金牌会员 发表于 2021-11-16 17:38:42 | 只看该作者
18555330731 发表于 2021-11-16 16:47
请问想要采集某位博主含有某关键词的所有微博,但在博主页面搜索后,网址不变,还是和原状态一样,那这样怎 ...

搜索了之后, 网址里会出现key_word参数, 比如我在博主”头条新闻“搜索关键词”新冠“, 网址变成了这样:
https://weibo.com/breakingnews?r ... 6%96%B0%E5%86%A0#_0
举报 使用道具
1307#
elsieanddonut 初级会员 发表于 2021-11-28 13:41:16 | 只看该作者
您好,请问展开全文采集如何提升速度,已经设了两个爬虫,但是太慢了
举报 使用道具
1308#
Fuller 管理员 发表于 2021-11-28 17:06:50 | 只看该作者
elsieanddonut 发表于 2021-11-28 13:41
您好,请问展开全文采集如何提升速度,已经设了两个爬虫,但是太慢了

单一一个电脑,不能再提升速度了,不然,会被微博封号。应该用多个电脑,登录同一个集搜客账号,但是,各自登录不同的微博账号,这样,他们就能分担采集任务。

旗舰版初始是5台电脑,还可以另外购买电脑配额
举报 使用道具
1309#
HJ740113927 新手上路 发表于 2021-12-9 00:03:43 | 只看该作者
请问这个采集之后有附带签到地点信息吗
举报 使用道具
1310#
小蜜蜂测试161 高级会员 发表于 2021-12-9 09:05:18 | 只看该作者
HJ740113927 发表于 2021-12-9 00:03
请问这个采集之后有附带签到地点信息吗

原微博有显示的就会采集下来,没有的采集不到
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-4 06:51