如何使用快捷采集-以抖音短视频搜索数据采集为例

2021-7-1 18:17| 发布者: Fuller| 查看: 23304| 评论: 47

摘要: 抖音短视频因为其具有易上手,互动性强,内容有趣,社交黏度高等特点,影响力越来越广,基于抖音短视频分析的研究也变得很流行,成为了大学生毕业论文选材的一个热点。GooSeeker也及时上架了抖音关键词搜索快捷采集 ...

抖音短视频因为其具有易上手,互动性强,内容有趣,社交黏度高等特点,影响力越来越广,吸引了大量不同年龄不同职业的用户,又反过来吸引大量专业的媒体传播者入驻,形成了良性循环。

基于抖音短视频分析的研究也变得很流行,成为了大学生毕业论文选材的一个热点。

近期抖音开通了网页版,可以直接在浏览器上用关键词搜索和查看抖音短视频, 进行点赞,评论,转发。

GooSeeker也及时上架了抖音关键词搜索快捷采集,为写论文和搞研究的小伙伴们提供一个获取抖音数据的方便快捷的方法。

今天我们就介绍怎样使用快捷采集来获取抖音关键词搜索得到的短视频信息。


1,下载和安装GooSeeker网络爬虫

首先下载安装Gooseeker网络爬虫软件,最新版名字叫做:数据管家(增强版爬虫软件)

数据管家实际是一个特殊的浏览器,具有爬虫功能和数据分析功能的浏览器。

安装完毕,数据管家会自启动。关闭数据管家后,要再次启动,可双击桌面上的数据管家图标。


2,运行爬虫软件

在Gooseeker数据管家,打开集搜客官网https://www.gooseeker.com 登陆爬虫,登陆会员中心(注意爬虫账号和会员中心账号一定要一致),并检查是否已经连上服务器(绿勾连接,红勾未连接)。

详细过程不重述了,可以查阅《如何使用快捷采集-以微博签到数据采集为例》的第2步。


3,登陆抖音网站

根据使用经验,采集抖音之前,需要先登录抖音网站,才能持续浏览完整内容。

在数据管家新开一个页签,在新页签打开抖音网站 https://www.douyin.com/,并登陆一个抖音账号,一般直接用手机验证码就可以。


4,进入快捷采集页面

点击数据管家左侧边栏的“快”按钮,进入快捷采集。


5,选择合适的快捷工具

根据要采集的网页,选择 类别 - 网站 - 网页。

对于抖音来说,就是点击:热门 - 抖音 - 抖音关键词搜索采集


如下图所示,可以打开示例页面看看,确保后面操作时,添加的链接和示例页面类似。或者浏览网页下方的示例数据,进一步了解选定的快捷工具是否满足要求。


6,操作步骤

6.1 获得网址

在抖音的页面上,输入要搜索的关键词,点击搜索,把浏览器地址栏的网址复制出来。比如搜索“三峡大坝”,复制出来的网址就是:https://www.douyin.com/search/%E4%B8%89%E5%B3%A1%E5%A4%A7%E5%9D%9D?source=normal_search&aid=1e0e569c-b802-4919-ab42-9a92aa2b5702&enter_from=main_page


6.2 粘贴网址,启动采集

把上一步得到的网址用Ctrl+v粘贴到快捷工具的网址输入栏,启动采集。


6.3 采集中的爬虫窗口

点击获取数据之后,数据管家自动弹出两个采集窗口(窗口右下方有绿色的状态球),一个窗口加载网页,采集数据,一个窗口打包上传数据。两个采集窗口工作时,都不能关闭。


6.4 打包下载数据

数据管家在弹出采集窗口的同时,还弹出了一个快捷采集数据管理窗口。

采集完成后,采集状态会从橙色的“采集中”,变成绿色的”已采集”。然后打包下载数据,下载下来的数据一般保存在电脑的下载文件夹。

如果,采集不成功,采集状态会变成红色的“已停止”,这时,要检查

1. 添加的链接是否和样本页面类似;

2. 需要提前登陆的网站,是否已经登陆;

再重新采集一遍,注意观察采集窗口,网页是否正常加载,如果网页正常加载,但仍然采集失败,请在论坛或者QQ群联系集搜客官方,我们会及时测试维护这些工具。


7. 采集到的数据

抖音关键词搜索的样例数据:

15

鲜花
3

握手
3

雷人
1

路过
2

鸡蛋

刚表态过的朋友 (24 人)

发表评论

最新评论

评论 Fuller 2024-1-9 21:08
添加的链接是什么?
欣想事成: 为什么显示“抓取失败(超时),抓取规则不合适或者超时时间设置太短”啊?我需要抓取抖音搜索内容的点赞量
评论 欣想事成 2024-1-9 19:33
为什么显示“抓取失败(超时),抓取规则不合适或者超时时间设置太短”啊?我需要抓取抖音搜索内容的点赞量
评论 wangyong 2023-12-7 17:35
pppppp67888: 为什么一直显示抓取出错5555
可以再添加任务试试,目前是可以采集的
评论 pppppp67888 2023-12-5 23:49
为什么一直显示抓取出错5555
评论 maomao 2023-8-23 13:33
巨大果: 为啥抓取视频详细信息一直是抓取失败?
添加的链接要和样本页面类似,而且采集之前要登录抖音
评论 巨大果 2023-8-23 13:25
为啥抓取视频详细信息一直是抓取失败?
评论 Fuller 2023-5-8 10:21
9Nine9: 请问一下网址正确但是显示抓取出错,详情页显示“超时间隔设置过短”是什么原因?
抖音关键词搜索,一定要在抖音搜素页选择视频。
把你添加的链接发出来看看
评论 9Nine9 2023-5-7 17:41
请问一下网址正确但是显示抓取出错,详情页显示“超时间隔设置过短”是什么原因?
评论 gz51837844 2022-11-16 21:54
抖音评论的页面上没有提供评论排序的功能,是按自然显示顺序采集的。 抖音视频关键词搜索,页面上提供了3种排序:综合排序,按点赞数排序,按发布时间排序。目前快捷采集是按综合排序爬的数据。技术人员会评估是否可以上架按点赞数和发布时间排序的抖音关键词搜索快捷采集
2826691323: 采集评论的话没有按照点赞数由高到低采集吗?包括视频也是,采集规则是随机的吗?而且数据量好少
评论 2826691323 2022-11-16 14:59
采集评论的话没有按照点赞数由高到低采集吗?包括视频也是,采集规则是随机的吗?而且数据量好少
评论 gz51837844 2022-10-30 10:36
已经上线了抖音话题采集,参见这个帖子里的回复:https://www.gooseeker.com/doc/thread-9816-1-1.html
Season_66: 请问不能爬取话题里面的视频吗?例:#养生 话题里面的短视频 <a href=&quot;https://v.douyin.com/Mb3EoFc/&quot; target=&quot;_blank&quot;>https://v.douyin.com/Mb3EoFc/</a>
评论 Season_66 2022-10-30 00:25
请问不能爬取话题里面的视频吗?例:#养生 话题里面的短视频 https://v.douyin.com/Mb3EoFc/
评论 Fuller 2022-10-7 23:56
gg123123: 咋采集不了视频和图片啊
网页上有图片网址和视频文件网址才能下载。你要采集的网页是哪个?发出来我看看
评论 gg123123 2022-10-7 17:21
咋采集不了视频和图片啊
评论 Fuller 2022-9-7 15:35
抖音评论是瀑布流的,没有翻页功能,往下滚动的时候能稳定显示出来的几率比较低,能采集到900多条已经很不错了
ShanA930: 为什么显示几万条的视频评论我只采集到900多条?
评论 ShanA930 2022-9-7 15:33
为什么显示几万条的视频评论我只采集到900多条?
评论 maomao 2022-8-3 19:20
用这个爬抖音视频评论的快捷工具https://www.gooseeker.com/res/rule_804.html
Halo_June: 怎么抓取抖音评论?很急
评论 Halo_June 2022-8-3 18:02
怎么抓取抖音评论?很急
评论 maomao 2022-5-16 20:37
pachong12345678: 为什么我的一直显示已停止,说我输入的网页错误
如果你要采集关键词搜索结果,那么就用关键词搜索采集工具,而且要给关键词采集工具添加搜索结果网页的网址;如果你要采集某条视频的评论,那么就要选用视频评论采集工具,而且要给视频评论采集工具添加某条视频的网址
评论 pachong12345678 2022-5-16 20:30
为什么我的一直显示已停止,说我输入的网页错误

查看全部评论(47)

GMT+8, 2024-3-29 20:19