11#
Fuller 管理员 发表于 2022-3-3 16:13:12 | 只看该作者
chenpengpeng01 发表于 2022-3-3 11:20
你好 现在热门话题采集是不是不能用了
我用这个链接采集的数据  不对
https://huati.weibo.cn/discovery/su ...

我测试了一下,用这个快捷采集工具:新浪微博发现-热门话题榜单 。但是,目前只能采集一页,我让技术人员检查一下。你也是只能采集一页?
举报 使用道具
12#
Fuller 管理员 发表于 2022-3-3 16:48:39 | 只看该作者
新浪微博发现-热门话题榜单 这个快捷采集工具已经修改好了,要注意一下几点:1. 要下载最新的数据管家软件采集这个网站。老版本不行,没有自动鼠标轮子的功能。
2. 因为是瀑布流网页,鼠标轮子每滚动一次就会在网页上显示更多的内容,那么采集过程就会产生大量重复数据,如果你是用积分下载数据的,会消耗大量积分。建议购买旗舰版,下载数据不扣积分
举报 使用道具
13#
chenpengpeng01 中级会员 发表于 2022-3-4 16:56:53 | 只看该作者
Fuller 发表于 2022-3-3 16:48
新浪微博发现-热门话题榜单 这个快捷采集工具已经修改好了,要注意一下几点:1. 要下载最新的数据管家软件 ...

en  我是旗舰版,确实可以了,不过能把这些超话的链接也抓到吗,里面没有跳转链接
举报 使用道具
14#
Fuller 管理员 发表于 2022-3-4 18:06:07 | 只看该作者
chenpengpeng01 发表于 2022-3-4 16:56
en  我是旗舰版,确实可以了,不过能把这些超话的链接也抓到吗,里面没有跳转链接
...

这种weibo.cn 网址,是手机网页,没有超话的链接
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 12:07