1471#
Fuller 管理员 发表于 2024-1-21 12:01:02 | 只看该作者
明镜翼 发表于 2024-1-20 23:03
您好,昨天采集微博主页功能增加了时间限制后,有很多数据就采集不到了,转发的微博也不会显示转评赞等相关 ...

你是不是在博主主页上设置了搜索条件,选择时间段,然后把得到的网址拷贝下来,放到微博博主主页采集工具中进行采集?

自从微博博主主页改成瀑布流样式以后,没有翻页页码就只能从头采集。如果设置采集条件,看到的内容都是精选的,就像下图一样,能采集到的很少:


如果想采集全,可以看下面这个帖子,采集cn端网页,但是要自己构造网址,而且要用快捷采集中的另一个采集工具,具体看帖子:https://www.gooseeker.com/doc/thread-19580-1-1.html
举报 使用道具
1472#
胡尔摩斯 初级会员 发表于 2024-2-14 13:37:12 | 只看该作者
没有博主的粉丝数量
举报 使用道具
1473#
Fuller 管理员 发表于 2024-2-14 16:03:49 | 只看该作者
胡尔摩斯 发表于 2024-2-14 13:37
没有博主的粉丝数量

你所使用的微博采集工具是哪一个?博主详细资料采集吗?你要采集的微博网址是什么?发出来几个我测试一下
举报 使用道具
1474#
胡尔摩斯 初级会员 发表于 2024-2-17 02:40:36 | 只看该作者
Fuller 发表于 2024-2-14 16:03
你所使用的微博采集工具是哪一个?博主详细资料采集吗?你要采集的微博网址是什么?发出来几个我测试一下 ...

是话题广场搜索的那一个
举报 使用道具
1475#
gz51837844 管理员 发表于 2024-2-17 10:50:31 | 只看该作者
胡尔摩斯 发表于 2024-2-17 02:40
是话题广场搜索的那一个

在话题搜索结果页面可以采集到:该话题的”今日阅读数“和”今日讨论数“,以及每篇博文的博主,博主id,博主主页网址,博主头像,博文,博文独立网址,发布时间,发布终端,转发数,评论数,点赞数等字段,但是由于话题搜索结果页面没有显示每篇博文的博主粉丝数,所以这个话题工具没有采集该数据项。


可以把导出的excel表里“博主主页”字段的网址,添加到这个微博工具:微博博主详细资料采集工具


这个工具会采集每个博主的更多信息,包括该博主的粉丝数。

举报 使用道具
1476#
劉柒柒 新手上路 发表于 2024-3-4 14:12:29 | 只看该作者
博主的粉丝数据采集不全怎么弄?
举报 使用道具
1477#
劉柒柒 新手上路 发表于 2024-3-4 14:13:52 | 只看该作者
采集到的数据跟给出的“粉丝资料示例数据”不一样
举报 使用道具
1478#
劉柒柒 新手上路 发表于 2024-3-4 14:17:57 | 只看该作者
采集到的博主粉丝数据没有年龄,地址,性别信息
举报 使用道具
1479#
gz51837844 管理员 发表于 2024-3-4 14:55:23 | 只看该作者
劉柒柒 发表于 2024-3-4 14:12
博主的粉丝数据采集不全怎么弄?

微博有限制,一般最多只显示200个粉丝,能采集的数量不大于这个显示数量
举报 使用道具
1480#
gz51837844 管理员 发表于 2024-3-4 15:12:01 | 只看该作者
劉柒柒 发表于 2024-3-4 14:17
采集到的博主粉丝数据没有年龄,地址,性别信息

这几个字段在以前的微博粉丝页面有显示,现在不显示了,所以采集不到
可以把采集到的粉丝excel的“主页链接”字段的网址,添加博主详细资料工具

或者添加到这个快捷采集:微博博主介绍信息,会采集到:介绍,性别,粉丝数,微博数,关注数,ip属地这几个字段。






举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 23:14