• 标题:【微博博文展开全部采集】#GooSeeker数据DIY#
  • 类别:社交
  • 网站:微博
  • 采集字段:博主头像、博主id、博主、博主主页、博文、博文独立网址、发布时间、发布终端、转发数、评论数、点赞数
  • DIY体验入口http://www.gooseeker.com/res/dat ... 8%E9%87%87%E9%9B%86
  • 样本网址:https://weibo.com/1737737970/Fz7dw8A8u?refer_flag=1001030103_&type=comment&sudaref=www.gooseeker.com&display=0&retcode=6102#_rnd1513216822440
【启动采集前的配置】
  • 预先登陆网站:是
  • 配置打码平台:否

【运行方法】— 详见数据DIY图文教程


【常见问题】— 欢迎跟帖留言
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2021-1-29 10:57

wangyong 版主 发表于 2021-1-29 10:57:23 | 显示全部楼层

集搜客微博采集工具箱中通过微博关键词搜索结果采集工具微博博主主页采集工具或者其他微博工具采集微博数据时会采集下带有“展开全文”的数据

在采集结果中通过Excel将含有“展开全文”的数据筛选出来后
展开全文筛选.png

将其对应的“博文独立网址”添到微博博文展开全部采集中就可以将“展开全文”后的数据完整采集下来
展开全文添加.png

数据展示:

展开全文数据示例.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 07:09