58同城里面抓取价格还有面积抓取出来是乱码,请问有遇到过这个问题的小伙伴吗

QQ截图20190123214520.png (122.71 KB, 下载次数: 305)

QQ截图20190123214520.png
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2020-11-30 22:28

沙发
wangyong 版主 发表于 2019-1-24 11:46:37 | 只看该作者
这个种情况是用了自定义字体库,需要用定制版来爬取
举报 使用道具
板凳
短短美少女 初级会员 发表于 2019-1-24 15:13:10 | 只看该作者
wangyong 发表于 2019-1-24 11:46
这个种情况是用了自定义字体库,需要用定制版来爬取

好的,谢谢
举报 使用道具
地板
kuorumin 新手上路 发表于 2020-11-29 22:45:01 | 只看该作者
wangyong 发表于 2019-1-24 11:46
这个种情况是用了自定义字体库,需要用定制版来爬取

没明白,能否说详细点,要怎么弄才能爬到真实的数据?谢谢
举报 使用道具
5#
kuorumin 新手上路 发表于 2020-11-29 22:45:59 | 只看该作者

你知道怎么解决乱码问题吗,能否告诉下我,谢谢
举报 使用道具
6#
Fuller 管理员 发表于 2020-11-29 23:43:55 | 只看该作者
kuorumin 发表于 2020-11-29 22:45
你知道怎么解决乱码问题吗,能否告诉下我,谢谢

观察一下,那些很复杂的汉字和0~9是一一对应的,在excel表格里批量替换
举报 使用道具
7#
kuorumin 新手上路 发表于 2020-11-30 22:28:49 | 只看该作者
Fuller 发表于 2020-11-29 23:43
观察一下,那些很复杂的汉字和0~9是一一对应的,在excel表格里批量替换

哦,原来是这样弄的,谢谢啊
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 23:52