目标网站:
http://www.kmhouse.org/
网站类型:asp动态
数据目标页面:http://www.kmhouse.org/moreHousePriceList.asp
描述:
1、以下为主页面截图,可以看到,主页面中指向到780多个楼盘子页面,未显示完全的通过翻页访问。每个楼盘子页面中的数据均需抓取。

2、以下为楼盘子页面截图,红框处为楼盘地块名,这是第一个需要抓取的数据项。

3、下拉菜单选择栋号之后将出现数据表格,栋号是第二个需要抓取的数据项。

4、数据表格中的每个项目均需抓取。

5、数据表格下方有翻页,未显示完全的数据需通过翻页来查看,也需要抓取。

综上所述,所有数据均在各个楼盘子页面下的具体栋号数据表格中,需遍历全部数据表抓取所有数据,页面层次稍多,涉及到下拉菜单访问及翻页访问动态数据。
请高手协助完成此规则,报酬请qq详谈或来信,邮箱:heiyi-lxg@qqq.com(请去掉一个q)
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-4-18 16:33

沙发
集搜客 高级会员 发表于 2016-3-24 15:04:50 | 只看该作者
已有专人和您联系
举报 使用道具
板凳
lixiaogang 初级会员 发表于 2016-3-24 15:17:17 | 只看该作者
集搜客 发表于 2016-3-24 15:04
已有专人和您联系

感谢,已经收到邮件了。
举报 使用道具
地板
it9527 禁止发言 发表于 2016-4-18 16:33:28 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 00:33