采集雪球网遇到Cannot find the node

用MetaStudio为雪球网定义采集规则时,定义完信息结构后,打开逆向选择功能,用鼠标点击内嵌浏览器中的帖子区域,弹出一个对话框,提示

       Cannot find the node

如图

cannot find the node

这是因为雪球网采用很多JS/Javascript代码动态生成网页内容,MetaStudio加载雪球网的样本页面时还没有这块内容,经多一段时间,需要做数据映射的时候,网页内容已经动态修改,新加载和显示了这些内容,在MetaStudio维护的DOM树中暂时没有反应这块新内容。当执行反向选择的时候,MetaStudio由于在自己的DOM树中发现不了这些内容,就提示Cannot find the node。

问题解决方法:MetaStudio的菜单“文件”-〉“刷新DOM”可以手工刷新DOM树的内容,手工刷新后再执行反向选择就不会有这个问题了。

这种情形在很多网站上都有,比如,新浪微博和腾讯微博,凡是大量使用JS的网站都容易出现这个问题。还有一个相关问题,遇到的话还会造成MetaSeeker客户端窗口崩溃消失,就是本来网页上有的内容被JS动态删除了,如果此时再用这些内容做映射,在生成网页采集规则的时候就会因为操作空内容而崩溃,遇到这种情形,需要先禁止JS的执行,用MetaStudio菜单“文件”-〉“禁止JS”达到该目的,再刷新DOM,然后才开始数据映射和FreeFormat映射。详细说明请参考《定义新浪微博抓取规则导致崩溃怎么办》