您现在的位置是:首页 > 精选知识 >正文

今日房源采集器(房源信息如何采集)

发布时间:2022-07-03 20:56:24江锦林来源:

导读大家好,小常来为大家解答以上问题。房源采集器,房源信息如何采集很多人还不知道,现在让我们一起来看看吧!1、找到要采集的房源网站,选...

大家好,小常来为大家解答以上问题。房源采集器,房源信息如何采集很多人还不知道,现在让我们一起来看看吧!

1、找到要采集的房源网站,选择你要查找的房源信息,将选择好的房源网站地址复制下来打开采集器,并登陆建立采集任务,完成采集任务及任务组名称编辑,点击下一步将复制的网页地址粘贴在八爪鱼采集器内置浏览器的地址栏中,点击跳转,采集的网页会在下方浏览器中打开,流程设计器中会生成一个“打开网页”步骤将网页下拉到底部,找到翻页的按钮,右键点击,选择执行“循环点击这个元素”完成后流程设计器会生成一个翻页循环,点击自定义进行设置选择“元素文本=下一页”这个选项,点击确定,完成翻页循环的创建完成后上述操作后,右键点击页面中第一个房源信息的方框,在跳出的操作框中,选择下图红色方框的选项“创建一个元素列表”将第一个房源的信息”添加到列表“中点击第二个方框中的房源信息,同样将其”添加到列表“中八爪鱼会将具有相似特征的元素抓取到列表中,如下图,所有的群组信息被添加到列表,接着点击“创建列表完成“,再点击“循环”,完成列表的创建创建列表完成后流程图,如左侧所示,接着我们需要对采集的房源信息进行抓取如图点击房源中的标题,在跳出的执行框中,选择执行”抓取这个元素文本”方框其他数据的信息抓取,重复同样的步骤即可抓取到的内容会显示在右上方的操作框中,这里可以修改采集字段的名称,到这里我们就完成了房源信息提取由于每一页都需要循环采集数据,所以我们需要将这个循环列表拖入到翻页循环里面。

2、注意:流程是从上网页执行的,所以这个循环列表需要放到点击翻页的前面,否则会漏掉第一页的数据。

3、最终流程图如下图所示:点击保存,进入下一个采集步骤选择采集方式,开始房源信息的采集采集完成,有多个导出格式可供选择,可以根据需要点选,采集到的重复数据八爪鱼采集器会自动识别出来,导出时可以选择是否去重,完成房源信息的采集。

本文到此结束,希望对大家有所帮助。

标签:

上一篇
下一篇