当前位置:软件学堂 > 资讯首页 > 软件教程 > 行业软件 > 八爪鱼采集器使用教程

八爪鱼采集器使用教程

2020/8/30 11:55:58作者:佚名来源:网络

移动端
八爪鱼采集器v8.1.22吾爱

大小:74.4MB语言:

类型:网络辅助等级:

八爪鱼采集器这款软件可以说是一款帮助用户轻松爬取网上的数据的软件,当然会Python的自己就可以写爬虫,但是使用这款软件也相当于自己写爬虫,但是更加的简单,仅仅需要将爬取的规则导入就可以了,还有很多的模板,小编整理了一下这款软件的使用教程,方便大家更快的上手。
八爪鱼采集器破解版

使用教程

一、使用模板采集数据
顾名思义,采集模板是由软件提供的、做好的采集模板,目前已有200+采集模板,涵盖主流网站的采集场景。模板数还在不断增加。
【使用模板采集数据】时,只需输入几个参数(网址、关键词、页数等),就能在几分钟内快速获取到目标网站数据。(类似PPT模板,只需修改关键信息就能直接使用,无需自己从头配置。)
1、如何找到所需的【采集模板】
① 首页【输入框】
在客户端首页【输入框】中,输入目标网站名称,八爪鱼自动寻找相关的采集模板。将鼠标移到需要的模板上并单击,进入模板详情页面。
注意,请确保输入的网站名称正确,否则可能无法查找到相关模板。
鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图
下文其他图片同理
② 首页【热门采集模板】
点击【热门采集模板】中的模板,或者【更多>>】,进入采集模板展示页面。可通过【模板类型】、【搜索模板】多种方法,寻找目标模板。
③ 没有所需的模板
如果没有找到想要的模板,请进入模板展示页面后,点击右上角【我想要新模板】,提交新模板制作需求。
官方会评估需求,排期制作新的模板。

2、【采集模板】如何使用
Step1:进入【模板详情页】后,仔细阅读【模板介绍】、【采集字段预览】、【采集参数预览】、【示例数据】,确认此模板采的数据符合需求。
注意:模板中的字段是固定的,无法自行增加字段。如果想要增加模板中的字段,请联系官方客服。
Step2:确定模板符合需求以后,点击【立即使用】,自行【配置参数】。常见的参数有关键词、页数、城市、URL等。
请认真查看【模板介绍】中的使用方法说明和参数说明,输入格式正确的参数,否则将影响模板的使用。
Step3:然后点击【保存并启动】,选择启动【本地采集】。八爪鱼自动启动1个采集任务并采集数据。

Step4:数据采集完成以后,可以需要的格式导出。这里以导出为【Excel】为例。

数据示例:

通过【采集模板】创建并保存的任务,会放在【我的任务】中。在【我的任务】界面,可以对任务进行多种操作并查看任务采集到的历史数据。
怎么自定义采集?
使用【智能识别】
【智能识别】,只需输入网址,自动智能识别网页数据。支持自动识别列表型网页数据、滚动和翻页。
在首页输入框中,输入目标网址,点击【开始采集】。八爪鱼自动打开网页并开始智能识别。
给它一点时间,等待智能识别完成。
智能识别成功,一个网页可能有多组数据,八爪鱼会将所有数据识别出来,然后智能推荐最常用的那组。如果推荐的不是想要的,可自行【切换识别结果】。同时,可自动识别出网页的滚动和翻页。此示例网址,无需滚动,只需翻页,故只识别并勾选【翻页并采集多页数据】。
自动识别完成后,点击【生成采集设置】,可自动生成相应的采集流程,方便用户编辑修改。
然后,点击左上角的【采集】,选择【启动本地采集】,八爪鱼就会开始全自动采集数据。
采集完成后,以所需的方式导出数据即可。
通过【智能识别】创建并保存的任务,会放在【我的任务】中。在【我的任务】界面,可以对任务进行多种操作并查看任务采集到的历史数据。
值得注意的是,目前自动识别,仅支持识别列表型网页、滚动和翻页

标签: 数据  爬虫  八爪鱼采集器