大家好,我是小鸣,今天给小伙伴们带来一款自动数据采集器:后羿采集器。
如标题所说,技术小白也能爬数据。
◈小鸣闲话
又是一个愉快的周末,一个人躺在床上咸鱼。
我承认这样真的很安详,像隔壁小猫咪一样。

才怪咧!
事实上,基友一大早发消息给我,要我帮他个忙。

话说回来,有些时候确实需要做一些数据采集以及分析工作,但多数小伙伴并非专业,而临时去学习就更不靠谱了。
这时候就要有个简单易上手的软件来帮忙了。
◈推荐正文
咱们就直接用实例说话了,比如说基友想要把B站前排行一百的数据抓下来。首先当然是打开后羿采集器:

在软件中输入你要抓取的网址就好了。
软件流程图采集以及智能采集两种模式,一般来说,日常的使用直接用智能模式就能搞定了。

带上网址出发,一起爬!
输入网址,直接点击智能采集,软件就能自动帮你分析网页的要素以及结构:

搞定后,我们能看到下方这样的一排结果:

包括标题、链接、排行、播放量、评论量等数据的预览,都帮你抓好了。如果没有你想要的数据,比如说咱还想要up主的用户名,直接点击右下角添加字段,然后在网页上选择要素即可。

预览没问题了,就可以就开始采集了,点击右下角开始:

中间还有定时、循环采集、是否下载图片等选项,小伙伴们按需勾选。
这里只要数据,啥也不改,按默认设置启动:

爬取过程可以看到下载速度,以及正在爬取的工作:

小鸣这就100条数据,一分钟就搞定了。

爬下来的数据支持导出excel、csv等格式的文件,或者存成数据库文件,进行下一步分析:

爬到的数据:

对于流程图采集的模式,咱们也简单说两句。

这里的流程图,与前段时间推荐的APP Inventer类似。通过图块的直观拼接,帮助不认识代码的小伙伴完成编译。
当然,也可以通过直接选择网页的元素,再选择指令,软件会自动生成流程框架:

比如说前两天咱说要去罗马,先看看其他人的评价。
简单写个循环:

点击每个环节,可以看到相应的设置。

比如说循环方式选择,根据需要,这里是列表元素:

最终出来的结果也是可以的,咱们只保留了用户名与评论:

看完了所有评论,咱们去罗马的准备工作都搞定了,这下只要攒够资金就能搞定了(1/10000)。
◈资源获取与安装
资源获取:公众号「大学的共鸣」后台回复00621
小鸣准备了后羿采集器Win以及Mac的安装包,直接下载安装即可使用。
软件虽然有账号系统,但无需账号登录也可以直接使用。
今天的推荐也不要求小伙伴全都下载,只要收藏起来就好了。
一方面咱想说明下已经有类似的技术了,大家在有需要时能快速上手;
另一方面,在小组内所有人都摇头说不会的时候,你能想起小鸣的这篇推送,然后举手,告诉他们:我可以试试!
◈END
好了,今天的小鸣就说到这里,有任何问题,都可以在菜单处找到群入口,进群提问、加群抱团啊!如果大家觉得小鸣的分享有帮助的话,欢迎点赞,转发推荐等一系列操作。
这里是大学的共鸣,分享各种大学常用的、好用的应用;分享各种有趣、有意义的事;分享各种思考、思辨;分享各种逗比日常。

原著是一个有趣的人,若有侵权,请通知删除
还没有人抢沙发呢~