网易港嚆挛滔云音乐是一款由网易开发的音乐产品,依托专业音乐人、DJ、好友推荐及社交功能,在线音乐服务主打歌单斤舻浑趸、社交、大牌推荐和音乐指纹,以歌单、DJ节目、社交、地理位置为核心要素,主打发现和分享。网易云音乐中的评论区是一个很有意思的地方——各种味道的故事,引起了网友们的强烈共鸣。甚至产生了一个歌单——网易云评论最多的前100首歌。在这个歌单中,周杰伦的晴天评论数居于第一(截止本文上传时间)。本文将介绍使用八爪鱼采集网易云音乐评论(以周杰伦的晴天下的评论为例)的方法。采集字段主要有评论内容、用户ID、用户主页链接和点赞数。本文仅为一个示例,大家在采集过程中,可更换歌曲URL,采集歌曲下的评论。还可先采集一批歌曲URL,再使用URL列表循环,采集大量歌曲评论。
工具/原料
使用功能点: 分页列表循环 Ajax点击和翻页
方法/步骤
1、步骤1:创建采集任务1)进入主界面,选择“自定义采集”
2、2)将要采集的网站URL复制粘贴到输入框中,点击“保存网址”。这里我们先到网易云音乐上面复制想要采集的评论数据网址。然后复制粘贴
3、步骤2:创建翻页循环1)网页打开以后,将页面下拉到底部,点击“下一页”按钮。在右侧的操作提示框中,选择“循环点击下一页”
4、步骤3:创建列表循环及信息提取1)移动鼠标,选中第一条评论,评论框会变成绿色水貔藻疽,其中的字段会变为红色底色。然后选择右侧操作提示框中的“选中子元素”
5、2)接着在右边的提示框中选择“选中全部”
6、3)然后选择“采集数据”
7、4)打开右上角的流程按钮,可以删除不需要的字段并编辑字段名称
8、5)因为网页谭终沫冀涉及到Ajax技术,所以需要设置Ajax,如下图,鼠标点击“点击翻页”步骤,打开高级选项,在Ajax加载项勾选Ajax加载数据,设置超时2秒
9、步骤4:采集并导出数据1)点击左上角的“开始采集”,选择“启动本地采集”
10、2)采集完成后,会跳出提示,选择“导出数据”选择“合适的导出方式”,将采集好的数据导出,这里我们选择excel作为导出为格式,数据导出后如下图