用户1340774522
:网易云音乐的网页端会在曲名、艺术家名、专辑名的中间随机插入“soil”(一个含适应性随机字符的 <div class="soil"> 标签)。我不知道这是出于什么用意(这显然不是用来反爬取的,标签能够准确地过滤掉),但用户进行网页内搜索时倒是越来越容易命中失败了。
05月18日 18:17
举报
收藏
操作
转发
评论[3]
赞[1]
评论只显示前140字:
迷咕子
:
回复
@用户1340774522
:hhhh反正都影响了页面内搜索,干脆直接学百度网盘,把文件标题只返回图片算了
举报
赞[0]
回复
删除
05月19日 00:43 来自网页
用户1340774522
:
回复
@迷咕子
:估计就是用来反水平不高的或者不专用的爬虫的:
https://von.sh/2017/12/08/talk-about-spider-and-anti-spider/
https://github.com/JonasCz/How-To-Prevent-Scraping
评论配图
举报
赞[0]
回复
删除
05月19日 00:01 来自网页
迷咕子
:
这,怎么想都想不通,难道是让之前部署但是没维护的爬虫网站失效用的?
举报
赞[0]
回复
删除
05月18日 21:24 来自网页