python+wget轻松爬取MP3音乐文件

快咨询     2018-04-13 16:21

 

在搞拼音学习的时候,需要对应的文字的读音。发现XX汉语上面有需要的MP3文件。如图,红框框起来的就是MP3的url地址。

分析一下url,我们大致已经能得出“你”字的MP3文件对应名称为 ni3.mp3。在地址栏输入ni3.mp3,结果证实了我们的猜测。

接下来就是怎么下载资源了,糟糕的是需要读音挺多,如果你手动一个一个下载,工作量非常大!

人生苦短,我用python。哈哈当然这不是主要原因,由于python胶水语言成就了他在爬虫领域的爸爸地位。再加上wget,就可以轻松实现下载。python安装自行百度,这里重点讲下wget安装。首先,不要使用免安装或绿色版的,绿色版会少功能,相当于阉割版,免安装少dll文件,自己去找更烦。推荐使用wget-1.11.4安装版(及Setup)。安装完成后在环境变量中Path配置wget路径,到bin目录。如:Program Files (x86)\GnuWin32\bin

准备工作做好了,接下来就是准备python代码:

代码解释:

subprocess 用来生成子进程,并可以通过管道连接他们的输入/输出/错误,以及获得他们的返回值。

call执行命令,返回状态码,shell=True允许shell命令时字符串形式

wget –no-check-certificate 不检查证书选项,多用于下载https的资源

-O path url 将下载的文件存放到指定的文件夹下,同时重命名下载的文件,

当然这里的代码只是简单的测试,接下来自要运行python脚本就可以下载到MP3文件。

附:若是你想下载github上的资源,需要release版的

 

版权与免责声明

【1】凡本网注明"来源:中科商务网"的所有文字、图片和音视频稿件,版权均属于中科商务网,转载请必须注明中科商务网,违反者本网将追究相关法律责任。

【2】本网转载并注明自其它来源的作品,是本着为读者传递更多信息之目的,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。

【3】如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系。

总部地址:深圳市宝安区共和工业路107号华丰互联网创意园A座336 邮编:518101
电话:0755-88849616(总机) 传真:0755-27838114 网站备案号:粤ICP备12005190号