利用爬虫把徐小明新浪博客里的所有博文链接爬下来,保存到脚本所在路径的csv文件中(python代码)
代码如下
#pyhton2.7版本
#!/usr/bin/envpython#coding=utf-8此代码功能为把徐小明新浪博客的所有博文链接下载保存到本地csv文件中运行本程序,会在脚本所在路径生成一个xuxiaoming_blog_catalog.csv文件huangle63importsysimportreimportcsvimporturllib2frombs4importBeautifulSoup#获取页面代码,返回对象是BeautifulSoup格式defget_北京中科白殿疯病医院白癜风会传染么