纳速健身
标题:
python爬虫-urllib库的安装及使用(urllib2 在 python3.x 中被改为urllib.request)
[打印本页]
作者:
awagink
时间:
2020-8-27 09:45
标题:
python爬虫-urllib库的安装及使用(urllib2 在 python3.x 中被改为urllib.request)
对于刚刚接触Python的朋友来说,肯定懵逼了,根本找不到urllib2,这是因为,urllib2是以前的版本,在后面的Python3.x版本里面,urllib2与urllib合并了,然后名称还是叫urllib
注:标题这样写,是因为肯定很多人这样搜索的,但其实Python3没有urllib2
访问网页
导入import urllib.request
Python3.6如何下载urllib2模块
打开一个网址:resp=urllib.request.urlopen("http://www.baidu.com")
Python3.6如何下载urllib2模块
读取网页内容,然后把内容保存起来:str = resp.read()
Python3.6如何下载urllib2模块
打印刚才读取的内容:print(str)
Python3.6如何下载urllib2模块
END
请求头
把上面的urlopen改成Request,如下:
resp=urllib.request.Request("http://www.baidu.com")
Python3.6如何下载urllib2模块
然后添加请求头,如下
resp.add_header('Host','www.baidu.com')
Python3.6如何下载urllib2模块
创建一个连接,上面的打开网址连接是一样的,只是把网址换成了Request对象
r = urllib.request.urlopen(resp)
Python3.6如何下载urllib2模块
4
然后读取网址,打印出来就可以了
欢迎光临 纳速健身 (https://nasue.com/)
Powered by Discuz! X3.4