python爬虫Urllib2怎样发出请求

小编给大家分享一下python爬虫Urllib2怎样发出请求,希望大家阅读完这篇文章后大所收获,下面让我们一起去探讨吧!

创新互联建站是一家专业从事成都网站制作、网站建设的网络公司。作为专业网络公司,创新互联建站依托的技术实力、以及多年的网站运营经验,为您提供专业的成都网站建设、营销型网站及网站设计开发服务!

要抓取网页数据,要做的就是向服务器发起请求并获取响应,而在Python中,我们可以使用urllib2这个库来实现。urllib2的用法其实基本和urllib相似,且它只存在于Python2版本,它的使用时需要配合urllib一起使用。

 urllib2发起GET请求

这里展示了一个官方使用urllib2的GET请求

import urllib2
 
res = urllib2.urlopen("http://httpbin.org/get")
print res.read().decode()

拓展:urllib3发起GET请求

urllib3说一个HTTP客户端Python库,Python2和Python3在未安装的情况下均可以使用pip install urllib3即可安装,它提供了很多urllib库中没有的重要特性:线程安全 连接池 客户端SSL/TLS验证 文件分部编码上传协助处理重复请求和HTTP重定位支持gzip和deflate压缩编码支持HTTP和SOCKS代理100%测试覆盖率 。

urllib3主要的特点就是在请求之前需要创建一个连接池对象。

import urllib3
 
http = urllib3.PoolManager()  # 线程池生成请求
res = http.request('GET', 'http://httpbin.org/get')
print(res.data.decode())

看完了这篇文章,相信你对python爬虫Urllib2怎样发出请求有了一定的了解,想了解更多相关知识,欢迎关注创新互联行业资讯频道,感谢各位的阅读!


分享名称:python爬虫Urllib2怎样发出请求
文章出自:http://cdiso.cn/article/jcgpcd.html

其他资讯