文章目錄
- urllib
- request模塊
-
- 訪問URL
- Request類
- 其他類
- parse模塊
-
- 解析URL
- 轉(zhuǎn)義URL
- robots.txt文件
(免費(fèi)學(xué)習(xí)推薦:python視頻教程)
urllib
urllib
是Python中用來處理URL的工具包,源碼位于/Lib/下。它包含了幾個(gè)模塊:用于打開及讀寫的urls的request
模塊、由request
模塊引起異常的error
模塊、用于解析urls的parse
模塊、用于響應(yīng)處理的response
模塊、分析robots.txt文件的robotparser
模塊。
注意版本差異。urllib
有3個(gè)版本:Python2.X包含urllib
、urllib2
模塊,Python3.X把urllib
、urllib2
以及urlparse
合成到urllib
包中,而urllib3
是新增的第三方工具包。若遇到"No module named urllib2"等問題幾乎都是Python版本不同導(dǎo)致的。
urllib3
是一個(gè)功能強(qiáng)大、條例清晰、用于HTTP客戶端的Python庫。它提供了許多Python標(biāo)準(zhǔn)庫里所沒有的特性:壓縮編碼、連接池、線程安全、SSL/TLS驗(yàn)證、HTTP和SCOCKS代理等??梢酝ㄟ^pip進(jìn)行安裝:pip install urllib3
也可以通過GitHub下載最新代碼:
git clone git://github.com/shazow/urllib3.git python setup.py install
urllib3
參考文檔:https://urllib3.readthedocs.io/en/latest/
request模塊
urllib.request
模塊定義了身份認(rèn)證、重定向、cookies等應(yīng)用中打開url的函數(shù)和類。
再簡單介紹下request
包,該包用于高級(jí)的非底層的HTTP客戶端接口,容錯(cuò)能力比request
模塊強(qiáng)大。request
使用的是urllib3,它繼承了urllib2的特性,支持HTTP連接保持和連接池,支持使用cookie保持會(huì)話、文件上傳、自動(dòng)解壓縮、Unicode響應(yīng)、HTTP(S)代理等。