欧美亚洲中文,在线国自产视频,欧洲一区在线观看视频,亚洲综合中文字幕在线观看

      1. <dfn id="rfwes"></dfn>
          <object id="rfwes"></object>
        1. 站長資訊網(wǎng)
          最全最豐富的資訊網(wǎng)站

          詳解Python之urllib爬蟲、request模塊和parse模塊

          詳解Python之urllib爬蟲、request模塊和parse模塊

          文章目錄

          • urllib
          • request模塊
            • 訪問URL
            • Request類
            • 其他類
          • parse模塊
            • 解析URL
            • 轉(zhuǎn)義URL
          • robots.txt文件

          (免費(fèi)學(xué)習(xí)推薦:python視頻教程

          urllib


          urllib是Python中用來處理URL的工具包,源碼位于/Lib/下。它包含了幾個模塊:用于打開及讀寫的urls的request模塊、由request模塊引起異常的error模塊、用于解析urls的parse模塊、用于響應(yīng)處理的response模塊、分析robots.txt文件的robotparser模塊。

          注意版本差異。urllib有3個版本:Python2.X包含urllib、urllib2模塊,Python3.X把urlliburllib2以及urlparse合成到urllib包中,而urllib3是新增的第三方工具包。若遇到"No module named urllib2"等問題幾乎都是Python版本不同導(dǎo)致的。

          urllib3是一個功能強(qiáng)大、條例清晰、用于HTTP客戶端的Python庫。它提供了許多Python標(biāo)準(zhǔn)庫里所沒有的特性:壓縮編碼、連接池、線程安全、SSL/TLS驗(yàn)證、HTTP和SCOCKS代理等。可以通過pip進(jìn)行安裝:pip install urllib3
          詳解Python之urllib爬蟲、request模塊和parse模塊
          也可以通過GitHub下載最新代碼:

          git clone git://github.com/shazow/urllib3.git python setup.py install

          urllib3參考文檔:https://urllib3.readthedocs.io/en/latest/

          request模塊


          urllib.request模塊定義了身份認(rèn)證、重定向、cookies等應(yīng)用中打開url的函數(shù)和類。

          再簡單介紹下request包,該包用于高級的非底層的HTTP客戶端接口,容錯能力比request模塊強(qiáng)大。request使用的是urllib3,它繼承了urllib2的特性,支持HTTP連接保持和連接池,支持使用cookie保持會話、文件上傳、自動解壓縮、Unicode響應(yīng)、HTTP(S)代理等。

          贊(0)
          分享到: 更多 (0)
          網(wǎng)站地圖   滬ICP備18035694號-2    滬公網(wǎng)安備31011702889846號