成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

怎樣使用Requests模塊抓取網頁?

開發 前端
爬取網頁其實就是通過URL獲取網頁信息,網頁信息的實質是一段添加了JavaScript和CSS的HTML代碼。

?爬取網頁其實就是通過URL獲取網頁信息,網頁信息的實質是一段添加了JavaScript和CSS的HTML代碼。Python提供了一個抓取網頁信息的第三方模塊requests,requests模塊自稱“HTTP for Humans”,直譯過來的意思是專門為人類而設計的HTTP模塊,該模塊支持發送請求,也支持獲取響應。

1.發送請求

requests模塊提供了很多發送HTTP請求的函數,常用的請求函數具體如表10-1所示。

表10-1 requests模塊的請求函數

2.獲取響應

requests模塊提供的Response 類對象用于動態地響應客戶端的請求,控制發送給用戶的信息,并且將動態地生成響應,包括狀態碼、網頁的內容等。接下來通過一張表來列舉Response類可以獲取到的信息,如表10-2所示。

表10-2 Response 類的常用屬性

接下來通過一個案例來演示如何使用requests模塊抓取百度網頁,具體代碼如下:

# 01 requests baidu
import requests
base_url = 'http://www.baidu.com'
#發送GET請求
res = requests.get (base_url)
print("響應狀態碼:{}".format(res.status_code)) #獲取響應狀態碼
print("編碼方式:{}".format(res.encoding) #獲取響應內容的編碼方式
res.encoding = 'utf-8' #更新響應內容的編碼方式為UIE-8
print("網頁源代碼:\n{}".format(res.text)) #獲取響應內容

以上代碼中,第2行使用import導入了requests模塊;第3~4行代碼根據URL向服務器發送了一個GET請求,并使用變量res接收服務器返回的響應內容;第5~6行代碼打印了響應內容的狀態碼和編碼方式;第7行將響應內容的編碼方式更改為“utf-8”;第8行代碼打印了響應內容。運行程序,程序的輸出結果如下:

響應狀態碼:200
編碼方式:ISO-8859-1
網頁源代碼:
<!DOCTYPE html>
<!-STATUS OK--><html> <head><meta http-equiv=content-type content=text/html;
charset=utf-8><meta http-equiv=X-UA-Compatible content=IE=Edge><meta content=
always name=referrer><link rel=stylesheet type=text/css href=http://s1.bdstatic.
com/r/www/cache/bdorz/baidu.min.css><title>百度一下,你就知道</title></head>
<body link=#0000cc>…省略N行…</body></html>

值得一提的是,使用requests模塊爬取網頁時,可能會因為沒有連接網絡、服務器連接失敗等原因導致產生各種異常,最常見的兩個異常是URLError和HTTPError,這些網絡異??梢允褂?try…except 語句捕獲與處理。

責任編輯:華軒 來源: 今日頭條
相關推薦

2012-05-17 15:11:23

linux

2022-06-28 13:41:07

瀏覽網頁互聯網交互Python

2021-11-24 17:22:06

網絡抓取網絡爬蟲數據收集

2010-03-03 15:39:50

Python抓取網頁內

2009-07-31 10:34:41

ASP.NET抓取網頁

2009-12-02 15:50:41

PHP抓取網頁內容

2025-04-03 02:35:00

GoogleGemini工具

2019-11-19 15:43:07

人工智能軟件技術

2020-10-12 08:19:43

Python爬蟲網頁數據

2023-11-27 08:51:46

PythonRequests庫

2024-10-10 15:04:34

2010-03-04 11:22:59

Python抓取網頁圖

2009-09-07 14:00:57

C#抓取網頁

2010-07-16 11:16:40

Perl抓取網頁

2009-12-17 15:28:32

內核模塊編譯

2009-09-25 11:14:16

Hibernate批量

2019-01-31 09:02:56

網頁抓取設計模式數據

2017-01-20 08:44:53

Apache Flum抓取數據

2024-04-15 13:13:04

PythonJSON

2025-01-22 10:04:52

自動化運維Ansiblefetch
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久草视频 | 九九亚洲| 亚洲导航深夜福利涩涩屋 | 一区二区福利视频 | 精品三区| 国产精品久久久久久52avav | 夜夜骚| 久久毛片| 日本不卡在线观看 | 久久精品国产99国产精品 | 国产a区| 亚洲一区二区视频在线观看 | 欧美极品在线 | 成人三级av | 日韩伦理一区二区 | 妖精视频一区二区三区 | 亚洲精品视频在线看 | 在线播放中文字幕 | 亚洲欧洲激情 | 色一情一乱一伦一区二区三区 | 国产亚洲精品精品国产亚洲综合 | 视频一区二区三区四区五区 | 亚洲精品一二区 | 午夜精品一区二区三区三上悠亚 | 国外成人在线视频 | 亚洲一区二区三区在线播放 | 日韩一级免费大片 | 中文字幕不卡在线观看 | 国产91亚洲精品一区二区三区 | 国产精品片aa在线观看 | 日韩欧美视频网站 | 亚洲精精品 | 欧美日韩久久精品 | 国产精品成人一区二区三区 | 亚洲精品一区中文字幕乱码 | 在线国产一区 | 国产免费一区二区 | 日韩一区二区三区精品 | 一级看片免费视频囗交动图 | 中文字幕在线剧情 | 超碰在线亚洲 |