成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

5分鐘擼了個小小爬蟲....

開發 前端
這幾天在用“必應”搜索時,發現必應的背景圖片挺好看的,有的是風景,有的是動物。。。于是產生了一個想法,爬下來當做桌面背景圖吧。。由于是每天必應的圖片都會變,所以后續結合電腦自帶的定時任務,可以達到每天自動抓取圖片的效果。

前言

這幾天在用“必應”搜索時,發現必應的背景圖片挺好看的,有的是風景,有的是動物。。。于是產生了一個想法,爬下來當做桌面背景圖吧。。

由于是每天必應的圖片都會變,所以后續結合電腦自帶的定時任務,可以達到每天自動抓取圖片的效果。

開工

簡單的分析下:必應首頁。

 

5分鐘擼了個小小爬蟲....

打開 F12 ,找到對應的請求,可以很容易的看到有這么個鏈接,然后點一下,就會新打開一個頁面,此時顯示的就是背景圖片。

如何下載呢?其實很簡單,說下邏輯。

requests庫請求主頁,正則匹配地址,再用 requests 請求,將返回的 content 以二進制的形式寫入文件,保存為圖片。

核心代碼:

  1. url = 'https://cn.bing.com'headers = {    'User-Agent': 'Mozilla/5.0 
  2.  (Macintosh; Intel Mac OS X 10_15_1) '                  'AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3  
  3. Safari/605.1.15'}r = requests.get(url=url, headers=headers)# 正則匹配 
  4. 到 url 地址a = re.findall(r'rel="preload" href="(.*?)" as="image"',  
  5. r.text)if a:    # 拼接 https://cn.bing.com/xxxxxx圖片的地址     
  6. picture_url = parse.urljoin(url, a[0])    print(f'當前圖片地址: 
  7. {picture_url}')    r_picture = requests.get(url=picture_url,  
  8. headers=headers)    write_file(file, r_picture.content) # 寫入文件 

執行后的結果:

 

5分鐘擼了個小小爬蟲....

主要是正則表達式,如何書寫,匹配出來,用 urllib 的 urljoin 方法拼接下圖片地址即可??梢钥聪潞诵拇a的相關注釋。

定時任務

Python代碼一共 25 行,關鍵是如何利用系統定時來制造每天觸發的效果。

使用方法,兩個。

編輯 crontab :

  1. crontab -e 

 

5分鐘擼了個小小爬蟲....

回車后,進入內容,用法和 vim 一樣,按下 i 即可編寫,然后 wq 保存。

 

5分鐘擼了個小小爬蟲....
  1. 0 10 * * * /Users/sy/anaconda3/bin/python /Users/sy/PycharmProjects 
  2. /python-tools/spider/bing_picture/crawl_bing.py > /Users 
  3. /sy/PycharmProjects/python-tools/spider/bing_picture/log 

第一段,是cron特有的時間配置表達式,可以看下圖的簡介,順便給大家一個網址,可以在線查看其表達式的含義。而我腳本中寫的則是每天十點整執行 Python。

 

5分鐘擼了個小小爬蟲....

工具網址:

crontab執行時間計算​tool.lu

 

5分鐘擼了個小小爬蟲....

寫完 cron 表達式,后面跟的其實就是 python xxx.py 這樣的命令,只不過,在 cron 中一定要寫絕對路徑,否則不生效。

再執行 python 命令的基礎上,我還追加了 > xxx.log 這樣,意思是將 python 腳本的打印內容輸出到一個指定目錄的 log 文件里。

2.查看定時任務 crontab:

  1. crontab -l 

 

5分鐘擼了個小小爬蟲....

cron -l 則是查看定時任務列表內容的,可以看到有多少任務配置了。如果有多個定時腳本,則可以回車換行繼續添加即可。

每日自動抓取,導入圖片,換背景即可。

 

5分鐘擼了個小小爬蟲....

總結

嗯,這就是本次的 5 分鐘擼一個小爬蟲系列!

本篇介紹的定時工具,其實用途很大,因為基于系統層面,所以不依賴于腳本,只要你電腦開著,就可以隨心所欲的觸發你寫的腳本,而不依賴你腳本本身使用代碼的定時任務!

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2020-12-07 11:23:32

Scrapy爬蟲Python

2021-10-12 09:24:02

Java線程池源碼

2021-05-31 07:22:46

ORM框架程序

2012-06-28 10:26:51

Silverlight

2020-09-14 11:30:26

HTTP3運維互聯網

2021-04-30 16:23:58

WebRTC實時音頻

2021-01-29 11:43:53

SSHLinux命令

2020-10-30 15:04:16

開發技能代碼

2010-11-03 11:01:05

求職面試

2020-11-23 16:23:59

CSS設計技術

2020-12-17 10:00:16

Python協程線程

2011-07-11 09:58:52

2021-01-29 11:25:57

Python爬山算法函數優化

2021-03-12 09:45:00

Python關聯規則算法

2009-11-26 11:19:52

NIS服務器

2020-05-15 07:30:08

黑客Thunderbolt漏洞

2021-03-23 15:35:36

Adam優化語言

2021-06-07 12:08:06

iOS Python API

2017-10-11 15:17:42

sklearn機器學習pandas

2020-07-25 19:40:33

Java開發代碼
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧产日产国产精品视频 | 亚洲一区二区视频在线播放 | 精品国产一区二区国模嫣然 | 91久久精品一区二区二区 | 国产资源在线视频 | 久久国内精品 | 亚洲高清在线观看 | 综合中文字幕 | 麻豆精品一区二区三区在线观看 | 九九导航 | 狠狠色综合网站久久久久久久 | 欧美日韩免费一区二区三区 | 亚洲欧美成人影院 | 国产精品国产成人国产三级 | 深夜爽视频 | 毛片大全 | 丁香综合| 男人天堂网址 | 国产成人久久精品 | 午夜性视频 | 日日射夜夜骑 | 亚洲乱码一区二区三区在线观看 | 一区二区三区在线播放 | 国产精品久久a | 欧美国产视频 | 国产精品久久久久无码av | 精彩视频一区二区三区 | 欧美日日 | 久久久久久亚洲精品 | 精品美女在线观看视频在线观看 | 亚洲黄色视屏 | 日韩在线观看 | 一区二区三区在线免费观看 | 成人国产免费视频 | 欧美激情精品久久久久 | 国产成在线观看免费视频 | 亚洲一区二区三区免费视频 | 久久久综合久久 | 成人片网址 | 欧美日韩精品久久久免费观看 | 成人亚洲精品 |