成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Python3爬取B站視頻彈幕

開發 后端
本文通過8個步驟教你如何使用Python3爬取B站的視頻彈幕,快往下看看吧。

 [[215973]]

需要準備的環境:

  1. 一個B站賬號,需要先登錄,否則不能查看歷史彈幕記錄
  2. 聯網的電腦和順手的瀏覽器,我用的Chrome
  3. Python3環境以及request模塊,安裝使用命令,換源比較快:
  1. pip3 install  request -i http://pypi.douban.com/simple  

爬取步驟:

1.登錄后打開需要爬取的視頻頁面,打開開發者工具臺,Chrome可以使用F12快捷鍵,選擇network監聽請求  

 

2.點擊查看歷史彈幕,獲取請求  

 

  

其中rolldate后面的數字表示該視頻對應的彈幕號,返回的數據中timestamp表示彈幕日期,new表示數目 

 

4.在查看歷史彈幕中任選一天,查看,會發出新的請求

dmroll ,時間戳,彈幕號,表示獲取該日期的彈幕,1507564800 表示2017/10/10 0:0:0 

 

 

 

 

 

該請求返回xml數據 

 

5.使用正則表達式獲取所有彈幕消息,匹配模式

 

  1. '<d p=".*?">(.*?)</d>'  

6.拼接字符串,將所有彈幕保存到本地文件即可 

  1. with open('content.txt', mode='w+', encoding='utf8'as f:    f.write(content)  

7.參考代碼如下,將彈幕按照日期保存為單個文件...因為太多了... 

 

  1. import requests 
  2.  
  3. import re 
  4.  
  5. import time  
  6.  
  7. """    爬取嗶哩嗶哩視頻彈幕信息"""  
  8.  
  9. # 2043618 是視頻的彈幕標號,這個地址會返回時間列表 
  10.  
  11. # https://www.bilibili.com/video/av1349282 
  12.  
  13. url = 'https://comment.bilibili.com/rolldate,2043618' 
  14.  
  15. # 獲取彈幕的id 2043618 
  16.  
  17. video_id = url.split(',')[-1]print(video_id) 
  18.  
  19. # 獲取json文件 
  20.  
  21. html = requests.get(url) 
  22.  
  23. # print(html.json()) 
  24.  
  25.   
  26.  
  27. # 生成時間戳列表 
  28.  
  29. time_list = [i['timestamp'for i in html.json()] 
  30.  
  31. # print(time_list) 
  32.  
  33.   
  34.  
  35. # 獲取彈幕網址格式 'https://comment.bilibili.com/dmroll,時間戳,彈幕號' 
  36.  
  37.   
  38.  
  39. # 彈幕內容,由于總彈幕量太大,將每個彈幕文件分別保存 
  40.  
  41. for i in time_list:    content = ''    j = 'https://comment.bilibili.com/dmroll,{0},{1}'.format(i, video_id)    print(j)    text = requests.get(j).text 
  42.  
  43.     # 匹配彈幕內容    res = re.findall('<d p=".*?">(.*?)</d>', text)     
  44.  
  45.     # 將時間戳轉化為日期形式,需要把字符串轉為整數    timeArray = time.localtime(int(i))    date_time = time.strftime("%Y-%m-%d %H:%M:%S", timeArray)    print(date_time)    content += date_time + ' 
  46.  
  47. '    for k in res:        content += k + ' 
  48.  
  49. '    content += ' 
  50.  
  51. '    file_path = 'txt/{}.txt'.format(time.strftime("%Y_%m_%d", timeArray))    print(file_path)     
  52.  
  53.     with open(file_path, mode='w+', encoding='utf8'as f:        f.write(content)  

8.最終效果 

 

 

責任編輯:龐桂玉 來源: 程序員共讀
相關推薦

2017-11-17 19:56:46

爬蟲視頻信息數據庫

2021-10-29 07:49:23

Python彈幕播放

2021-06-02 15:10:20

PythonScrapy視頻

2020-12-02 09:42:42

PythonApp抖音視頻

2025-03-05 00:00:55

2021-09-09 06:18:04

交互功能彈幕

2022-12-26 00:00:05

Python爬蟲B站彈幕

2020-10-20 14:12:54

B站開源彈幕

2025-04-28 08:59:25

2018-02-24 18:11:11

2020-10-12 08:19:43

Python爬蟲網頁數據

2016-12-07 11:18:58

Python爬蟲網站

2017-05-24 15:07:19

Python爬蟲爬取

2019-04-24 09:48:54

2015-05-07 09:32:55

APP開源

2024-03-01 18:52:31

視頻超分算法

2021-03-01 21:32:49

HTTP2 QUIC

2020-11-03 14:10:45

Python爬取天氣爬蟲

2019-01-02 12:23:30

Python金融數據爬取
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品欧美黑人一区二区三区 | 免费国产视频在线观看 | 亚洲精品日韩一区二区电影 | 亚洲成人自拍 | caoporn国产精品免费公开 | 日韩一区中文字幕 | 日韩欧美专区 | 伊人无码高清 | 一级做a| www.成人免费视频 | 中文字幕精品一区 | 成人在线观看免费 | 看亚洲a级一级毛片 | 91 中文字幕 | 毛片久久久 | 大伊人久久 | 亚洲成人日韩 | 毛片韩国| 国产亚洲精品美女久久久久久久久久 | 99精品欧美一区二区三区综合在线 | 久久久久久久久91 | 国产麻豆乱码精品一区二区三区 | 久久噜噜噜精品国产亚洲综合 | 日本激情视频网 | 欧美精品久久久 | 日韩一区二区在线观看视频 | 一区二区三区四区在线视频 | 黄色一级毛片免费看 | 成人影视网址 | 精品免费 | 亚洲国产精品久久久久婷婷老年 | 亚洲精品久久区二区三区蜜桃臀 | 日韩三级电影一区二区 | 久久国产成人 | 欧美日韩综合一区 | 国产视频观看 | 久久久www成人免费精品 | 亚洲欧洲日韩精品 中文字幕 | 91精品国产综合久久久亚洲 | 欧美激情在线精品一区二区三区 | 一级毛片,一级毛片 |