成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

盤點(diǎn)Python中四種讀取Json文件和提取Json文件內(nèi)容的方法

開發(fā) 后端
本文基于粉絲針對json文件處理的提問,綜合群友們的回答,整理了4種可行的方案,幫助粉絲解決了問題。

[[438357]]

大家好,我是Python進(jìn)階者。

前言

前幾天在才哥的交流群有個(gè)叫【杭州-學(xué)生-飛飛飛】的粉絲在群里問了一個(gè)json文件處理的問題。

看上去他只需要follower和ddate這兩個(gè)字段下的對應(yīng)的值。

我們知道json是一種常見的數(shù)據(jù)傳輸形式,所以對于爬取數(shù)據(jù)的數(shù)據(jù)解析,json的相關(guān)操作是比較重要的,能夠加快我們的數(shù)據(jù)提取效率。

思路

關(guān)于這個(gè)問題,倒不是很難,群里提出了三個(gè)方法,第一個(gè)是才哥說的pd處理或者正則表達(dá)式,第二個(gè)是小編自己提出的json處理,第三個(gè)是【成都-IT技術(shù)支持-小王】提出的jsonpath,總之方法很多,這里給出4個(gè)處理方法,希望下次粉絲們再遇到類似問題的時(shí)候,有章可循。

實(shí)現(xiàn)過程

1、正則表達(dá)式

這個(gè)方法可以看看,通過匹配的方法進(jìn)行提取,代碼如下所示:

  1. import re 
  2. import json 
  3.  
  4. file = open('漫畫.txt''r', encoding='utf-8'
  5. content = file.readline() 
  6. ddate_result1 = re.findall('"ddate":"(\d+\-\d+\-\d+)"', content) 
  7. ddate_result2 = re.findall('"ddate":"(.*?)"', content) 
  8. follower_result1 = re.findall('"follower":(\d+),"', content) 
  9.  
  10. print(ddate_result1) 
  11. print(ddate_result2) 
  12. print(follower_result1) 

運(yùn)行之后,可以得到結(jié)果:

關(guān)于ddate,follower獲取的方法肯定還有很多其他寫法,這里只是拋磚引玉,歡迎大家多多嘗試。

2、jsonpath方法一

關(guān)于jsonpath的用法,之前在這篇文章中有提及,感興趣的小伙伴也可以去看看:數(shù)據(jù)提取之JSON與JsonPATH。

下面是【成都-IT技術(shù)支持-小王】大佬給的代碼:

  1. from jsonpath import jsonpath 
  2. import json 
  3.  
  4. """follower和ddate""" 
  5. with open("漫畫.txt", encoding="utf-8"as file: 
  6.     file_json = json.loads(file.readline()) 
  7.  
  8. follower = jsonpath(file_json, "$..follower"
  9. ddate = jsonpath(file_json, "$..ddate"
  10. print(follower) 
  11. print(ddate) 

代碼運(yùn)行之后,就會得到想要的數(shù)據(jù),如下圖所示:

這個(gè)..就和xpath里面的//一樣,子孫節(jié)點(diǎn),$是根節(jié)點(diǎn)。

3、jsonpath方法二

這個(gè)是另外一個(gè)用法了,小號【皮皮】提供的,直接上代碼。

  1. import json 
  2. import jsonpath 
  3.  
  4.  
  5. # obj = json.load(open('羅翔.json''r', encoding='utf-8'))  # 注意,這里是文件的形式,不能直接放一個(gè)文件名的字符串 
  6. file = open('漫畫.txt''r', encoding='utf-8')  # 注意,這里是文件的形式,不能直接放一個(gè)文件名的字符串 
  7. obj = json.loads(file.readline()) 
  8. follower = jsonpath.jsonpath(obj, '$..follower')  # 文件對象   jsonpath語法 
  9.  
  10. ddate = jsonpath.jsonpath(obj, '$..ddate')  # 文件對象   jsonpath語法 
  11. print(follower) 
  12. print(ddate) 

代碼運(yùn)行之后,也可以得到預(yù)期的結(jié)果。

當(dāng)然了,如果你的文件本來就是json文件,也可以直接讀取,代碼類似:

  1. import json 
  2. import jsonpath 
  3.  
  4.  
  5. obj = json.load(open('羅翔.json''r', encoding='utf-8'))  # 注意,這里是文件的形式,不能直接放一個(gè)文件名的字符串 
  6. # file = open('羅翔.json''r', encoding='utf-8')  # 注意,這里是文件的形式,不能直接放一個(gè)文件名的字符串 
  7. # obj = json.loads(file.readline()) 
  8. follower = jsonpath.jsonpath(obj, '$..follower')  # 文件對象   jsonpath語法 
  9.  
  10. ddate = jsonpath.jsonpath(obj, '$..ddate')  # 文件對象   jsonpath語法 
  11. print(follower) 
  12. print(ddate) 

運(yùn)行之后,也可以得到預(yù)期的結(jié)果:

4、jsonpath方法三

這個(gè)是群里【深圳-Hua Bro】華博提供的,代碼如下:

  1. import json 
  2. import jsonpath 
  3.  
  4. with open("羅翔.txt"'r', encoding="UTF-8"as fr: 
  5.     file_json = eval(fr.read().replace('\n\u200b'''))  # 讀取的str轉(zhuǎn)為字典 
  6. follower = jsonpath.jsonpath(file_json, '$..follower')  # 文件對象   jsonpath語法 
  7. ddate = jsonpath.jsonpath(file_json, '$..ddate')  # 文件對象   jsonpath語法 
  8. print(follower) 
  9. print(ddate) 

方法大同小異,運(yùn)行之后,也可以拿到預(yù)取的目標(biāo)數(shù)據(jù),如下圖所示。

總結(jié)

我是Python進(jìn)階者。本文基于粉絲針對json文件處理的提問,綜合群友們的回答,整理了4種可行的方案,幫助粉絲解決了問題。這里墻裂給大家推薦jsonpath這個(gè)庫,感興趣的小伙伴可以學(xué)習(xí)學(xué)習(xí),下次再遇到j(luò)son文件提取數(shù)據(jù)就再也不慌啦!

【編輯推薦】

 

責(zé)任編輯:姜華 來源: Python爬蟲與數(shù)據(jù)挖掘
相關(guān)推薦

2010-08-02 16:47:46

Flex

2022-09-26 00:21:03

Spring文件項(xiàng)目

2022-01-17 09:01:41

Pythonnc文件Python基礎(chǔ)

2021-03-10 10:13:39

爬蟲Python代碼

2018-12-19 14:43:13

Linux命令搜索文件

2021-08-11 20:17:22

推薦算法系統(tǒng)

2015-07-23 14:50:28

大數(shù)據(jù)

2011-08-29 17:32:50

Ubuntu

2010-03-03 13:50:40

Python文件

2011-12-30 13:15:53

Java

2019-10-24 07:42:28

Java引用GC

2023-08-30 23:41:16

AI框架項(xiàng)目

2023-02-10 11:13:42

網(wǎng)絡(luò)功耗無線網(wǎng)絡(luò)設(shè)備

2010-10-19 17:40:30

SqlServer主鍵

2024-12-03 00:40:55

2020-07-24 09:56:12

React開發(fā)數(shù)據(jù)

2009-12-09 11:03:45

安裝Linux

2021-07-22 23:27:45

Python工具算法

2021-06-17 14:46:50

框架jQuery開發(fā)

2018-11-26 18:45:22

數(shù)據(jù)可視化繪圖可視化
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产一区二区三区www | 一级毛片中国 | 精品永久 | 日韩欧美国产精品一区二区 | 国产精品久久久久久模特 | 日韩一区精品 | 久久中文免费视频 | 国产综合久久久久久鬼色 | 欧美日韩成人一区二区 | 综合久久综合久久 | 国产精品久久久久久久久免费丝袜 | 无码日韩精品一区二区免费 | 91麻豆精品国产91久久久久久 | 成年无码av片在线 | 一级毛片免费 | 亚洲电影第三页 | 欧美在线综合 | 欧美成人影院在线 | 亚洲一区二区三区视频在线 | 午夜精品一区 | 日韩国产高清在线观看 | 国产免费色 | 精品日韩一区二区 | 日操夜操| 久久精品在线 | 久久蜜桃av一区二区天堂 | 久久一级| 欧美8一10sex性hd| 97日韩精品| 欧美日韩一本 | 成人毛片视频免费 | 夜夜干夜夜操 | 久草视频在线播放 | 日韩成人在线播放 | 欧美成人精品一区 | 亚洲高清视频在线观看 | 精品久久电影 | 成人h动漫亚洲一区二区 | 91国产精品| 色播久久久 | 中文字幕在线观看视频网站 |