成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

使用解釋器模式實現獲取元素 Xpath 路徑的算法

開發 前端 算法
對于一種語言,我們給出其文法表示形式(一種語言中的語法描述工具,用來定義語言的規則),并定義一種解釋器,通過這種解釋器來解釋語言中定義的句子。

[[432233]]

正文

1.解釋器模式

對于一種語言,我們給出其文法表示形式(一種語言中的語法描述工具,用來定義語言的規則),并定義一種解釋器,通過這種解釋器來解釋語言中定義的句子。

定義聽起來可能比較抽象,舉個例子比如我們常見的網站多語言,要實現多語言我們首先要預定語言的類型,提前設計不同語言的語料庫,然后我們會根據配置和統一的變量規則來映射到不同語言。

2.元素的Xpath路徑

XPath 用于在 XML 文檔中通過元素和屬性進行導航。雖然XPath 是用來查找XML節點,但同樣可以用來查找HTML文檔中的節點,因為HTML和XML結構類似。這里我們只考慮html,即元素在html頁面中所處的路徑。

那么如何快速獲取元素的Xpath路徑呢?其實也很簡單,我們打開谷歌調試工具:

選中Copy XPath即可復制元素的Xpath路徑。格式可能長這樣:

  1. //*[@id="juejin"]/div[2]/main/div/div[1]/article/div[1] 

獲取元素Xpath路徑的應用場景很多,比如我們經常使用的python爬蟲,利用爬蟲框架可以通過Xpath路徑很方便額控制頁面中的某個dom節點,進而獲取想要的數據和元素;又比如我們通過發送元素的Xpath路徑給后端,后端可以統計某一功能的使用情況和交互數據;又比如分析用戶在網站中瀏覽的熱力分布圖,路徑畫像等等。

3.js實現獲取元素的Xpath路徑

在實現之前,首先我們分析一下Xpath路徑的結構,比如我們有一個頁面,元素span的結構如下:

  1. <!DOCTYPE html> 
  2. <html lang="en"
  3. <head> 
  4. <meta charset="UTF-8"
  5. <meta name="viewport" content="width=device-width, initial-scale=1.0"
  6. <meta http-equiv="X-UA-Compatible" content="ie=edge"
  7. <title>Document</title> 
  8. </head> 
  9. <body> 
  10. <div> 
  11. <span>我是徐小夕</span> 
  12. </div> 
  13. </body> 
  14. </html> 

 

 

 

 

那么我們的Xpath路徑可能長這樣:

  1. HTML/BODY|HEAD/DIV/SPAN 

從上面可以看出,我們的最右邊一個元素都是目標元素,而最左邊第一個元素都是最外層容器。要完成這個過程首先我們要通過元素的parentNode來獲取當前元素的父元素,直到找到最頂層位置。但我們還需要注意的一點是,每找到上一層我們還要遍歷該元素前面的兄弟元素previousSibling,如果這個兄弟元素名字和它后面的元素名字相同,則在元素名上+1.

第一步我們先實現一個遍歷同級兄弟元素的方法getSameLevelName:

  1. // 獲取兄弟元素名稱 
  2. function getSameLevelName(node){ 
  3.     // 如果存在兄弟元素 
  4.     if(node.previousSibling) { 
  5.         let name = '',   // 返回的兄弟元素名稱字符串 
  6.            count = 1,    // 緊鄰兄弟元素中相同名稱元素個數 
  7.            nodeName = node.nodeName, 
  8.            sibling = node.previousSibling; 
  9.         while(sibling){ 
  10.             if(sibling.nodeType == 1 && sibling.nodeType === node.nodeType && sibling.nodeName){ 
  11.                 if(nodeName == sibling.nodeName){ 
  12.                     name += ++count
  13.                 }else { 
  14.                     // 重制相同緊鄰節點名稱節點個數 
  15.                     count = 1; 
  16.                     // 追加新的節點名稱 
  17.                     name += '|' + sibling.nodeName.toUpperCase() 
  18.                 } 
  19.             } 
  20.             sibling = sibling.previousSibling; 
  21.         } 
  22.         return name 
  23.     }else { 
  24.         // 不存在兄弟元素返回'' 
  25.         return '' 
  26.     } 

第二步,遍歷文檔樹。

  1. // XPath解釋器 
  2. let Interpreter = (function(){ 
  3. return function(node, wrap){ 
  4. // 路徑數組 
  5. let path = [], 
  6. // 如果不存在容器節點,默認為document 
  7. wrap = wrap || document; 
  8. // 如果當前節點等于容器節點 
  9. if(node === wrap) { 
  10. if(wrap.nodeType == 1) { 
  11. path.push(wrap.nodeName.toUpperCase()) 
  12. return path 
  13. // 如果當前節點的父節點不等于容器節點 
  14. if(node.parentNode !== wrap){ 
  15. // 對當前節點的父節點執行遍歷操作 
  16. path = arguments.callee(node.parentNode, wrap) 
  17. // 如果當前節點的父元素節點與容器節點相同 
  18. else { 
  19. wrap.nodeType == 1 && path.push(wrap.nodeName.toUpperCase()) 
  20. // 獲取元素的兄弟元素的名稱統計 
  21. let siblingsNames = getSameLevelName(node) 
  22. if(node.nodeType == 1){ 
  23. path.push(node.nodeName.toUpperCase() + sublingsNames) 
  24. // 返回最終的路徑數組結果 
  25. return path 
  26. })() 

有了這兩個方法,我們就可以輕松獲取元素的XPath路徑啦,比如:

  1. let path = Interpreter(document.querySelector('span')) 
  2. console.log(path.join('/')) 

 

這樣會返回開篇的一樣的數據結構了.如:HTML/BODY|HEAD/DIV/SPAN

 

責任編輯:武曉燕 來源: 趣談前端
相關推薦

2022-10-13 08:08:40

解釋器模式算法

2024-06-05 09:41:41

2020-11-09 08:20:33

解釋器模式

2023-05-15 08:51:46

解釋器模式定義

2021-07-07 10:31:19

對象池模式解釋器模式設計模式

2010-04-21 08:38:18

解釋器模式PHP設計模式

2022-04-15 08:30:00

Lombok@Builde構建器

2011-11-30 21:56:31

ibmdwXPathPHP

2016-09-12 14:05:27

PythonPython解釋器Web

2023-03-03 08:12:07

設計模式語言

2023-11-07 10:10:36

設計模式元素

2022-11-03 08:00:00

Xpath動態元素定位器

2010-02-01 13:55:12

Python 解釋器

2022-09-14 08:16:48

裝飾器模式對象

2013-04-23 09:31:52

SQL Server

2021-01-12 05:03:15

PythonLxmlXpath

2014-11-11 15:46:54

MapReduce算法

2024-04-10 12:27:43

Python設計模式開發

2020-11-24 19:20:02

iOS夜間模式緩存

2022-01-05 08:58:08

Python解釋器編程語言
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国内久久| 成人av免费看 | 男女爱爱网站 | 国产一区欧美一区 | 亚洲国产精品一区二区三区 | 免费一看一级毛片 | 欧美成人激情视频 | 亚洲视频免费播放 | 精品欧美| 欧美成人精品一区二区男人看 | 亚洲欧美激情四射 | 日韩午夜一区二区三区 | 国产在线精品一区二区 | 97精品国产一区二区三区 | 久久国产婷婷国产香蕉 | 九九热国产精品视频 | 欧一区 | 嫩草影院黄 | 亚洲欧美日韩电影 | 天天拍天天插 | 亚洲精品一区二区三区中文字幕 | 欧美日韩精品免费观看 | 亚洲国产成人在线观看 | 国产高清在线精品一区二区三区 | 欧美日韩中文字幕 | 免费观看一级特黄欧美大片 | 欧美中文字幕一区 | 午夜小影院 | 国产精品一区二区三级 | 中文字幕视频在线 | av中文字幕在线观看 | 久国久产久精永久网页 | 精品国产乱码久久久久久蜜退臀 | 91精品国产高清一区二区三区 | 欧美日韩亚洲系列 | 欧美日韩在线一区二区 | 精品乱子伦一区二区三区 | 色婷婷综合在线观看 | 国产最新网址 | 成年人精品视频 | 中文字幕在线观看精品 |