成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

開發一個Linux調試器(四):Elves和dwarves

系統 Linux
到目前為止,你已經偶爾聽到了關于 dwarves、調試信息、一種無需解析就可以理解源碼方式。今天我們會詳細介紹源碼級的調試信息,作為本指南后面部分使用它的準備。

[[197930]]

到目前為止,你已經偶爾聽到了關于 dwarves、調試信息、一種無需解析就可以理解源碼方式。今天我們會詳細介紹源碼級的調試信息,作為本指南后面部分使用它的準備。

系列文章索引

隨著后面文章的發布,這些鏈接會逐漸生效。

  1. 準備環境
  2. 斷點
  3. 寄存器和內存
  4. Elves 和 dwarves
  5. 源碼和信號
  6. 源碼級逐步執行
  7. 源碼級斷點
  8. 調用棧展開
  9. 讀取變量
  10. 下一步

ELF 和 DWARF 簡介

ELF 和 DWARF 可能是兩個你沒有聽說過,但可能大部分時間都在使用的組件。ELF(Executable and Linkable Format,可執行和可鏈接格式)是 Linux 系統中使用最廣泛的目標文件格式;它指定了一種存儲二進制文件的所有不同部分的方式,例如代碼、靜態數據、調試信息以及字符串。它還告訴加載器如何加載二進制文件并準備執行,其中包括說明二進制文件不同部分在內存中應該放置的地點,哪些位需要根據其它組件的位置固定(重分配)以及其它。在這些博文中我不會用太多篇幅介紹 ELF,但是如果你感興趣的話,你可以查看這個很好的信息圖或該標準。

DWARF是通常和 ELF 一起使用的調試信息格式。它不一定要綁定到 ELF,但它們兩者是一起發展的,一起工作得很好。這種格式允許編譯器告訴調試器最初的源代碼如何和被執行的二進制文件相關聯。這些信息分散到不同的 ELF 部分,每個部分都銜接有一份它自己的信息。下面不同部分的定義,信息取自這個稍有過時但非常重要的 DWARF 調試格式簡介:

  • .debug_abbrev .debug_info 部分使用的縮略語
  • .debug_aranges 內存地址和編譯的映射
  • .debug_frame 調用幀信息
  • .debug_info 包括 DWARF 信息條目(DWARF Information Entries)(DIEs)的核心 DWARF 數據
  • .debug_line 行號程序
  • .debug_loc 位置描述
  • .debug_macinfo 宏描述
  • .debug_pubnames 全局對象和函數查找表
  • .debug_pubtypes 全局類型查找表
  • .debug_ranges DIEs 的引用地址范圍
  • .debug_str .debug_info 使用的字符串列表
  • .debug_types 類型描述

我們最關心的是 .debug_line 和 .debug_info 部分,讓我們來看一個簡單程序的 DWARF 信息。

  1. int main() { 
  2.     long a = 3; 
  3.     long b = 2; 
  4.     long c = a + b; 
  5.     a = 4; 

DWARF 行表

如果你用 -g 選項編譯這個程序,然后將結果傳遞給 dwarfdump 執行,在行號部分你應該可以看到類似這樣的東西:

  1. .debug_line: line number info for a single cu 
  2. Source lines (from CU-DIE at .debug_info offset 0x0000000b): 
  3.             NS new statement, BB new basic block, ET end of text sequence 
  4.             PE prologue end, EB epilogue begin 
  5.             IS=val ISA number, DI=val discriminator value 
  6. <pc>        [lno,col] NS BB ET PE EB IS= DI= uri: "filepath" 
  7. 0x00400670  [   1, 0] NS uri: "/home/simon/play/MiniDbg/examples/variable.cpp" 
  8. 0x00400676  [   2,10] NS PE 
  9. 0x0040067e  [   3,10] NS 
  10. 0x00400686  [   4,14] NS 
  11. 0x0040068a  [   4,16] 
  12. 0x0040068e  [   4,10] 
  13. 0x00400692  [   5, 7] NS 
  14. 0x0040069a  [   6, 1] NS 
  15. 0x0040069c  [   6, 1] NS ET 

前面幾行是一些如何理解 dump 的信息 - 主要的行號數據從以 0x00400670 開頭的行開始。實際上這是一個代碼內存地址到文件中行列號的映射。NS 表示地址標記一個新語句的開始,這通常用于設置斷點或逐步執行。PE 表示函數序言(LCTT 譯注:在匯編語言中,function prologue 是程序開始的幾行代碼,用于準備函數中用到的棧和寄存器)的結束,這對于設置函數斷點非常有幫助。ET 表示轉換單元的結束。信息實際上并不像這樣編碼;真正的編碼是一種非常節省空間的排序程序,可以通過執行它來建立這些行信息。

那么,假設我們想在 variable.cpp 的第 4 行設置斷點,我們該怎么做呢?我們查找和該文件對應的條目,然后查找對應的行條目,查找對應的地址,在那里設置一個斷點。在我們的例子中,條目是:

  1. 0x00400686  [   4,14] NS 

假設我們想在地址 0x00400686 處設置斷點。如果你想嘗試的話你可以在已經編寫好的調試器上手動實現。

反過來也是如此。如果我們已經有了一個內存地址 - 例如說,一個程序計數器值 - 想找到它在源碼中的位置,我們只需要從行表信息中查找最接近的映射地址并從中抓取行號。

DWARF 調試信息

.debug_info 部分是 DWARF 的核心。它給我們關于我們程序中存在的類型、函數、變量、希望和夢想的信息。這部分的基本單元是 DWARF 信息條目(DWARF Information Entry),我們親切地稱之為 DIEs。一個 DIE 包括能告訴你正在展現什么樣的源碼級實體的標簽,后面跟著一系列該實體的屬性。這是我上面展示的簡單事例程序的 .debug_info 部分:

  1. .debug_info 
  2. COMPILE_UNIT<header overall offset = 0x00000000>: 
  3. < 0><0x0000000b>  DW_TAG_compile_unit 
  4.                     DW_AT_producer              clang version 3.9.1 (tags/RELEASE_391/final) 
  5.                     DW_AT_language              DW_LANG_C_plus_plus 
  6.                     DW_AT_name                  /super/secret/path/MiniDbg/examples/variable.cpp 
  7.                     DW_AT_stmt_list             0x00000000 
  8.                     DW_AT_comp_dir              /super/secret/path/MiniDbg/build 
  9.                     DW_AT_low_pc                0x00400670 
  10.                     DW_AT_high_pc               0x0040069c 
  11. LOCAL_SYMBOLS: 
  12. < 1><0x0000002e>    DW_TAG_subprogram 
  13.                       DW_AT_low_pc                0x00400670 
  14.                       DW_AT_high_pc               0x0040069c 
  15.                       DW_AT_frame_base            DW_OP_reg6 
  16.                       DW_AT_name                  main 
  17.                       DW_AT_decl_file             0x00000001 /super/secret/path/MiniDbg/examples/variable.cpp 
  18.                       DW_AT_decl_line             0x00000001 
  19.                       DW_AT_type                  <0x00000077> 
  20.                       DW_AT_external              yes(1) 
  21. < 2><0x0000004c>      DW_TAG_variable 
  22.                         DW_AT_location              DW_OP_fbreg -8 
  23.                         DW_AT_name                  a 
  24.                         DW_AT_decl_file             0x00000001 /super/secret/path/MiniDbg/examples/variable.cpp 
  25.                         DW_AT_decl_line             0x00000002 
  26.                         DW_AT_type                  <0x0000007e> 
  27. < 2><0x0000005a>      DW_TAG_variable 
  28.                         DW_AT_location              DW_OP_fbreg -16 
  29.                         DW_AT_name                  b 
  30.                         DW_AT_decl_file             0x00000001 /super/secret/path/MiniDbg/examples/variable.cpp 
  31.                         DW_AT_decl_line             0x00000003 
  32.                         DW_AT_type                  <0x0000007e> 
  33. < 2><0x00000068>      DW_TAG_variable 
  34.                         DW_AT_location              DW_OP_fbreg -24 
  35.                         DW_AT_name                  c 
  36.                         DW_AT_decl_file             0x00000001 /super/secret/path/MiniDbg/examples/variable.cpp 
  37.                         DW_AT_decl_line             0x00000004 
  38.                         DW_AT_type                  <0x0000007e> 
  39. < 1><0x00000077>    DW_TAG_base_type 
  40.                       DW_AT_name                  int 
  41.                       DW_AT_encoding              DW_ATE_signed 
  42.                       DW_AT_byte_size             0x00000004 
  43. < 1><0x0000007e>    DW_TAG_base_type 
  44.                       DW_AT_name                  long int 
  45.                       DW_AT_encoding              DW_ATE_signed 
  46.                       DW_AT_byte_size             0x00000008 

***個 DIE 表示一個編譯單元(CU),實際上是一個包括了所有 #includes 和類似語句的源文件。下面是帶含義注釋的屬性:

  1. DW_AT_producer   clang version 3.9.1 (tags/RELEASE_391/final)    <-- 產生該二進制文件的編譯器 
  2. DW_AT_language   DW_LANG_C_plus_plus                             <-- 原編程語言 
  3. DW_AT_name       /super/secret/path/MiniDbg/examples/variable.cpp  <-- 該 CU 表示的文件名稱 
  4. DW_AT_stmt_list  0x00000000                                      <-- 跟蹤該 CU 的行表偏移 
  5. DW_AT_comp_dir   /super/secret/path/MiniDbg/build                  <-- 編譯目錄 
  6. DW_AT_low_pc     0x00400670                                      <-- 該 CU 的代碼起始 
  7. DW_AT_high_pc    0x0040069c                                      <-- 該 CU 的代碼結尾 

其它的 DIEs 遵循類似的模式,你也很可能推測出不同屬性的含義。

現在我們可以根據新學到的 DWARF 知識嘗試和解決一些實際問題。

當前我在哪個函數?

假設我們有一個程序計數器值然后想找到當前我們在哪一個函數。一個解決該問題的簡單算法:

  1. for each compile unit: 
  2.     if the pc is between DW_AT_low_pc and DW_AT_high_pc: 
  3.         for each function in the compile unit: 
  4.             if the pc is between DW_AT_low_pc and DW_AT_high_pc: 
  5.                 return function information 

這對于很多目的都有效,但如果有成員函數或者內聯(inline),就會變得更加復雜。假如有內聯,一旦我們找到其范圍包括我們的程序計數器(PC)的函數,我們需要遞歸遍歷該 DIE 的所有孩子檢查有沒有內聯函數能更好地匹配。在我的代碼中,我不會為該調試器處理內聯,但如果你想要的話你可以添加該功能。

如何在一個函數上設置斷點?

再次說明,這取決于你是否想要支持成員函數、命名空間以及類似的東西。對于簡單的函數你只需要迭代遍歷不同編譯單元中的函數直到你找到一個合適的名字。如果你的編譯器能夠填充 .debug_pubnames 部分,你可以更高效地做到這點。

一旦找到了函數,你可以在 DW_AT_low_pc 給定的內存地址設置一個斷點。不過那會在函數序言處中斷,但更合適的是在用戶代碼處中斷。由于行表信息可以指定序言的結束的內存地址,你只需要在行表中查找 DW_AT_low_pc 的值,然后一直讀取直到被標記為序言結束的條目。一些編譯器不會輸出這些信息,因此另一種方式是在該函數第二行條目指定的地址處設置斷點。

假如我們想在我們示例程序中的 main 函數設置斷點。我們查找名為 main 的函數,獲取到它的 DIE:

  1. < 1><0x0000002e>    DW_TAG_subprogram 
  2.                       DW_AT_low_pc                0x00400670 
  3.                       DW_AT_high_pc               0x0040069c 
  4.                       DW_AT_frame_base            DW_OP_reg6 
  5.                       DW_AT_name                  main 
  6.                       DW_AT_decl_file             0x00000001 /super/secret/path/MiniDbg/examples/variable.cpp 
  7.                       DW_AT_decl_line             0x00000001 
  8.                       DW_AT_type                  <0x00000077> 
  9.                       DW_AT_external              yes(1) 

這告訴我們函數從 0x00400670 開始。如果我們在行表中查找這個,我們可以獲得條目:

  1. 0x00400670  [   1, 0] NS uri: "/super/secret/path/MiniDbg/examples/variable.cpp" 

我們希望跳過序言,因此我們再讀取一個條目:

  1. 0x00400676 [ 2,10] NS PE 

Clang 在這個條目中包括了序言結束標記,因此我們知道在這里停止,然后在地址 0x00400676 處設一個斷點。

我如何讀取一個變量的內容?

讀取變量可能非常復雜。它們是難以捉摸的東西,可能在整個函數中移動、保存在寄存器中、被放置于內存、被優化掉、隱藏在角落里,等等。幸運的是我們的簡單示例是真的很簡單。如果我們想讀取變量 a 的內容,我們需要看它的 DW_AT_location 屬性:

  1. DW_AT_location DW_OP_fbreg -8 

這告訴我們內容被保存在以棧幀基(base of the stack frame)偏移為 -8 的地方。為了找到棧幀基,我們查找所在函數的 DW_AT_frame_base 屬性。

  1. DW_AT_frame_base DW_OP_reg6 

從 System V x86_64 ABI 我們可以知道 reg6 在 x86 中是幀指針寄存器。現在我們讀取幀指針的內容,從中減去 8,就找到了我們的變量。如果我們知道它具體是什么,我們還需要看它的類型:

  1. < 2><0x0000004c>      DW_TAG_variable 
  2.                         DW_AT_name                  a 
  3.                         DW_AT_type                  <0x0000007e> 

如果我們在調試信息中查找該類型,我們得到下面的 DIE:

  1. < 1><0x0000007e>    DW_TAG_base_type 
  2.                       DW_AT_name                  long int 
  3.                       DW_AT_encoding              DW_ATE_signed 
  4.                       DW_AT_byte_size             0x00000008 

這告訴我們該類型是 8 字節(64 位)有符號整型,因此我們可以繼續并把這些字節解析為 int64_t 并向用戶顯示。

當然,類型可能比那要復雜得多,因為它們要能夠表示類似 C++ 的類型,但是這能給你它們如何工作的基本認識。

再次回到幀基(frame base),Clang 可以通過幀指針寄存器跟蹤幀基。最近版本的 GCC 傾向于使用 DW_OP_call_frame_cfa,它包括解析 .eh_frame ELF 部分,那是一個我不會去寫的另外一篇完全不同的文章。如果你告訴 GCC 使用 DWARF 2 而不是最近的版本,它會傾向于輸出位置列表,這更便于閱讀:

  1. DW_AT_frame_base            <loclist at offset 0x00000000 with 4 entries follows> 
  2.  low-off : 0x00000000 addr  0x00400696 high-off  0x00000001 addr 0x00400697>DW_OP_breg7+8 
  3.  low-off : 0x00000001 addr  0x00400697 high-off  0x00000004 addr 0x0040069a>DW_OP_breg7+16 
  4.  low-off : 0x00000004 addr  0x0040069a high-off  0x00000031 addr 0x004006c7>DW_OP_breg6+16 
  5.  low-off : 0x00000031 addr  0x004006c7 high-off  0x00000032 addr 0x004006c8>DW_OP_breg7+8 

位置列表取決于程序計數器所處的位置給出不同的位置。這個例子告訴我們如果程序計數器是在 DW_AT_low_pc 偏移量為 0x0 的位置,那么幀基就在和寄存器 7 中保存的值偏移量為 8 的位置,如果它是在 0x1 和 0x4 之間,那么幀基就在和相同位置偏移量為 16 的位置,以此類推。

休息一會

這里有很多的信息需要你的大腦消化,但好消息是在后面的幾篇文章中我們會用一個庫替我們完成這些艱難的工作。理解概念仍然很有幫助,尤其是當出現錯誤或者你想支持一些你使用的 DWARF 庫所沒有實現的 DWARF 概念時。

如果你想了解更多關于 DWARF 的內容,那么你可以從這里獲取其標準。在寫這篇博客時,剛剛發布了 DWARF 5,但更普遍支持 DWARF 4。 

責任編輯:龐桂玉 來源: Linux中國
相關推薦

2017-06-28 14:21:22

Linux調試器斷點

2017-08-28 14:40:57

Linux調試器源碼和信號

2017-06-22 10:44:55

Linux調試器準備環境

2017-07-05 14:37:07

Linux調試器寄存器和內存

2017-10-09 10:26:01

Linux調試器堆棧展開

2017-10-09 10:56:49

Linux調試器處理變量

2017-10-12 18:20:44

Linux調試器高級主題

2017-09-25 08:04:31

Linux調試器源碼級斷點

2017-08-28 15:29:19

Linux調試器源碼級逐步執行

2017-04-19 21:35:38

Linux調試器工作原理

2011-08-25 16:34:27

Lua調試器

2010-12-21 10:16:53

2020-03-16 10:05:13

EmacsGUDLinux

2010-03-01 11:06:52

Python 調試器

2009-12-14 10:57:34

Ruby調試器

2011-08-31 16:51:12

Lua調試器

2010-05-28 14:14:37

Linux開發工具

2019-12-06 14:30:41

GNU調試器GDB修復代碼

2024-03-13 08:00:00

Linux調試器應用程序

2023-02-28 11:39:55

CMake腳本項目
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲 欧美 激情 另类 校园 | 欧美在线天堂 | 亚洲精品乱码久久久久久按摩 | 一区二区福利视频 | 亚洲97| 97国产精品视频人人做人人爱 | 91久久久久久久久久久久久 | 精品国产91乱码一区二区三区 | 成人片免费看 | 亚洲一区二区精品视频在线观看 | 国产在线观看一区二区三区 | com.国产 | 七七婷婷婷婷精品国产 | 久久婷婷麻豆国产91天堂 | 久久久久国产一级毛片高清网站 | 国产精品中文字幕在线 | 国产av毛片 | 久久久久国 | 欧美午夜影院 | 九九九久久国产免费 | 中文字幕成人免费视频 | 国产视频一区二区在线观看 | 成人九色 | 99pao成人国产永久免费视频 | 国产成人免费在线 | 精品www| 欧美一区二区三区在线观看 | 四虎伊人| 国精日本亚洲欧州国产中文久久 | 777毛片| 久久国产精品偷 | 国产午夜精品一区二区三区嫩草 | 91在线视频精品 | 国产精品电影在线观看 | 国产在线视频网 | 欧美日韩在线一区二区三区 | www.国产| 国产黄视频在线播放 | 日韩理论电影在线观看 | 夜夜干夜夜操 | 日本一区二区不卡 |