成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一篇學會Linux ptrace 的實現

系統 Linux
本文介紹這些工具的底層 ptrace 是如何實現的。這里選用了 1.2.13 的早期版本,原理是類似的,新版內核代碼過多,沒必要陷入過多細節中。

[[438549]]

ptrace 是 Linux 內核提供的非常強大的系統調用,通過 ptrace 可以實現進程的單步調試和收集系統調用情況。比如 strace 和 gdb 都是基于 ptrace 實現的,strace 可以顯示進程調用了哪些系統調用,gdb 可以實現對進程的調試。本文介紹這些工具的底層 ptrace 是如何實現的。這里選用了 1.2.13 的早期版本,原理是類似的,新版內核代碼過多,沒必要陷入過多細節中。

1 進程調試

ptrace 系統調用的實現中包含了很多功能,首先來看一下單步調試的實現。通過 ptrace 實現單步調試的方式有兩種。

1. 父進程執行 fork 創建一個子進程,通過 ptrace 設置子進程為 PF_PTRACED 標記,然后執行 execve 加載被調試的程序。

2. 通過 ptrace attach 到指定的 pid 完成對進程的調試(控制)。

首先看一下第一種的實現。

1.1 方式1

  1. pid_t pid = fork();// 子進程if (pid == 0) { 
  2.     ptrace(PTRACE_TRACEME,0,NULL,NULL); 
  3.     // 加載被調試的程序 
  4.     execve(argv[1], NULLNULL); 

執行 fork 創建子進程后,通過 ptrace 的 PTRACE_TRACEME 指示操作系統設置子進程為被調試(設置 PF_PTRACED 標記)。來看一下這一步操作系統做了什么事情。

  1. asmlinkage int sys_ptrace(long request, long pid, long addr, long data){ 
  2.     if (request == PTRACE_TRACEME) { 
  3.         current->flags |= PF_PTRACED; 
  4.         return 0; 
  5.     } 

這一步非常簡單,接著看 execve 加載程序到內存執行時又是如何處理的。

  1. int do_execve(char * filename, char ** argv, char ** envp, struct pt_regs * regs) { 
  2.     // 加載程序 
  3.     for (fmt = formats ; fmt ; fmt = fmt->next) { 
  4.         int (*fn)(struct linux_binprm *, struct pt_regs *) = fmt->load_binary; 
  5.         retval = fn(&bprm, regs); 
  6.     } 

do_execve 邏輯非常復雜,不過我們只關注需要的就好。do_execve 通過鉤子函數加載程序,我們看看 formats 是什么。

  1. struct linux_binfmt { 
  2.     struct linux_binfmt * next
  3.     int *use_count; 
  4.     int (*load_binary)(struct linux_binprm *, struct  pt_regs * regs); 
  5.     int (*load_shlib)(int fd); 
  6.     int (*core_dump)(long signr, struct pt_regs * regs); 
  7. }; 
  8.  
  9. static struct linux_binfmt *formats = &aout_format;int register_binfmt(struct linux_binfmt * fmt){ 
  10.     struct linux_binfmt ** tmp = &formats; 
  11.  
  12.     if (!fmt) 
  13.         return -EINVAL; 
  14.     if (fmt->next
  15.         return -EBUSY; 
  16.     while (*tmp) { 
  17.         if (fmt == *tmp) 
  18.             return -EBUSY; 
  19.         tmp = &(*tmp)->next
  20.     } 
  21.     *tmp = fmt; 
  22.     return 0;    

可以看到 formats 是一個鏈表。可以通過 register_binfmt 函數注冊節點。那么誰調用了這個函數呢?

  1. struct linux_binfmt elf_format = { 
  2.  
  3. NULLNULL, load_elf_binary, load_elf_library, NULL};int init_module(void) { 
  4.  
  5. register_binfmt(&elf_format); 
  6.  
  7. return 0; 
  8.  

所以最終調用了 load_elf_binary 函數加載程序。同樣我們只關注相關的邏輯。

  1. if (current->flags & PF_PTRACED) 
  2.         send_sig(SIGTRAP, current, 0); 

load_elf_binary 中會判斷如果進程設置了 PF_PTRACED 標記,那么會給當前進程發送一個 SIGTRAP 信號。接著看信號處理函數的相關邏輯。

  1. if ((current->flags & PF_PTRACED) && signr != SIGKILL) { 
  2.     current->exit_code = signr; 
  3.     // 修改當前進程(被調試的進程)為暫停狀態 
  4.     current->state = TASK_STOPPED; 
  5.     // 通知父進程 
  6.     notify_parent(current); 
  7.     // 調度其他進程執行 
  8.     schedule(); 

所以程序被加載到內存后,根本沒有機會執行就直接被修改為暫停狀態了,接下來看看 notify_parent 通知父進程干什么。

  1. void notify_parent(struct task_struct * tsk){    
  2.     // 給父進程發送 SIGCHLD 信號 
  3.     if (tsk->p_pptr == task[1]) 
  4.         tsk->exit_signal = SIGCHLD; 
  5.     send_sig(tsk->exit_signal, tsk->p_pptr, 1); 
  6.     wake_up_interruptible(&tsk->p_pptr->wait_chldexit); 

父進程收到信號后,可以通過 sys_ptrace 控制子進程,sys_ptrace 還提供了很多功能,比如讀取子進程的數據。

  1. // pid 為子進程 id 
  2.  
  3. num = ptrace(PTRACE_PEEKUSER, pid, ORIG_RAX * 8, NULL); 

這個就不展開了,主要是內存的校驗和數據讀取。這里講一下 PTRACE_SINGLESTEP 命令,這個命令控制子進程單步執行的。

  1. case PTRACE_SINGLESTEP: {  /* set the trap flag. */ 
  2.         long tmp; 
  3.         child->flags &= ~PF_TRACESYS; 
  4.         // 設置 eflags 的單步調試 flag 
  5.         tmp = get_stack_long(child, sizeof(long)*EFL-MAGICNUMBER) | TRAP_FLAG; 
  6.         put_stack_long(child, sizeof(long)*EFL-MAGICNUMBER,tmp); 
  7.         // 修改子進程狀態為可執行 
  8.         child->state = TASK_RUNNING; 
  9.         child->exit_code = data; 
  10.         return 0; 

PTRACE_SINGLESTEP 讓子進程重新進入運行狀態,但是有一個很關鍵的是,設置好了單步調試 flag。我們看看 trap flag 是什么。

  1. A trap flag permits operation of a processor in single-step mode. If such a flag is available, debuggers can use it to step through the execution of a computer program. 

也就是說,子進程執行一個指令后,就會被中斷,然后系統會給被調試進程發送 SIGTRAP 信號。同樣,被調試進程在信號處理函數里,通知父進程,從而控制權又回到了父進程手中,如此循環。

1.2 方式2

除了開始時通過 ptrace 設置進程調試,也可以通過 ptrace 動態設置調試進程的能力,具體是通過 PTRACE_ATTACH 命令實現的。

  1. if (request == PTRACE_ATTACH) { 
  2.         // 設置被調試標記 
  3.         child->flags |= PF_PTRACED; 
  4.         // 設置和父進程的關系 
  5.         if (child->p_pptr != current) { 
  6.             REMOVE_LINKS(child); 
  7.             child->p_pptr = current
  8.             SET_LINKS(child); 
  9.         } 
  10.         // 給被調試進程發送 SIGSTOP 信號 
  11.         send_sig(SIGSTOP, child, 1); 
  12.         return 0; 

前面已經分析過,信號處理函數里會設置進程為暫停狀態,然后通知主進程,主進程就可以控制子進程,具體和前面流程一樣。

2 跟蹤系統調用

ptrace 處理追蹤進程執行過程之外,還可以實現跟蹤系統調用。具體是通過 PTRACE_SYSCALL 命令實現。

  1. case PTRACE_SYSCALL: 
  2. case PTRACE_CONT: { 
  3.     long tmp; 
  4.     // 設置 PF_TRACESYS 標記 
  5.     if (request == PTRACE_SYSCALL) 
  6.         child->flags |= PF_TRACESYS; 
  7.     child->exit_code = data; 
  8.     child->state = TASK_RUNNING; 
  9.     // 清除 trap flag 標記 
  10.     tmp = get_stack_long(child, sizeof(long)*EFL-MAGICNUMBER) & ~TRAP_FLAG; 
  11.     put_stack_long(child, sizeof(long)*EFL-MAGICNUMBER,tmp); 
  12.     return 0; 

看起來很簡單,就是設置了一個新的標記 PF_TRACESYS。看看這個標記有什么用。

  1. // 調用 syscall_trace 函數 
  2. 1:  call _syscall_trace 
  3.     movl  
  4.     movl ORIG_EAX(%esp),%eax 
  5.     // 調用系統調用 
  6.     call _sys_call_table(,%eax,4) 
  7.     movl %eax,EAX(%esp)     # save the return value 
  8.     movl _current,%eax 
  9.     movl errno(%eax),%edx 
  10.     negl %edx 
  11.     je 1f 
  12.     movl %edx,EAX(%esp) 
  13.     orl $(CF_MASK),EFLAGS(%esp) # set carry to indicate error 
  14. // 調用 syscall_trace 函數 
  15. 1:  call _syscall_trace 

可以看到在系統調用的前后都有一個 syscall_trace 的邏輯,所以在系統調用前和后,我們都可以做點事情。來看看這個函數做了什么。

  1. asmlinkage void syscall_trace(void){ 
  2.     // 暫停子進程,通知父進程,并調度其他進程執行 
  3.     current->exit_code = SIGTRAP; 
  4.     current->state = TASK_STOPPED; 
  5.     notify_parent(current); 
  6.     schedule(); 

這里的邏輯就是把邏輯切換到主進程中,然后主進程就可以通過命令獲取被調試進程的系統調用信息。下面是一個追蹤進程所有系統調用的例子。

  1. /* 
  2.   use ptrace to find all system call that call by certain process 
  3. */ 
  4. #include <sys/ptrace.h> 
  5. #include <unistd.h> 
  6. #include <stdlib.h> 
  7. #include <sys/wait.h> 
  8. #include <stdio.h> 
  9. #include <sys/reg.h> 
  10.  
  11. int main(int argc, char *argv[]) { 
  12.     pid_t pid = fork(); 
  13.     if (pid < 0) { 
  14.         printf("fork failed"); 
  15.         exit(-1); 
  16.     } else if (pid == 0) { 
  17.         // set state of child process to PTRACE 
  18.         ptrace(PTRACE_TRACEME,0,NULL,NULL); 
  19.         // child will change to stopped state when in execve call, then send the signal to parent 
  20.         execve(argv[1], NULLNULL); 
  21.     } else { 
  22.         int status; 
  23.         int bit = 1; 
  24.         long num; 
  25.         long ret; 
  26.         // wait for child 
  27.         wait(&status); 
  28.         if(WIFEXITED(status)) 
  29.             return 0; 
  30.         // this is for execve call which will not returnand for os of 64-it => ORIG_RAX * 8 or os of 32-it => ORIG_EAX * 4 
  31.         num = ptrace(PTRACE_PEEKUSER, pid, ORIG_RAX * 8, NULL); 
  32.         printf("system call num = %ld\n", num); 
  33.         ptrace(PTRACE_SYSCALL, pid, NULLNULL); 
  34.         while(1) { 
  35.             wait(&status); 
  36.             if(WIFEXITED(status)) 
  37.                 return 0; 
  38.             // for enter system call 
  39.             if(bit) { 
  40.                 num = ptrace(PTRACE_PEEKUSER, pid, ORIG_RAX * 8, NULL); 
  41.                 printf("system call num = %ld", num); 
  42.                 bit = 0; 
  43.             } else { // for return of system call 
  44.                 ret = ptrace(PTRACE_PEEKUSER, pid, RAX*8, NULL); 
  45.                 printf("system call return = %ld \n", ret); 
  46.                 bit = 1; 
  47.             } 
  48.             // let this child process continue to run until call next system call 
  49.             ptrace(PTRACE_SYSCALL,pid,NULL,NULL); 
  50.         } 
  51.     } 

總結

 

ptrace 功能復雜而強大,理解它的原理對理解其他技術和工具都非常有意義,本文大概做了一個介紹,有興趣的同學可以自行查看源碼。

 

責任編輯:武曉燕 來源: 編程雜技
相關推薦

2022-05-17 08:02:55

GoTryLock模式

2021-10-29 07:35:32

Linux 命令系統

2024-04-02 12:36:01

2022-03-17 19:29:04

CSS切角自適應

2022-02-07 11:01:23

ZooKeeper

2022-01-02 08:43:46

Python

2021-10-26 10:40:26

代理模式虛擬

2022-06-30 22:53:18

數據結構算法

2021-08-01 07:19:16

語言OpenrestyNginx

2021-12-01 06:59:27

Linux發行版Manjaro

2021-09-28 08:59:30

復原IP地址

2021-10-14 10:22:19

逃逸JVM性能

2022-04-12 08:30:52

回調函數代碼調試

2021-10-27 09:59:35

存儲

2021-07-16 22:43:10

Go并發Golang

2023-03-13 21:38:08

TCP數據IP地址

2023-11-01 09:07:01

Spring裝配源碼

2022-10-20 07:39:26

2021-04-29 10:18:18

循環依賴數組

2021-07-02 08:51:29

源碼參數Thread
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产福利免费视频 | 草久久| 日本不卡免费新一二三区 | 五月天天丁香婷婷在线中 | 亚洲精品日韩精品 | 国产精品久久毛片av大全日韩 | 欧洲一区二区三区 | aaa在线观看 | 精品欧美乱码久久久久久 | 日日av| 中文字幕影院 | 精品久久久久一区二区国产 | 天天干天天干 | 日韩精品久久久久 | 国产精品国产馆在线真实露脸 | 欧美99| 成人免费视频 | 精品久久久久久久久久久院品网 | 国产99久久| av不卡一区 | 91久久精品一区二区二区 | 成人h动漫亚洲一区二区 | 精品一区二区三区日本 | 欧美a免费| 亚洲精色 | 亚洲一区在线播放 | 亚州精品天堂中文字幕 | 免费高潮视频95在线观看网站 | 精品久久久久国产 | 精品伊人久久 | 国产乱码久久久 | 亚洲国产成人在线 | 免费亚洲成人 | 亚洲国产一区在线 | 操网站 | 亚洲精品三级 | av免费在线观看网站 | 亚洲第一福利网 | 日本三级电影在线免费观看 | 日韩免费一区二区 | www.精品国产 |