Linux:如何調(diào)試 Malloc 的底層源碼
一、背景
1. 講故事
上一篇我們聊過 C# 調(diào)用 C 的 malloc 代碼來演示heap的內(nèi)存泄露問題,但要想深入研究得必須把 malloc 的實現(xiàn)庫 libc.so 給調(diào)試起來,大家都知道在Linux 上 libc 和 Windows 的 Win32 API 是一個層級的,由于 Linux 重度依賴 libc,比較吐槽的是兩者各自為政,如果手工編譯 libc,容易搞出很多兼容性問題,這一點真的不如 Windows 的大一統(tǒng)來的痛快,手工編譯比較繁瑣,用此篇來記錄下。
二、手工編譯 libc
1. 下載 libc 2.39 源代碼
要想知道下載哪個版本的 libc,可以用 ldd 觀察現(xiàn)存的 libc 版本,參考如下:
root@ubuntu2404:/data# ldd /bin/bash | grep libc
libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x0000737556800000)
root@ubuntu2404:/data# /lib/x86_64-linux-gnu/libc.so.6
GNU C Library (Ubuntu GLIBC 2.39-0ubuntu8.4) stable release version 2.39.
Copyright (C) 2024 Free Software Foundation, Inc.
This is free software; see the sourcefor copying conditions.
There is NO warranty; not even for MERCHANTABILITY or FITNESS FOR A
PARTICULAR PURPOSE.
Compiled by GNU CC version 13.3.0.
libc ABIs: UNIQUE IFUNC ABSOLUTE
Minimum supported kernel: 3.2.0
For bug reporting instructions, please see:
<https://bugs.launchpad.net/ubuntu/+source/glibc/+bugs>.
從卦象看,當前 libc 的版本是 Ubuntu GLIBC 2.39-0ubuntu8.4
,接下來下載 2.39 版本的源代碼進行編譯即可。
root@ubuntu2404:/src# wget http://ftp.gnu.org/gnu/libc/glibc-2.39.tar.gz
root@ubuntu2404:/src# tar -xzf glibc-2.39.tar.gz && cd glibc-2.39 && mkdir build && cd build
root@ubuntu2404:/src/glibc-2.39/build# ../configure --prefix=/usr --enable-debug=yes
root@ubuntu2404:/src/glibc-2.39/build# make -j$(nproc)
root@ubuntu2404:/src/glibc-2.39/build# ./libc.so --version
GNU C Library (GNU libc) stable release version 2.39.
Copyright (C) 2024 Free Software Foundation, Inc.
...
稍等片刻后,就可以看到源碼編譯出來的 libc.so ,截圖如下:
2. 配置 C 代碼
寫了一段簡單的 C 代碼,參考如下:
#include <stdio.h>
#include <stdlib.h>
int main()
{
// getchar(); !!! 先注釋掉的,后續(xù)放開
void *ptr = malloc(100);
if (ptr == NULL)
{
fprintf(stderr, "malloc failed\n");
return1;
}
free(ptr);
printf("malloc and free succeeded\n");
getchar();
return0;
}
為了能夠加載我的libc庫,使用 `LD_PRELOAD` 環(huán)境變量指定,本想用 gdb 啟動調(diào)試的方式執(zhí)行 main,無奈編譯出來的 __vdso_timeDuring 和 kernel 有兼容性問題導(dǎo)致報錯,輸出如下:
``` C#
root@ubuntu2404:/data# gdb ./main
Reading symbols from ./main...
(gdb) set environment LD_PRELOAD /src/glibc-2.39/build/libc.so
(gdb) run
Starting program: /data/main
58340: __vdso_timeDuring startup program terminated with signal SIGSEGV, Segmentation fault.
一定搗鼓之后,我發(fā)現(xiàn)不用 gdb 啟動就沒有問題,同時內(nèi)存段也掛上了我的自定義libc,太棒了,輸出如下:
root@ubuntu2404:/data# LD_PRELOAD=/src/glibc-2.39/build/libc.so ./main
mallocandfree succeeded
root@ubuntu2404:/src/glibc-2.39/build# ps -ef | grep main
root 58361 1251013:55 pts/0 00:00:00 ./main
root 58366 1869013:56 pts/1 00:00:00 grep --color=auto main
root@ubuntu2404:/src/glibc-2.39/build# cat /proc/58361/maps
60fc4cd29000-60fc4cd2a000 r--p 0000000008:031703942 /data/main
60fc4cd2a000-60fc4cd2b000 r-xp 0000100008:031703942 /data/main
60fc4cd2b000-60fc4cd2c000 r--p 0000200008:031703942 /data/main
60fc4cd2c000-60fc4cd2d000 r--p 0000200008:031703942 /data/main
60fc4cd2d000-60fc4cd2e000 rw-p 0000300008:031703942 /data/main
60fc8a96c000-60fc8a98d000 rw-p 0000000000:000 [heap]
7add43aaa000-7add43aad000 rw-p 0000000000:000
7add43aad000-7add43ad1000 r--p 0000000008:032915675 /src/glibc-2.39/build/libc.so
7add43ad1000-7add43c21000 r-xp 0002400008:032915675 /src/glibc-2.39/build/libc.so
7add43c21000-7add43c78000 r--p 0017400008:032915675 /src/glibc-2.39/build/libc.so
7add43c78000-7add43c7c000 r--p 001ca000 08:032915675 /src/glibc-2.39/build/libc.so
7add43c7c000-7add43c7e000 rw-p 001ce000 08:032915675 /src/glibc-2.39/build/libc.so
...
這就叫在絕望中尋找希望,既然能運行,那就用 gdb 附加調(diào)試吧,只要能研究到 malloc 的底層代碼才是最終目的。。。
把 main() 函數(shù)入口的 getchar()
給注釋掉,方便在 malloc 之前通過 attach 附加,為了能夠在 vscode 中操作,新增一個對可執(zhí)行文件可控的 launch.json,內(nèi)容如下:
{
"configurations": [
{
"name": "C/C++: gcc build and debug active file",
"type": "cppdbg",
"request": "attach",
"program": "${fileDirname}/${fileBasenameNoExtension}",
"processId": "${command:pickProcess}", // 選擇要附加的進程
"stopAtEntry": false,
"setupCommands": [
{
"description": "Enable pretty-printing for gdb",
"text": "-enable-pretty-printing",
"ignoreFailures": true
},
{
"description": "Set Disassembly Flavor to Intel",
"text": "-gdb-set disassembly-flavor intel",
"ignoreFailures": true
}
],
}
],
"version": "2.0.0"
}
再新增一個 gcc 編譯的 task 任務(wù)文件 (task.json),內(nèi)容如下:
{
"tasks": [
{
"type": "cppbuild",
"label": "C/C++: gcc build active file",
"command": "/usr/bin/gcc",
"args": [
"-fdiagnostics-color=always",
"-g",
"${file}",
"-o",
"${fileDirname}/${fileBasenameNoExtension}"
],
"options": {
"cwd": "${fileDirname}"
},
"problemMatcher": [
"$gcc"
],
"group": {
"kind": "build",
"isDefault": true
},
"detail": "Task generated by Debugger."
}
],
"version": "2.0.0"
}
稍微解釋一下:
"processId": "${command:pickProcess}"
表示彈框選擇你要附加的進程。"request": "attach"
使用附加進程的模式
在 vscode 中使用 Ctrl+Shift+B
或者 gcc -g main.c -o main
對代碼進行構(gòu)建,接下來執(zhí)行代碼。
root@ubuntu2404:/data# LD_PRELOAD=/src/glibc-2.39/build/libc.so ./main
root@ubuntu2404:/src/glibc-2.39/build# ps -ef | grep main
root 58992 1251 0 14:14 pts/0 00:00:00 ./main
root 58999 1869 0 14:16 pts/1 00:00:00 grep --color=auto main
點擊UI中 Run -> Start Debugging
選擇要附加的 pid=58992
,截圖如下:
圖片
3. 觀察效果
vscode 附加成功后,在 UI 上 Enter 回車過掉 getchar(),單步 F11 調(diào)試即可進入 malloc 方法實現(xiàn),挺有意思的,最后給大家截一張大圖:
圖片
三、總結(jié)
對 Win32 級別的 libc 進行源碼調(diào)試,有助于我們對書籍中那些malloc的底層理論知識有一個很好的眼見為實,也是給Linux上的.NET高級調(diào)試打開了一扇窗!