Linux的ldconfig命令的代碼原理:ldconfig如何從指定目錄中查找動(dòng)態(tài)庫文件信息?
ldconfig的代碼中,search_dir()函數(shù)的關(guān)鍵內(nèi)容[1]
這部分關(guān)鍵代碼,負(fù)責(zé)查找指定目錄的動(dòng)態(tài)庫文件,與系統(tǒng)已有的ld.so.cache的記錄對比,如果有變化或系統(tǒng)緩存記錄中不存在,則將當(dāng)前動(dòng)態(tài)庫的信息加入到緩存信息鏈表。
/* Add library to list. 將動(dòng)態(tài)庫信息添加到鏈表*/
struct dlib_entry *dlib_ptr;
for (dlib_ptr = dlibs; dlib_ptr != NULL; dlib_ptr = dlib_ptr->next)
{
/* Is soname already in list? 檢查SONAME記錄在鏈表中是否已存在,避免同一個(gè)庫重復(fù)添加多次*/
if (strcmp (dlib_ptr->soname, soname) == 0)
{
/* Prefer a file to a link, otherwise check which one
is newer.
SONAME的判定,以常規(guī)文件為優(yōu)先來源,而不優(yōu)先以鏈接文件作為SONAME的來源。
*/
if ((!is_link && dlib_ptr->is_link)
|| (is_link == dlib_ptr->is_link
&& _dl_cache_libcmp (dlib_ptr->name, direntry->d_name) < 0))
{
/* It s newer - add it. */
/* Flag should be the same - sanity check. */
if (dlib_ptr->flag != flag)
{
if (dlib_ptr->flag == FLAG_ELF
&& (flag == FLAG_ELF_LIBC5 || flag == FLAG_ELF_LIBC6))
dlib_ptr->flag = flag;
else if ((dlib_ptr->flag == FLAG_ELF_LIBC5
|| dlib_ptr->flag == FLAG_ELF_LIBC6)
&& flag == FLAG_ELF)
dlib_ptr->flag = flag;
else
error (0, 0, _("libraries %s and %s in directory %s have same soname but different type."),
dlib_ptr->name, direntry->d_name,
entry->path);
}
free (dlib_ptr->name);
dlib_ptr->name = xstrdup (direntry->d_name);
dlib_ptr->is_link = is_link;
dlib_ptr->osversion = osversion;
dlib_ptr->isa_level = isa_level;
}
/* Don t add this library, abort loop. */
/* Also free soname, since it s dynamically allocated. */
free (soname);
break;
}
}
/* Add the library if it s not already in.
如果該動(dòng)態(tài)庫沒在緩存列表中,則添加到鏈表記錄中。
這里看到,動(dòng)態(tài)庫的信息分為name、SONAME、flag、是否為鏈接、os版本、isa_level這幾個(gè)方面
*/
if (dlib_ptr == NULL)
{
dlib_ptr = (struct dlib_entry *)xmalloc (sizeof (struct dlib_entry));
dlib_ptr->name = xstrdup (direntry->d_name);
dlib_ptr->soname = soname;
dlib_ptr->flag = flag;
dlib_ptr->is_link = is_link;
dlib_ptr->osversion = osversion;
dlib_ptr->isa_level = isa_level;
/* Add at head of list. */
dlib_ptr->next = dlibs;
dlibs = dlib_ptr;
}
}
繼續(xù)處理,下面代碼仍然是 search_dir()函數(shù)的代碼,用于核對得到的緩存信息列表
的文件,把那些指向軟鏈接的軟鏈接文件,判斷為多余的記錄(節(jié)點(diǎn)),給予剔除。
ldconfig的幫助文檔[2]說,/etc/ld.so.cache 文件的內(nèi)容是有序列表,記錄了/etc/ld.so.conf配置文件(及/etc/ld.so.conf.d/*.conf 這些子配置文件)中指定的目錄,這些所有目錄下的動(dòng)態(tài)庫文件的有效信息。除了這些目錄,還包含了 通過命令行指定的目錄、以及系統(tǒng)必要的目錄 /lib、 /lib64 中的動(dòng)態(tài)庫文件信息。
/* Now dlibs contains a list of all libs - add those to the cache
and created all symbolic links.
dlibs 包含了指定目錄下查找到的所有動(dòng)態(tài)庫信息。將用于添加到緩存,并創(chuàng)建軟鏈接(SONAME 文件)。
*/
struct dlib_entry *dlib_ptr;
for (dlib_ptr = dlibs; dlib_ptr != NULL; dlib_ptr = dlib_ptr->next)
{
/* The cached file name is the soname for non-glibc-hwcaps
subdirectories (relying on symbolic links; this helps with
library updates that change the file name), and the actual
file for glibc-hwcaps subdirectories.
/etc/ld.so.cache 文件的
*/
const char *filename;
if (entry->hwcaps == NULL)
{
/* Don t create links to links.
不創(chuàng)建指向鏈接文件的鏈接。
*/
if (dlib_ptr->is_link == 0)
create_links (dir_name, entry->path, dlib_ptr->name,
dlib_ptr->soname);
filename = dlib_ptr->soname;
}
else
{
/* Do not create links in glibc-hwcaps subdirectories, but
still log the cache addition.
glibc 的 hwcaps 是2.33 版本開始引入的功能,
支持hwcaps意味著除了常規(guī)編譯的庫之外,現(xiàn)在還可以使用來自最新 CPU
的擴(kuò)展 cpu 指令集來安裝庫,glibc 將自動(dòng)選擇針對當(dāng)前使用的
cpu 優(yōu)化的版本。ldconfig對于glibc-hwcaps子目錄下的動(dòng)態(tài)庫,
不會(huì)創(chuàng)建對應(yīng)的SONAME,但仍會(huì)記錄記錄到/etc/ld.so.cache文件內(nèi)。
以被Linux在運(yùn)行時(shí)按需使用。
*/
if (opt_verbose)
printf ("\t%s -> %s\n", dlib_ptr->soname, dlib_ptr->name);
filename = dlib_ptr->name;
}
if (opt_build_cache)
add_to_cache (entry->path, filename, dlib_ptr->soname,
dlib_ptr->flag, dlib_ptr->osversion,
dlib_ptr->isa_level, hwcap, entry->hwcaps);
}
從上面代碼出現(xiàn)的hwcaps相關(guān)的處理,在此補(bǔ)充一下關(guān)于glibc-hwcaps的作用說明 Hackweek 20: glibc-hwcaps in openSUSE[3];glibc-hwcaps 與AMD CPU的性能優(yōu)化的關(guān)系[4],指出glibc-hwcaps 是基礎(chǔ)設(shè)施的開始,以便能夠更容易地根據(jù)硬件功能交付優(yōu)化的庫/共享對象。這是在庫級別,用于提供插入式優(yōu)化庫,而不是 GCC 的 FMV(函數(shù)多版本控制)之類的庫,后者在構(gòu)建時(shí)試圖提供優(yōu)化的函數(shù),然后在運(yùn)行時(shí)根據(jù) CPU 主機(jī)進(jìn)行選擇。
以上代碼最后看到的 add_to_cache(……),的用法是這樣的:
add_to_cache (entry->path, filename, dlib_ptr->soname,
dlib_ptr->flag, dlib_ptr->osversion,
dlib_ptr->isa_level, hwcap, entry->hwcaps);
從名稱上看,就是把 找到的一個(gè)動(dòng)態(tài)庫的記錄,添加到緩存數(shù)據(jù)結(jié)構(gòu)(鏈表)中。這個(gè)是在for (dlib_ptr = dlibs; dlib_ptr != NULL; dlib_ptr = dlib_ptr->next) 的for 每次循環(huán)過程的最后執(zhí)行的,也就是把有效的動(dòng)態(tài)庫信息添加到鏈表。
從上層看,概要的,ldconfig 生成緩存文件,有這樣的大體流程:
main() {……
search_dirs (void)//獲取所有待查找的目錄列表
{
struct dir_entry *entry;
for (entry = dir_entries; entry != NULL; entry = entry->next)
search_dir (entry); // 進(jìn)入每個(gè)目錄,查找動(dòng)態(tài)庫,并記錄到鏈表中
}
}
if (opt_build_cache)//若命令行參數(shù)要求生成緩存文件
{
save_cache (cache_file); //保存最終的緩存結(jié)果數(shù)據(jù)到 指定的緩存文件
//不指定文件路徑則默認(rèn)是/etc/ld.so.cache 文件。
if (aux_cache_file)// aux_cache_file是輔助緩存文件。
save_aux_cache (aux_cache_file);
}
}
看一看這個(gè)流程,就對ldconfig如何將最新從/etc/ld.so.conf文件讀取的動(dòng)態(tài)庫目錄下的所有動(dòng)態(tài)庫的緩存信息,生成為/etc/ld.so.cache緩存文件,有了整體的認(rèn)識。
看完這些代碼,說幾點(diǎn)印象:
- 這些代碼考慮到很多方面,不是一次成型的,通過git提交記錄,以及changelog文件,我們看到Linux動(dòng)態(tài)庫的版本格式從glib4/5/6 有發(fā)展演化。
- glibc 的ldconfig的代碼是C語言實(shí)現(xiàn)的,其生成的/etc/ld.so.cache緩存文件,對于Linux下的依賴動(dòng)態(tài)庫的可執(zhí)行文件的正常運(yùn)行,關(guān)系重大。所以為了優(yōu)化,和確保軟件更新后的穩(wěn)定性,會(huì)有一套命名標(biāo)準(zhǔn)。比如SONAME的命名機(jī)制。對軟鏈接是否有效的判斷,以及對新動(dòng)態(tài)庫的軟鏈接信息的更新。所以總體流程還是比較繁雜的。要考慮到的細(xì)節(jié)比較多。從git commit歷史看,代碼維護(hù)者的名稱大部分是國外開發(fā)者。
- ldconfig 的C語言風(fēng)格有編碼排版約定,可讀性尚可。也做了模塊拆分(如 ldconfig的功能,劃分到了多個(gè)文件,如入口文件 ldconfig.c 、緩存的讀寫邏輯實(shí)現(xiàn)文件 cache.c 、SONAME文件輔助功能文件readlib.c 、 chroot功能文件 chroot_canon.c )
- ldconfig 的代碼存在的不足,也是很多C項(xiàng)目的問題,使用了很多全局變量,各個(gè)函數(shù)到處在直接操作全局變量。雖然功能上沒問題,高手寫的代碼也不會(huì)有運(yùn)行異常,但總感覺可讀性和內(nèi)聚程度降低了。如果是我來實(shí)現(xiàn)ldcnfig,我會(huì)在內(nèi)聚性和代碼注釋方面做一些改進(jìn)。減少全局靜態(tài)變量的使用;改成main()內(nèi)部的變量,且通過main向被調(diào)用的函數(shù)傳參指針參數(shù)的方式傳入待讀寫的變量。以此提高可讀性。
- 部分函數(shù)的單函數(shù)代碼行數(shù)過長,比如search_dir(),還可以再拆分成多個(gè)函數(shù)。也是為了可讀性能好一些。
- 部分關(guān)鍵結(jié)構(gòu)體的成員變量定義時(shí),沒有注釋說明其作用。雖然通過看調(diào)用代碼能知道,但這樣的struct定義降低了可讀性。
總之,通過本系列文章對Linux 的ldconfig命令的源碼,從讀動(dòng)態(tài)緩存文件、打印庫緩存信息、查找/etc/ld.so.conf 指定的目錄的動(dòng)態(tài)庫信息等功能做了原理分析。希望對讀者理解ldconfig的原理些許幫助。
參考資料:
- [1]ldconfig的代碼中,search_dir()函數(shù)的關(guān)鍵內(nèi)容: https://sourceware.org/git?p=glibc.git;a=blob;f=elf/ldconfig.c;h=bccd386761d8cbb226bd3b02c17bf55cd552cee4;hb=HEAD#l702
- [2]ldconfig的幫助文檔: https://www.man7.org/linux/man-pages/man8/ldconfig.8.html
- [3]Hackweek 20: glibc-hwcaps in openSUSE: https://antlarr.io/tag/glibc-hwcaps/
- [4]glibc-hwcaps 與AMD CPU的性能優(yōu)化的關(guān)系: https://www.phoronix.com/news/glibc-hwcaps-RFC