深入理解Linux Kernel內核整體架構(圖文詳解)

一,前言

本文是“linux內核分析”系列文章的首篇,將從內核的核心功能出發,描述Linux內核的整體架構以及其下主要的軟件子系統。接著,本文會介紹Linux內核源文件的目錄結構,并與各個軟件子系統相對應。

注:本文及其他“Linux內核分析”系列文章基于以下約定:

a) 內核版本為Linux 3.10.29(該版本是一個長期支持版本,Linux社區將持續維護至少2年)。b) 考慮到嵌入式系統通常使用ARM處理器,因此涉及體系結構部分的內容均以ARM為分析對象

二,Linux內核的核心功能如下圖所示,Linux內核是Linux操作系統的一部分。向下,它管理系統的所有硬件設備;向上,它通過系統調用,向Library Routine(如C庫)或其他應用程序提供接口

深入理解Linux Kernel內核整體架構(圖文詳解)添加描述

因此,其核心功能就是:管理硬件設備,供應用程序使用。現代計算機(無論是PC還是嵌入式系統)的標準組成包括CPU、Memory(內存和外存)、輸入輸出設備、網絡設備和其他外圍設備。因此,為了管理這些設備,Linux內核提出了如下的架構。

三,Linux內核的整體架構

3.1 整體架構和子系統劃分

上圖展示了Linux內核的整體架構。根據內核的核心功能,Linux內核提出了5個子系統,分別負責以下功能:

  1. 進程調度(Process Scheduler),也稱為進程管理、進程調度。負責管理CPU資源,以便讓各個進程能夠以盡可能公平的方式訪問CPU。
  2. 內存管理(Memory Manager)。負責管理Memory(內存)資源,以便讓各個進程可以安全地共享機器的內存資源。此外,內存管理提供虛擬內存機制,該機制允許進程使用超過系統可用內存的內存,不用的內存會通過文件系統保存在外部非易失存儲器中,需要使用時再取回到內存中。
  3. 虛擬文件系統(VFS,Virtual File System)。Linux內核將不同功能的外部設備,例如Disk設備(硬盤、磁盤、NAND Flash、Nor Flash等)、輸入輸出設備、顯示設備等,抽象為可以通過統一的文件操作接口(open、close、read、write等)來訪問。這就是Linux系統“一切皆是文件”的體現(實際上,Linux做的并不徹底,因為CPU、內存、網絡等還不是文件,如果真的需要一切皆是文件,還得看貝爾實驗室正在開發的“Plan 9”)。
  4. 網絡子系統(Network)。負責管理系統的網絡設備,并實現多種多樣的網絡標準。
  5. 進程間通信(IPC,Inter-Process Communication)。IPC不管理任何硬件,它主要負責Linux系統中進程之間的通信。

3.2 進程調度(Process Scheduler)

進程調度是Linux內核中最重要的子系統之一,它主要提供對CPU的訪問控制。因為在計算機中,CPU資源是有限的,而眾多的應用程序都要使用CPU資源,所以需要“進程調度子系統”對CPU進行調度管理。

進程調度子系統包括4個子模塊(見下圖),它們的功能如下:

  1. Scheduling Policy,實現進程調度的策略,它決定哪個(或哪些)進程將擁有CPU。
  2. Architecture-specific Schedulers,體系結構相關的部分,用于將對不同CPU的控制,抽象為統一的接口。這些控制主要在suspend和resume進程時使用,涉及CPU的寄存器訪問、匯編指令操作等。
  3. Architecture-independent Scheduler,體系結構無關的部分。它會與“Scheduling Policy模塊”溝通,決定接下來要執行哪個進程,然后通過“Architecture-specific Schedulers模塊”resume指定的進程。
  4. System Call Interface,系統調用接口。進程調度子系統通過系統調用接口,將需要提供給用戶空間的接口開放出去,同時屏蔽掉不需要用戶空間程序關心的細節。

3.3 內存管理(Memory Manager, MM)

內存管理同樣是Linux內核中最重要的子系統之一,它主要提供對內存資源的訪問控制。Linux系統會在硬件物理內存和進程所使用的內存(稱作虛擬內存)之間建立一種映射關系,這種映射是以進程為單位,因此不同的進程可以使用相同的虛擬內存,而這些相同的虛擬內存,可以映射到不同的物理內存上。

內存管理子系統包括3個子模塊(見下圖),它們的功能如下:

  1. Architecture Specific Managers,體系結構相關部分。提供用于訪問硬件Memory的虛擬接口。
  2. Architecture Independent Manager,體系結構無關部分。提供所有的內存管理機制,包括:以進程為單位的memory mapping;虛擬內存的Swapping。
  3. System Call Interface,系統調用接口。通過該接口,向用戶空間程序應用程序提供內存的分配、釋放,文件的map等功能。

3.4 虛擬文件系統(Virtual Filesystem, VFS)

傳統意義上的文件系統,是一種存儲和組織計算機數據的方法。它用易懂、人性化的方法(文件和目錄結構),抽象計算機磁盤、硬盤等設備上冰冷的數據塊,從而使對它們的查找和訪問變得容易。因此,文件系統的實質,就是“存儲和組織數據的方法”,文件系統的表現形式,就是“從某個設備中讀取數據和向某個設備寫入數據”。

隨著計算機技術的進步,存儲和組織數據的方法也在不斷進步,從而導致有多種類型的文件系統,例如FAT、FAT32、NTFS、EXT2、EXT3等。而為了兼容,操作系統或內核,要以相同的表現形式,同時支持多種類型的文件系統,這就延伸出了虛擬文件系統(VFS)的概念。VFS的功能就是管理各種各樣的文件系統,屏蔽它們的差異,以統一的方式,為用戶程序提供訪問文件的接口。

我們可以從磁盤、硬盤、NAND Flash等設備中讀取或寫入數據,因此最初的文件系統都是構建在這些設備之上的。這個概念也可以推廣到其他的硬件設備,例如內存、顯示器(LCD)、鍵盤、串口等。我們對硬件設備的訪問控制,也可以歸納為讀取或者寫入數據,因此可以用統一的文件操作接口訪問。Linux內核就是這樣做的,除了傳統的磁盤文件系統之外,它還抽象出了設備文件系統、內存文件系統等。這些邏輯,都是由VFS子系統實現。

VFS子系統包括6個子模塊(見下圖),它們的功能如下:

  1. Device Drivers,設備驅動,用于控制所有的外部設備及控制器。由于存在大量不能相互兼容的硬件設備(特別是嵌入式產品),因此也有非常多的設備驅動。因此,Linux內核中將近一半的Source Code都是設備驅動,大多數的Linux底層工程師(特別是國內的企業)都在編寫或者維護設備驅動,而無暇顧及其他內容(它們恰恰是Linux內核的精髓所在)。
  2. Device Independent Interface,該模塊定義了描述硬件設備的統一方式(統一設備模型),所有的設備驅動都遵守這個定義,可以降低開發的難度。同時可以用一致的形式向上提供接口。
  3. Logical Systems,每一種文件系統,都會對應一個Logical System(邏輯文件系統),它會實現具體的文件系統邏輯。
  4. System Independent Interface,該模塊負責以統一的接口(塊設備和字符設備)表示硬件設備和邏輯文件系統,這樣上層軟件就不再關心具體的硬件形態了。
  5. System Call Interface,系統調用接口,向用戶空間提供訪問文件系統和硬件設備的統一的接口。

3.5 網絡子系統(Net)

網絡子系統在Linux內核中主要負責管理各種網絡設備,并實現各種網絡協議,最終實現通過網絡連接其他系統的功能。在Linux內核中,網絡子系統幾乎是自成體系,它包括5個子模塊(見下圖),它們的功能如下:

  1. Network Device Drivers,網絡設備的驅動,和VFS子系統中的設備驅動是一樣的。
  2. Device Independent Interface,和VFS子系統中的是一樣的。
  3. Network Protocols,實現各種網絡傳輸協議,例如IP, TCP, udp等。
  4. Protocol Independent Interface,屏蔽不同的硬件設備和網絡協議,以相同的格式提供接口(socket)。
  5. System Call interface,系統調用接口,向用戶空間提供訪問網絡設備的統一的接口。

至于IPC子系統,由于功能比較單純,這里就不再描述了。

四,Linux內核源代碼的目錄結構

Linux內核源代碼包括三個主要部分:

  1. 內核核心代碼,包括第3章所描述的各個子系統和子模塊,以及其他的支撐子系統,例如電源管理、Linux初始化等。
  2. 其他非核心代碼,例如庫文件(因為Linux內核是一個自包含的內核,即內核不依賴其他的任何軟件,自己就可以編譯通過)、固件集合、KVM(虛擬機技術)等。
  3. 編譯腳本、配置文件、幫助文檔、版權說明等輔助性文件。

下圖是使用ls命令看到的內核源代碼的頂層目錄結構,具體描述如下:

include/ —- 內核頭文件,需要提供給外部模塊(例如用戶空間代碼)使用。 kernel/ —- Linux內核的核心代碼,包含了3.2小節所描述的進程調度子系統,以及和進程調度相關的模塊。 mm/ —- 內存管理子系統(3.3小節)。 fs/ —- VFS子系統(3.4小節)。 net/ —- 不包括網絡設備驅動的網絡子系統(3.5小節)。 ipc/ —- IPC(進程間通信)子系統。 arch// —- 體系結構相關的代碼,例如arm, x86等。 arch//mach- —- 具體的machine/board相關的代碼。 arch//include/asm —- 體系結構相關的頭文件。 arch//boot/dts —- 設備樹(Device Tree)文件。 init/ —- Linux系統啟動初始化相關的代碼。 block/ —- 提供塊設備的層次。 sound/ —- 音頻相關的驅動及子系統,可以看作“音頻子系統”。 drivers/ —- 設備驅動(在Linux kernel 3.10中,設備驅動占了49.4的代碼量)。 lib/ —- 實現需要在內核中使用的庫函數,例如CRC、FIFO、list、MD5等。 crypto/ —– 加密、解密相關的庫函數。 security/ —- 提供安全特性(SELinux)。 virt/ —- 提供虛擬機技術(KVM等)的支持。 usr/ —- 用于生成initramfs的代碼。 firmware/ —- 保存用于驅動第三方設備的固件。 samples/ —- 一些示例代碼。 tools/ —- 一些常用工具,如性能剖析、自測試等。 Kconfig, Kbuild, Makefile, scripts/ —- 用于內核編譯的配置文件、腳本等。 COPYING —- 版權聲明。 MaiNTAINERS —-維護者名單。 CredITS —- Linux主要的貢獻者名單。 REPORTING-bugS —- Bug上報的指南。 Documentation, README —- 幫助、說明文檔。

? 版權聲明
THE END
喜歡就支持一下吧
點贊8 分享