打印
[STM32MP1]

内核源码结构与Makefile分析

[复制链接]
1810|11
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
tpgf|  楼主 | 2021-9-8 07:38 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
一、内核介绍
1、版本及其特点
        Linux内核的版本号可以从源代码的顶层目录下的Makefile中看到,比如下面几行它们构成了Linux的版本号:2.6.22.6。


VERSION=2
PATCHLEVEL=6SUBLEVEL =22
EXTRAVERSION=.6
        其中的“VERSION”和“PATCHLEVEL”组成主版本号,比如2.4、2.5、2.6等,稳定版本的主版本号用偶数表示(比如2.4、2.6),每隔2~3年出现一个稳定版本。开发中的版本号用奇数来表示(比如2.3、2.5),它是下一个稳定版本的前身。
        “SUBLEVEL”称为次版本号,它不分奇偶,顺序递增。每隔1~2个月发布一个稳定版本。

        “EXTRAVERSION”称为扩展版本号,它不分奇偶,顺序递增。每周发布几次扩展版本号,修正最新的稳定版本的问题。值得注意的是,“EXTRAVERSION”也可以不是数字,而是类似“-rc6”的字样,表示这是一个测试版本。在新的稳定版本发布之前,会先发布几个测试版本用于测试。
        Linux内核的最初版本在1991年发布,这是Linus Torvalds为他的386开发的一个类Minix的操作系统。

2、获取内核源码
        登录https://www.kernel.org/,可以看到如下:



        上面列举了当前内核的最新稳定版本、测试版本、补丁等。

        一般而言,各种补丁文件都是基内核的某个正式版本生成的。比如有补丁文件patch-2.6.xx.1、patch-2.6.xx.2、patch-2.6.xx.3,它们都是基于内核2.6.xx生成的补丁文件。使用时可以在内核2.6.xx上直接打补丁patch-2.6.xx.3,并不需要先打上补丁patch-2.6.xx.1、patch-2.6.xx.2;相应地,如果已经打了补丁patch-2.6.xx.2,在打补丁patch-2.6.xx.3前,要先去除patch-2.6.xx.2。
        本书在Linux2.6.22.6上进行移植、开发,下载linux-2.6.22.6.tar.bz2后用如下命令解压即可得到目录linux-2.6.22.6,里面存放了内核源码:

$ tar xjf linux-2.6.22.6.tar.bz2
        也可以先下载内核源文件linux-2.6.22.tar.bz2、补丁文件patch-2.6.22.6.bz2,然后解压、打补丁(假设源文件、补丁文件放在同一个目录下),命令如下所示:

tar xjf linux-2.6.22.tar.bz2
tar xjf patch-2.6.22.6.bz2
cd linux-2.6.22
patch -pl < ../patch-2.6.22.6
        下面的内容,都假设内核源码所在目录为linux-2.6.22.6。


使用特权

评论回复
沙发
tpgf|  楼主 | 2021-9-8 07:38 | 只看该作者
3、内核源码结构
        Linux内核文件数目将近2万,除去其他架构CPU的相关文件,支持S3C2410、S3C2440这两款芯片的完整内核文件有1万多个。这些文件的组织结构并不复杂,它们分别位于顶层目录下的17个子目录,各个目录功能独立。下表描述了各目录的功能,最后2个目录不包含内核代码。

表1


      对于ARM架构的S3C2410、S3C2440,其体系相关的代码在arch/arm/目录下,在后面进行Linux移植时,开始的工作正是修改这个目录下的文件。如下图所示为内核代码的层次结构。


使用特权

评论回复
板凳
tpgf|  楼主 | 2021-9-8 07:39 | 只看该作者
二、Makefile分析
        Makefile的作用主要有以下3点:
(1)决定编译哪些文件。
(2)怎样编译这些文件?
(3)怎样连接这些文件,最重要的是它们的顺序如何?
        Linux内核源码中含有很多个Makefile文件,这些Makefile文件又要包含其他一些文件(比如配置信息、通用的规则等)。这些文件构成了Linux的Makefile体系,可以分为下表中的5类。

  内核文档Documentation/kbuild/makefiles.txt对内核中Makefile的作用、用法讲解得非常透彻,以下根据前面总结的Makefile的3大作用分析这5类文件。

使用特权

评论回复
地板
tpgf|  楼主 | 2021-9-8 07:40 | 只看该作者
1、决定编译哪些文件
        Linux内核的编译过程从顶层Makefile开始,然后递归地进入各级子目录调用它们的Makefile,分为3个步骤。
(1)顶层Makefile决定内核根目录下哪些子目录将被编进内核。
(2)arch/$(ARCH)/Makefile 决定arch/$(ARCH)目录下哪些文件、哪些目录将被编进内核。
(3)各级子目录下的Makefile决定所在目录下哪些文件将被编进内核,哪些文件将被编成模块(即驱动程序),进入哪些子目录继续调用他们的Makefile。

(1)步骤1

        先看步骤(1),在顶层Makefile中可以看到如下内容:

433 init-y    :=init/
434 drivers-y :=drivers/sound/
435 net-y     :=net/
436 libs-y    :=lib/
437 core-y    :=usr/
...
556 core-y    +=kernel/mm/fs/ipc/security/crypto/block/
        可见,顶层Makefile将这13个子目录分为5类:init-y、drivers-y、net-y、libs-y和core-y。表1中有17个子目录,除去include目录和后面两个不包含内核代码的目录外,还有一个arch目录没有出现在内核中。它在arch/$(ARCH)/Makefile中被包含进内核,在顶层Makefile中直接包含了这个Makefile,如下所示:

491 include $(srctree)/arch/$(ARCH)/Makefile
        对于ARCH变量,可以在执行make命令时传入,比如“make ARCH=arm …”。另外,对于非x86平台,还需要指定交叉编译工具,这也可以在执行make命令时传入,比如“make CROSS_COMPILE=arm-linux- …”。为了方便,常在顶层Makefile中进行如下修改。

修改前:
185 ARCH          ?= &(SUBARCH)
186 CROSS_COMPILE ?=
修改后:
185 ARCH          ?=arm
186 CROSS_COMPILE ?=arm-linux-
(2)步骤2
        对于步骤(2)的arch/$(ARCH)/Makefile,以ARM体系为例,在arch/arm/Makefile中可以看到如下内容:

94  head-y :=arch/arm/kernel/head$(MMUEXT).o arch/arm/kernel/init_task.o
...
171 core-y +=arch/arm/kernel/ arch/arm/mm/ arch/arm/common/
172 core-y +=$(MACHINE)
173 core-$(CONFIG_ARCH_S3C2410) += arch/arm/mach-s3c2400/
174 core-$(CONFIG_ARCH_S3C2410) += arch/arm/mach-s3c2412/
175 core-$(CONFIG_ARCH S3C2410) += arch/arm/mach-s3c2440/
...
191 1ibs-y := arch/arm/lib/ $(libs-y)
...

        从第94行可知,除前面的5类子目录外,又出现了另一类:head-y,不过它直接以文件名出现。MMUEXT在arch/arm/Makefile前面定义,对于没有MMU的处理器,MMUEXT的值为-nommu,使用文件head-nommu.S;对于有MMU的处理器,MMUEXT的值为空,使用文件head.S。
        arch/arm/Makefile中类似第171、172、173行的代码进一步扩展了core-y的内容,第191行扩展了libs-y的内容,这些都是体系结构相关的目录。

        第173~175行中的CONFIG_ARCH_S3C2410在配置内核时定义,它的值有3种:y、m或空。y表示编进内核,m表示编为模块,空表示不使用。
        编译内核时,将依次进入init-y、core-y、libs-y、drivers-y和net-y所列出的目录中执行它们的Makefile,每个子目录都会生成一个built-in.o(libs-y所列目录下,有可能生成lib.a文件)。最后,head-y所表示的文件将和这些built-in.o、lib.a一起被连接成内核映象文件vmlinux。

(3)步骤3
        最后,看一下步骤(3)是怎么进行的。
        在配置内核时,生成配置文件.config(具体的配置过程在后面会讲述)。内核顶层Makefile 使用如下语句间接包含.config文件,以后就根据.config中定义的各个变量决定编译哪些文件。之所以说是“间接”包含,是因为包含的是include/config/auto.conf文件,而auto.conf文件只是将.config文件中的注释去掉,再根据顶层Makefile中定义的变量增加了一些变量而已。

441 #Read in config
442 -include include/config/auto.conf
        include/config/auto.conf文件的生成过程不再描述,它与.config的格式相同,摘选部分内容如下(注意,下面以“#”开头的行是本书加的注释):

CONEIG_ARCH_SMDK2410=y
CONFIG_ARCH_S3C2440=y
#.config中没有下面这行,它是根据顶层Makefile中定义的内核版本号增加的
CONFIG_KERNELVERSION="2.6.22.6"
#.config中没有下面这行,它是根据顶层Makefile中定义的ARCH变量增加的
CONFIG_ARCH="arm"
CONFIG_JFFS2_FS=y
CONFIG_LEDS_S3C24XX=m
        在include/config/auto.conf文件中,变量的值主要有两类:“y”和“m”。各级子目录的Makefile使用这些变量来决定哪些文件被编进内核中,哪些文件被编成模块(即驱动程序),要进入哪些下一级子目录继续编译,这通过以下4种方法来确定(obj-y、obj-m、lib-y是Makefile中的变量)。
        (1)obj-y用来定义哪些文件被编进(built-in)内核。
        obj-y中定义的.o文件由当前目录下的.c或.S文件编译生成,它们连同下级子目录的built-in.o文件一起被组合成(用“$(LD) -r”命令)当前目录下的built-in.o文件。这个built-in.o文件将被它的上一层Makefile使用。
        obj-y中各个.o文件的顺序是有意义的,因为内核中用module_init()或__initcall定义的函数将按照它们的连接顺序被调用。


        例16.1:当下面的CONFIG_ISDN、CONFIG_ISDN_PPP_BSDCOMP在.config中被定义为y时,isdn.c或isdn.S、isdn_bsdcomp.c或isdn_bsdcomp.S被编译成isdn.o、isdn_bsdcomp.o。这两个o文件被组合进built-in.o文件中,最后被连接进入内核。假如isdn.o、isdn_bsdcomp.o中分别用module_init(A)、module_init(B)定义了函数A、B,则内核启动时A先被调用,然后是B。

obj-$(CONFIG_ISDN)+=isdn.o
obj-$(CONFIG_ISDN_PPP_BSDCOMP)+=isdn_bsdcomp.o

        (2)obj-m用来定义哪些文件被编译成可加载模块(Loadable module)。
        obj-m中定义的.o文件由当前目录下的.c或.S文件编译生成,它们不会被编进built-in.o中,而是被编成可加载模块。

        一个模块可以由一个或几个.o文件组成。对于只有一个源文件的模块,在obi-m中直接增加它的.o文件即可。对于有多个源文件的模块,除在obj-m中增加一个.o文件外,还要定义一个<module name>-objs变量来告诉Makefile这个.o文件由哪些文件组成。

        例16.2:当下面的CONFIG_ISDN_PPP_BSDCOMP在.config文件中被定义为m时,isdn_bsdcomp.c或isdn_bsdcomp.S将被编译成isdn_bsdcomp.o文件,它最后被制作成isdn_bsdcomp.ko模块,如下所示:

#drivers/isdn/i41/Makefile
obj-$(CONEIG_ISDN_PPP_BSDCOMP) += isdn_bsdcomp.o
        例16.3:当下面的CONFIG_ISDN在.config文件中被定义为m时,将会生成一个isdn.o文件,它由isdn-objs中定义的isdn_net_ lib.o、isdn_v110.o、isdn_common.o等3个文件组合而成。isdn.o最后被制作成isdn.ko模块。

#drivers/isdn/i41/Makefile
obj-$(CONFIG_ISDN) += isdn.o
isdn-objs := isdn_net_lib.o isdn_v110.o isdn_common.o
        (3)lib-y用来定义哪些文件被编成库文件。

        lib-y中定义的.o文件由当前目录下的.c或.S文件编译生成,它们被打包成当前目录下的个库文件:lib.a。

        同时出现在obj-y、lib-y中的.o文件,不会被包含进lib.a中。

        要把这个lib.a编进内核中,需要在顶层Makefile中libs-y变量中列出当前目录。要编成库文件的内核代码一般都在这两个目录下:lib/、arch/$(ARCH)/lib/。

        (4)obj-y、obj-m还可以用来指定要进入的下一层子目录。

        Linux中一个Makefile文件只负责生成当前日录下的目标文件,子目录下的目标文件由子目录的Makefile生成。Linux的编译系统会自动进入这些子目录调用它们的Makefile,只是在这之前需要指定这些子目录。

        这要用到obj-y、obj-m,只要在其中增加这些子目录名即可。

        例16.4:fs/Makefile中有如下一行,当CONFIG_JFFS2_FS被定义为y或m时,在编译时将会进入jffs2/目录进行编译。Linux的编译系统只会根据这些信息决定是否进入下一级目录,而下一级中的文件如何编译成built-in.o或模块由它的Makefile决定。

101 obj-$(CONFIG_JFFS2_FS) += jffs2/



使用特权

评论回复
5
tpgf|  楼主 | 2021-9-8 07:40 | 只看该作者
2、怎样编译这些文件。
        即编译选项、连接选项是什么。这些选项分3类:全局的,适用于整个内核代码树;局部的,仅适用于某个Makefile中的所有文件;个体的,仅适用于某个文件。

        全局选项在顶层Makefile 和arch/$(ARCH)/Makefile中定义,这些选项的名称为:CFLAGS、AFLAGS、LDFLAGS、ARFLAGS,它们分别是编译C文件的选项、编译汇编文件的选项、连接文件的选项、制作库文件的选项。

        需要使用局部选项时,它们在各个子目录中定义,名称为:EXTRA_CFLAGS、EXTRA_AFLAGS、EXTRA_LDFLAGS、EXTRA_ARFLAGS,它们的用途与前述选项相同,只是适用范围比较小,它们针对当前Makefile中的所有文件。

        另外,如果想针对某个文件定义它的编译选项,可以使用CFLAGS_$@,AFLAGS _$@。前者用于编译某个C文件,后者用于编译某个汇编文件。$@表示某个目标文件名,比如以下代码表示编译ahal52x.c时,选项中要额外加上“-DAHA152X_STAT-DAUTOCONF”。

#drivers/scsi/Makefile
CFLAGS_aha152x.0 = -DAHA152X_STAT -DAUTOCONF
        需要注意的是,这3类选项是一起使用的,在scripts/Makefile.lib中可以看到。

_c_flags = $(CFLAGS) $(EXTRA_CFLAGS) $(CFLAGS_$(basetarget).o)


使用特权

评论回复
6
tpgf|  楼主 | 2021-9-8 07:40 | 只看该作者
3、怎样连接这些文件,它们的顺序如何。
        前面分析有哪些文件要编进内核时,顶层Makefile和arch/$(ARCH)/Makefile定义了6类目录(或文件):head-y、init-y、drivers-y、net-y、libs-y和core-y。它们的初始值如下(以ARM体系为例)。

        arch/arm/Makefile中:

94  head-y := arch/arm/kernel/head$ (MMUEXT) .o arch/arm/kernel/init_task.o
...
171 core-y += arch/arm/kernel/arch/arm/mm/arch/arm/common/
172 core-y += $(MACHINE)
173 core-$(CONFIG_ARCH_S3C2410) += arch/arm/mach-s3c2400/
174 core-$(CONFIG_ARCH_S3C2410) += arch/arm/mach-s3c2412/
175 core-$(CONEIG_ARCHS3C2410)  += arch/arm/mach-s3c2440/
...
191 libs-y := arch/arm/lib/$(libs-y)
...
        顶层Makefile中:

433 init-y    :=init/
434 drivers-y :=drivers/sound/
435 net-y     :=net/
436 libs-y    :=lib/
437 core-y    :=usr/
...
556 core-y += kernel/mm/fs/ipc/security/crypto/block/
        可见,除head-y外,其余的init-y、drivers-y等都是目录名。在顶层Makefile中,这些目录名的后面直接加上built-in.o或lib.a,表示要连接进内核的文件,如下所示:

567 init-y   :=$(patsubst %/,%/built-in.o,$(init-y))
568 core-y   :=$(patsubst %/,%/built-in.o,$core-y))
569 drivers-y:=$(patsubst %/,%/built-in.o,$(drivers-y))
570 net-y    :=$(patsubst %/,%/built-in.o,$(net-y))
571 libs-y1  :=$((patsubst %/,%/lib.a,$(libs-y))
572 libs-y2i :=$(patsubst %/,%/built-in.o,$(libs-y))
573 libs-y   :=$(libs-y1)  $(libs-y2)
        上面的patsubst是个字符串处理函数,它的用法如下:

$(patsubst pattern,replacement,text)
        表示寻找“text”中符合格式“pattern”的字,用“replacement”替换它们。比如上面的init-y初值为“init/”,经过第567行的交换后,“init-y”变为“init/built-in.o”。

        顶层Makefile中,再往下看。

602 vmlinux-init :=$(head-y) $(init-y)
603 vmlinux-main :=$(core-y) $(libs-y) $(drivers-y) $(net-y)
604 vmlinux-al1  :=$(vmlinux-init) $(vmlinux-main)
605 vmlinux-1ds  := arch/$(ARCH)/kerne1/vmlinux.lds
        第604行的vmlinux-all表示所有构成内核映象文件vmlinux的目标文件,从第602~604行可知这些目标文件的顺序为:head-y、init-y、core-y、libs-y、drivers-y、net-y,即arch/arm/kernel/head.o(假设有MMU,否则为head-nommu.o)、arch/arm/kernel/init task.o、init/built-in.o、usr/built-in.o等。

        第605行表示连接脚本为arch/$(ARCH)/kernel/ymlinux.lds。对于ARM体系,连接脚本就是arch/arm/kernel/vmlinux.lds,它由arch/arm/kernel/vmlinux.lds.S文件生成,规则在scripts/Makefile.build中,如下所示:

248 $(obj)/%.lds: $(src)/%.lds.S FORCE
249     $(ca1l if_changed_dep,cpp_lds_s)
250
        现将生成的arch/arm/kernel/vmlinux.lds摘录如下:

286 SECTIONS
287 {
291 .=(0xc0000000)+0X00008000; /*代码段起始地址,这是个虚拟地址*/
292
293 .text.head:{
294 _stext=.;
295 _sinittext=.;
296 *(.text.head)
297 }
298
299 .init:{/*内核初始化的代码和数据*/
...
343 }
344
...
355 .text:{/*真正的代码段*/
356 _text=.;/*代码段和只读数据段的开始地址*/
...
372}
373 /*只读数据*/
374 .=ALIGN((4096));.rodata:AT(ADDR(.rodata)-0){.……}.=ALIGN((4096));
375
376 _etext=.;/*代码段和只读数据段的结束地址*/
...
386 .data:Ar(_data_loc){/*数据段*/
387 data_start=.;/*数据段起始地址*/
...
422 edata=.;/*数据段结束地址*/
423
424 edataloc =_dataloc+SrZEOF(.data);/*数据段结束地址*/
425
426 .b33:{/*BSS段,没有初化或初值为0的全局、静态变量*/
427 _bs8_start=.;/*BSS段起始地址*/
428 *(.bss)
429 *(COMMON)
430 end=.;/*BsS段结束地址*/
431
432 /*调试信息段*/
433 .stab 0:{*(.stab)}
...
440}


使用特权

评论回复
7
tpgf|  楼主 | 2021-9-8 07:41 | 只看该作者
下面对本节分析Makefile的结果作一下总结。

(1)配置文件.config中定义了一系列的变量,Makefile将结合它们来决定哪些文件被编进内核、哪些文件被编成模块、涉及哪些子目录。

(2)顶层Makefile和arch/$(ARCH)/Makefile决定根目录下哪些子目录、arch/$(ARCH)目录下哪些文件和目录将被编进内核。

(3)最后,各级子目录下的Makefile决定所在目录下哪些文件将被编进内核,哪些文件将被编成模块(即驱动程序),进入哪些子目录继续调用它们的Makefile。

(4)顶层Makefile 和arch/$(ARCH)/Makefile 设置了可以影响所有文件的编译、连接选项:CFLAGS、AFLAGS、LDFLAGS、ARFLAGS。

(5)各级子日录下的Makefile中可以设置能够影响当前目录下所有文件的编译、连接选项:EXTRA CFLAGS、EXTRAAFLAGS、EXTRA_LDFLAGS、EXTRAARFLAGS;还可以设置可以影响某个文件的编译选项:CFLAGS_$@,AFLAGS_$@。

(6)顶层Makefile按照一定的顺序组织文件,根据连接脚本 arch/$(ARCH)/kermel/vmlinux.lds生成内核映象文件vmlinux。


使用特权

评论回复
8
qcliu| | 2021-10-5 11:30 | 只看该作者
介绍的还是非常详细的

使用特权

评论回复
9
tfqi| | 2021-10-5 11:32 | 只看该作者
顶层Makefile按照一定的顺序组织文件,这个有特定的顺序吗

使用特权

评论回复
10
wiba| | 2021-10-5 11:36 | 只看该作者
这些变量都是必须的吗

使用特权

评论回复
11
zljiu| | 2021-10-5 11:41 | 只看该作者
请问Makefile是个什么文件呢

使用特权

评论回复
12
coshi| | 2021-10-5 11:47 | 只看该作者
版本不一样 结构应该差不多吧

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

1886

主题

15546

帖子

11

粉丝