打印

linux内核源码,要多久才能看完?

[复制链接]
5056|26
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
代码中自有颜如玉!

代码中自有黄金屋!

那么Linux内核代码到底有多少行?

我们需要多久能读完呢?

使用特权

评论回复
沙发
菜鸟的第一步|  楼主 | 2022-4-24 17:35 | 只看该作者
一、内核行数

Linux内核分为CPU调度、内存管理、网络和存储四大子系统,针对硬件的驱动成百上千。代码的数量更是大的惊人。

先说说最早的内核linux 0.11,下面这本书可以说很多驱动工程师都学习过,我花了大概1个半月,勉强看了一遍。


使用特权

评论回复
板凳
菜鸟的第一步|  楼主 | 2022-4-24 17:37 | 只看该作者
再来看看内核代码量的统计。


使用特权

评论回复
地板
菜鸟的第一步|  楼主 | 2022-4-24 17:38 | 只看该作者

2020年1月1日,Linux内核Git源码树中的代码达到了2780万行。

phoronix网站统计了Linux内核在进入2020年时的一些源码数据并作了总结。

从统计数据来看,Linux内核源码树共有:

27852148行(包括文档、Kconfig文件、树中的用户空间实用程序等)

887925次commit

21074位不同的作者

2780万行代码分布在66492个文件中

Linux内核从最初的10000行代码到现在的2780万行代码就是全球精英共同贡献的结果。


使用特权

评论回复
5
菜鸟的第一步|  楼主 | 2022-4-24 17:39 | 只看该作者

按照一天一万行的速度,也需要2700天,也需要7年多。

这还是建立在所有单次都认识,

所有代码逻辑看了的都懂,

而且都不忘记的基础上。

实际上即使我们真的看完了,

几年后内核又会有非常大的变化,

可以说一辈子都看不完Linux内核的代码。


使用特权

评论回复
6
菜鸟的第一步|  楼主 | 2022-4-24 17:41 | 只看该作者

Linux内核Git源码树中的代码达到了2780万行,核心代码只有2%是由李纳斯•托瓦兹自己编写的,其他均是其他个人和组织贡献的,李纳斯•托瓦兹公开了Linux但保留了选择新代码和需要合并的新方法的最终裁定权。

除了Linus Torvalds,对内核贡献最多的是David S.Miller、 Mark Brown、Takashi Iwai、Arnd Bergmann、Al Viro和Mauro Carvalho Chehab。

而参与贡献的公司,从域名统计来看,谷歌、Intel与Red Hat排在了最前列。


使用特权

评论回复
7
菜鸟的第一步|  楼主 | 2022-4-24 17:43 | 只看该作者
二、内核目录文件大小

然而,现在的内核已经膨胀的不成样子了,以还不算最新的linux-4.1.15为例:

整个内核源码一共约 793M:

这些目录任意一个目录想完全看明白都非常不容易。



使用特权

评论回复
8
菜鸟的第一步|  楼主 | 2022-4-24 17:44 | 只看该作者
三、内核子系统

什么是内核:

在计算机科学中是一个用来管理软件发出的数据I/O(输入与输出)要求的计算机程序,将这些要求转译为数据处理的指令并交由中央处理器(CPU)及计算机中其他电子组件进行处理,是现代操作系统中最基本的部分。

它是为众多应用程序提供对计算机硬件的安全访问的一部分软件,这种访问是有限的,并由内核决定一个程序在什么时候对某部分硬件操作多长时间。


使用特权

评论回复
9
菜鸟的第一步|  楼主 | 2022-4-24 17:45 | 只看该作者

linux内核代码涉及知识点包括汇编指令、c语言、硬件组成原理、操作系统、数据结构和算法、各种外设总线、驱动、网络协议栈。

直接对硬件操作是非常复杂的。所以内核通常提供一种硬件抽象的方法,来完成这些操作。

通过进程间通信机制及系统调用,应用进程可间接控制所需的硬件资源(特别是处理器及IO设备)。


使用特权

评论回复
10
菜鸟的第一步|  楼主 | 2022-4-24 17:46 | 只看该作者

最上面是用户(或应用程序)空间。这是用户应用程序执行的地方。用户空间之下是内核空间,Linux 内核正是位于这里。

GNU C Library (glibc)也在这里。它提供了连接内核的系统调用接口,还提供了在用户空间应用程序和内核之间进行转换的机制。

内核和用户空间的应用程序使用的是不同的保护地址空间。

每个用户空间的进程都使用自己的虚拟地址空间,而内核则占用单独的地址空间。


使用特权

评论回复
11
菜鸟的第一步|  楼主 | 2022-4-24 17:47 | 只看该作者

Linux 内核可以进一步划分成 3 层。最上面是系统调用接口,它实现了一些基本的功能,例如 read 和 write。

系统调用接口之下是内核代码,可以更精确地定义为独立于体系结构的内核代码。这些代码是 Linux 所支持的所有处理器体系结构所通用的。

在这些代码之下是依赖于体系结构的代码,构成了通常称为 BSP(Board Support Package)的部分。这些代码用作给定体系结构的处理器和特定于平台的代码。

内核主要系统包括:SCI:系统调用接口 PM:进程管理 VFS:虚拟文件系统 MM:内存管理 Network Stack:内核协议栈 Arch:体系架构 DD:设备驱动


使用特权

评论回复
12
菜鸟的第一步|  楼主 | 2022-4-24 17:48 | 只看该作者
1 系统调用接口

SCI 层提供了某些机制执行从用户空间到内核的函数调用。这个接口依赖于体系结构,甚至在相同的处理器家族内也是如此。

SCI 实际上是一个非常有用的函数调用多路复用和多路分解服务。

在 ./linux/kernel 中您可以找到 SCI 的实现,并在 ./linux/arch 中找到依赖于体系结构的部分。


使用特权

评论回复
13
菜鸟的第一步|  楼主 | 2022-4-24 17:49 | 只看该作者
2 进程管理

进程管理的重点是进程的执行。

在内核中,这些进程称为线程,代表了单独的处理器虚拟化(线程代码、数据、堆栈和 CPU 寄存器)。

在用户空间,通常使用进程 这个术语,不过 Linux 实现并没有区分这两个概念(进程和线程)。

内核通过 SCI 提供了一个应用程序编程接口(API)来创建一个新进程(fork、exec 或 Portable Operating System Interface [POSIX] 函数),停止进程(kill、exit),并在它们之间进行通信和同步(signal 或者 POSIX 机制)。


使用特权

评论回复
14
菜鸟的第一步|  楼主 | 2022-4-24 17:50 | 只看该作者
3 内存管理

内核所管理的另外一个重要资源是内存。为了提高效率,如果由硬件管理虚拟内存,内存是按照所谓的内存页方式进行管理的(对于大部分体系结构来说都是 4KB)。

Linux 包括了管理可用内存的方式,以及物理和虚拟映射所使用的硬件机制。


使用特权

评论回复
15
菜鸟的第一步|  楼主 | 2022-4-24 17:50 | 只看该作者
4 虚拟文件系统

虚拟文件系统(VFS)是 Linux 内核中非常有用的一个方面,因为它为文件系统提供了一个通用的接口抽象。VFS 在 SCI 和内核所支持的文件系统之间提供了一个交换层。

在 VFS 上面,是对诸如 open、close、read 和 write 之类的函数的一个通用 API 抽象。在 VFS 下面是文件系统抽象,它定义了上层函数的实现方式。

它们是给定文件系统(超过 50 个)的插件。文件系统的源代码可以在 ./linux/fs 中找到。


使用特权

评论回复
16
菜鸟的第一步|  楼主 | 2022-4-24 17:51 | 只看该作者

文件系统层之下是缓冲区缓存,它为文件系统层提供了一个通用函数集(与具体文件系统无关)。

这个缓存层通过将数据保留一段时间(或者随即预先读取数据以便在需要是就可用)优化了对物理设备的访问。缓冲区缓存之下是设备驱动程序,它实现了特定物理设备的接口。


使用特权

评论回复
17
菜鸟的第一步|  楼主 | 2022-4-24 17:52 | 只看该作者
5 网络堆栈

网络堆栈在设计上遵循模拟协议本身的分层体系结构。

回想一下,Internet Protocol (IP) 是传输协议(通常称为传输控制协议或 TCP)下面的核心网络层协议。TCP 上面是 socket 层,它是通过 SCI 进行调用的。

socket 层是网络子系统的标准 API,它为各种网络协议提供了一个用户接口。

从原始帧访问到 IP 协议数据单元(PDU),再到 TCP 和 User Datagram Protocol (UDP),socket 层提供了一种标准化的方法来管理连接,并在各个终点之间移动数据。内核中网络源代码可以在 ./linux/net 中找到。


使用特权

评论回复
18
菜鸟的第一步|  楼主 | 2022-4-24 17:53 | 只看该作者
6 设备驱动程序

Linux 内核中有大量代码都在设备驱动程序中,它们能够运转特定的硬件设备。

Linux 源码树提供了一个驱动程序子目录,这个目录又进一步划分为各种支持设备,例如 Bluetooth、I2C、serial 等。设备驱动程序的代码可以在 ./linux/drivers 中找到。

下面这个图形象的讲解了Linux内核都有哪些东西!


使用特权

评论回复
19
菜鸟的第一步|  楼主 | 2022-4-24 17:55 | 只看该作者
四、如何学习内核?1. 学习主线

linux内核源码大而全,一个人,即使再聪明、再有精力,也不可能完全看完、看懂所有的linux内核源码。

作者建议按照以下主线进行深入研究:

  • linux驱动架构
  • linux网络子系统


    • linux内核启动过程
  • linux内存管理机制
  • linux调度器
  • linux进程管理
  • linux虚拟机制(kvm)
  • linux内核实时化技术

使用特权

评论回复
20
菜鸟的第一步|  楼主 | 2022-4-24 17:55 | 只看该作者

沿着某一个主线,深入进去,在研究清楚这个主线的同时,向其他的主线扩展、渗透和学习。

此处之所以将驱动列为学习内核的入口,是因为内核为很多外设驱动实现了架构, 比如I2C、SPI、UART、PCIE、字符设备、网络设备、块设备, 我们可以从最基本的字符设备学起, 学习如何编写一个简单的模块 学习如何如何为一些简单的设备比如LED、KEY、ADC等编写驱动 可以说驱动是我们学习内核最简单的入口,

由点到线、由线到面、由面到体,层层深入、不断精进,是学习linux内核源码的一个有效的方法。


使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

58

主题

453

帖子

1

粉丝