Linux移植之内核启动过程引导阶段分析

Posted andy_fly

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux移植之内核启动过程引导阶段分析相关的知识,希望对你有一定的参考价值。

Linux移植之make uImage编译过程分析中已经提到了uImage是一个压缩的包并且内含压缩程序,可以进行自解压。自解压完成之后内核代码从物理地址为0x30008000处开始运行。下面分析在进入C之前内核做的一些工作,以下是内核启动过程中打印出来的信息,其中Uncompressing Linux就是在自解压代码。make uImage编译的最后也给出了链接脚本arch/arm/kernel/vmlinux.lds,以及链接的顺序arch/arm/kernel/head.o 是第一个。

 

分析arch/arm/kernel/vmlinux.lds可以知道程序入口的地址是stext,并且是.text.head段

277    OUTPUT_ARCH(arm)
278    ENTRY(stext)

291    . = (0xc0000000) + 0x00008000;
292
293    .text.head : {
294    _stext = .;
295    _sinittext = .;
296    *(.text.head)
297    }

打开arch/arm/kernel/head.s。可见内核运行的第一条代码就是第79行的代码,从这条开始分析,首先将CPU设置为管理模式,并且关闭所有中断;然后获得CPU的id。

76        .section ".text.head", "ax" //.text.head段
77        .type    stext, %function
78    ENTRY(stext)                    //入口地址stext
79        msr    cpsr_c, #PSR_F_BIT | PSR_I_BIT | SVC_MODE @ ensure svc mode//确保进入了管理模式
80                            @ and irqs disabled                                     //并且禁止中断
81        mrc    p15, 0, r9, c0, c0        @ get processor id                               //获得处理器的CPU id,并且存入 r9中
82        bl    __lookup_processor_type        @ r5=procinfo r9=cpuid           //调用函数,输入参数r9=cpuid。返回值r5=procinfo
83        movs    r10, r5                @ invalid processor (r5=0)?//如果不支持当前CPU,则r5=0
84        beq    __error_p            @ yes, error \'p\'                              //如果r5=0,则打印错误
85        bl    __lookup_machine_type        @ r5=machinfo          //调用函数,r5=返回值machinfo
86        movs    r8, r5                @ invalid machine (r5=0)?  //如果不支持当前单板,则返回r5=0
87        beq    __error_a            @ yes, error \'a\'               //如果r5=0,则打印错误
88        bl    __create_page_tables//创建一级页表以建立虚拟地址到物理地址的映射关系,后面再研究

接着调用__lookup_processor_type,它位于arch\\arm\\kernel\\head-common.S。它的功能是比较当前CPU的id与内核支持的CPU的id是否相符合。这段代码在.proc.info.init段中从__proc_info_begin开始到__proc_info_end结束,寻找符合当前CPU的ID号的proc_info_list结构

145        .type    __lookup_processor_type, %function
146    __lookup_processor_type:
147        adr    r3, 3f                        //r3 = 第178行代码的物理地址
148        ldmda    r3, {r5 - r7}      //将r3地址开始的3个地址的内容赋给 r5、r6、r7 ;r5=__proc_info_begin,r6=__proc_info_end
149        sub    r3, r3, r7            @ get offset between virt&phys//r3=r3-r7,即物理地址与虚拟地址的差值
150        add    r5, r5, r3            @ convert virt addresses to//r5=__proc_info_begind对应的物理地址
151        add    r6, r6, r3            @ physical address space   //r6=__proc_info_end对应的物理地址
152    1:    ldmia    r5, {r3, r4}            @ value, mask//r3、r4等于proc_info_list结构中的cpu_val、cpu_mask
153        and    r4, r4, r9            @ mask wanted bits//r4=r4&r9=cpu_mask&传入的cpuid
154        teq    r3, r4                                                    //比较
155        beq    2f                                                        //如果相等,则找到对应的proc_info_list结构,跳到160行
156        add    r5, r5, #PROC_INFO_SZ        @ sizeof(proc_info_list)//r5指向下一个proc_info_list结构
157        cmp    r5, r6                                                   //是否已经比较完所有proc_info_list
158        blo    1b                                                       //没有则继续比较
159        mov    r5, #0                @ unknown processor//比较完毕,但是没有找到匹配的proc_info_list结构,r5=0
160    2:    mov    pc, lr//返回,返回的值为r5=proc_info_list

176        .long    __proc_info_begin
177        .long    __proc_info_end
178    3:    .long    .//.表示当前这条代码链接后的虚拟地址
179        .long    __arch_info_begin
180        .long    __arch_info_end

其中__proc_info_begin、__proc_info_end被定义在arch\\arm\\kernel\\vmlinux.lds中,它的意思是内核源码中有被定义为.proc.info.init的内容,它的起始地址是__proc_info_begin,结束地址为__proc_info_end。

299     .init : { /* Init code and data        */
230       *(.init.text)
231      _einittext = .;
232      __proc_info_begin = .;
233       *(.proc.info.init)
234      __proc_info_end = .;

接着看到proc_info_list结构的内容,它被定义在include\\asm-arm\\Procinfo.h中

29    struct proc_info_list {
30        unsigned int        cpu_val;      
31        unsigned int        cpu_mask;
32        unsigned long        __cpu_mm_mmu_flags;    /* used by head.S */
33        unsigned long        __cpu_io_mmu_flags;    /* used by head.S */
34        unsigned long        __cpu_flush;        /* used by head.S */
35        const char        *arch_name;
36        const char        *elf_name;
37        unsigned int        elf_hwcap;
38        const char        *cpu_name;
39        struct processor    *proc;
40        struct cpu_tlb_fns    *tlb;
41        struct cpu_user_fns    *user;
42        struct cpu_cache_fns    *cache;
43    };

接着找到对于当前内核支持的proc_info_list 定义,它在arch\\arm\\mm\\proc-arm920.S 中。对于S3C2410、S3C2440芯片来说CPU ID都是0x41129200。cpu_val的值为0x41009200、cpu_mask的值为0xff00fff0,刚好匹配。

    .section ".proc.info.init", #alloc, #execinstr

448        .type    __arm920_proc_info,#object
449    __arm920_proc_info:
450        .long    0x41009200//cpu_val值
451        .long    0xff00fff0//cpu_mask值
452        .long   PMD_TYPE_SECT | \\
453            PMD_SECT_BUFFERABLE | \\
454            PMD_SECT_CACHEABLE | \\
455            PMD_BIT4 | \\
456            PMD_SECT_AP_WRITE | \\
457            PMD_SECT_AP_READ
458        .long   PMD_TYPE_SECT | \\
459            PMD_BIT4 | \\
460            PMD_SECT_AP_WRITE | \\
461            PMD_SECT_AP_READ
462        b    __arm920_setup
463        .long    cpu_arch_name
464        .long    cpu_elf_name
465        .long    HWCAP_SWP | HWCAP_HALF | HWCAP_THUMB
466        .long    cpu_arm920_name
467        .long    arm920_processor_functions
468        .long    v4wbi_tlb_fns
469        .long    v4wb_user_fns
470    #ifndef CONFIG_CPU_DCACHE_WRITETHROUGH
471        .long    arm920_cache_fns
472    #else
473        .long    v4wt_cache_fns
474    #endif
475        .size    __arm920_proc_info, . - __arm920_proc_info

继续回到arch/arm/kernel/head.s往下分析,看到第83行,调用完__lookup_processor_type后r5的值变为执向找到的proc_info_list 结构的地址。所以第83行与第84行比较r5是否为0,如果为0说明没有找到符合当前CPU的ID号,则打印错误。接着到85行,调用__lookup_machine_type,它同样位于arch\\arm\\kernel\\head-common.S中,它的功能是比较当前单板的id与内核支持的单板的id是否相符合。这段代码在.arch.info.init段中从__arch_info_begin开始到__arch_info_end结束,寻找符合当前单板的ID号的machine_desc结构

176        .long    __proc_info_begin
177        .long    __proc_info_end
178    3:    .long    .//.表示当前这条代码链接后的虚拟地址
179        .long    __arch_info_begin
180        .long    __arch_info_end

193        .type    __lookup_machine_type, %function
194    __lookup_machine_type:
195        adr    r3, 3b                   //r3=第178行的物理地址
196        ldmia    r3, {r4, r5, r6}     //r4=r3。r5=__proc_info_end,r6=__proc_info_begin,取得的是虚拟地址
197        sub    r3, r3, r4            @ get offset between virt&phys//r3=r3-r4,取得物理地址与虚拟地址的偏差
198        add    r5, r5, r3            @ convert virt addresses to//r5=r5+r3,取得物理地址__proc_info_end
199        add    r6, r6, r3            @ physical address space   //r6=r6+r3,取得物理地址__proc_info_begin
200    1:    ldr    r3, [r5, #MACHINFO_TYPE]    @ get machine type //r3=取得单板的编号
201        teq    r3, r1                @ matches loader number?//比较r3与r1是否相等,即linux是否支持uboot传入的单板
202        beq    2f                @ found                     //如果相等,则跳到207行,找到支持的单板,返回
203        add    r5, r5, #SIZEOF_MACHINE_DESC    @ next machine_desc//r5执向下一个machine_desc结构
204        cmp    r5, r6                                             //是否已经比较完machine_desc结构?
205        blo    1b                                                 //如果没有比较完,则跳到200行继续比较
206        mov    r5, #0                @ unknown machine              //如果所有machine_desc都比较完了,r5=0
207    2:    mov    pc, lr                                             //返回

其中__arch_info_begin、__arch_info_end被定义在arch\\arm\\kernel\\vmlinux.lds中,它的意思是内核源码中有被定义为.arch.info.init的内容,它的起始地址是__arch_info_begin,结束地址为__arch_info_end。

305      __arch_info_begin = .;
306       *(.arch.info.init)
307      __arch_info_end = .;

接着看到machine_desc结构的内容,它被定义在include\\asm-arm\\mach\\Arch.h 中

17    struct machine_desc {
18        /*
19         * Note! The first four elements are used
20         * by assembler code in head-armv.S
21         */
22        unsigned int        nr;        /* architecture number    */     //单板的编号,是从内核传过来的编号  r1
23        unsigned int        phys_io;    /* start of physical io    */
24        unsigned int        io_pg_offst;    /* byte offset for io 
25                             * page tabe entry    */
26
27        const char        *name;        /* architecture name    */
28        unsigned long        boot_params;    /* tagged list        *///boo传过来的tag标记的位置,也是从内核传过来的 r2
29
30        unsigned int        video_start;    /* start of video RAM    */
31        unsigned int        video_end;    /* end of video RAM    */
32
33        unsigned int        reserve_lp0 :1;    /* never has lp0    */
34        unsigned int        reserve_lp1 :1;    /* never has lp1    */
35        unsigned int        reserve_lp2 :1;    /* never has lp2    */
36        unsigned int        soft_reboot :1;    /* soft reboot        */
37        void            (*fixup)(struct machine_desc *,
38                         struct tag *, char **,
39                         struct meminfo *);
40        void            (*map_io)(void);/* IO mapping function    *///IO映射函数,移植时需要关注
41        void            (*init_irq)(void);
42        struct sys_timer    *timer;        /* system tick timer    */
43        void            (*init_machine)(void);
44    };

接着需要找到对于当前内核支持的machine_desc定义,在include\\asm-arm\\mach\\Arch.h 中有如下宏定义,它表示在.arch.info.init段存入一个machine_desc 的结构体,名称为

__mach_desc_type,结构体内.nr、.name初始化为MACH_TYPE_type、_name
50    #define MACHINE_START(_type,_name)            \\
51    static const struct machine_desc __mach_desc_##_type    \\
52     __used                            \\
53     __attribute__((__section__(".arch.info.init"))) = {    \\
54        .nr        = MACH_TYPE_##_type,        \\
55        .name        = _name,
56    
57    #define MACHINE_END                \\
58    };

接着找调用MACHINE_START这个宏的文件,在arch\\arm\\mach-s3c2440\\Mach-smdk2440.c 找到了,所以单板的ID为MACH_TYPE_S3C2440,它被定义在include\\asm-arm\\Mach-types.h中

#define MACH_TYPE_S3C2440              362。与UBOOT传入的参数相符合。

339    MACHINE_START(S3C2440, "SMDK2440")
340        /* Maintainer: Ben Dooks <ben@fluff.org> */
341        .phys_io    = S3C2410_PA_UART,
342        .io_pg_offst    = (((u32)S3C24XX_VA_UART) >> 18) & 0xfffc,
343        .boot_params    = S3C2410_SDRAM_PA + 0x100,
344
345        .init_irq    = s3c24xx_init_irq,
346        .map_io        = smdk2440_map_io,
347        .init_machine    = smdk2440_machine_init,
348        .timer        = &s3c24xx_timer,
349    MACHINE_END

继续来看MACHINE_START(S3C2440, "SMDK2440")这个宏,在里面有许多和开发板相关的设置,比如说smdk2440_map_io,它被定义在arch\\arm\\mach-s3c2440\\Mach-smdk2440.c中,在Linux移植之移植步骤中提到过想要移植成功,必须修改327行代码,将晶振的设置改为12000000。还有其它的一些配置就不一一列举了。

324    static void __init smdk2440_map_io(void)
325    {
326        s3c24xx_init_io(smdk2440_iodesc, ARRAY_SIZE(smdk2440_iodesc));
327        s3c24xx_init_clocks(12000000);//根据开发板合适的晶振配置
328        s3c24xx_init_uarts(smdk2440_uartcfgs, ARRAY_SIZE(smdk2440_uartcfgs));
329    }

回到arch/arm/kernel/head.s接着往下看,86、87行判断__lookup_machine_type是否成功找到支持单板的machine_desc结构,如果没找到则打印错误,88行是用来创建一级页表以建立虚拟地址到物理地址的映射关系,这里不详细分析。

继续往下看,看到100行,其中r10的值为__arm920_proc_info所在地址,PROCINFO_INITFUNC为proc_info_list结构体的偏移量,具体为__cpu_flush,对应到__arm920_proc_info结构体内,pc的值就是b __arm920_setup这条语句所在地址,即执行b __arm920_setup这条指令,__arm920_setup做一些MMU相关的初始化,在arch\\arm\\mm\\proc-arm920.S中,这里不做细究。

97    ldr    r13, __switch_data        @ address to jump to after//r13是堆栈寄存器sp
98                            @ mmu has been enabled
99    adr    lr, __enable_mmu        @ return (PIC) address //100行设置完成之后在使能MMU
100   add    pc, r10, #PROCINFO_INITFUNC//调用__arm920_setup函数,应该跟MMU相关,后面再研究

b __arm920_setup执行完毕返回之后执行的是arch/arm/kernel/head.s下的__enable_mmu 。

152        .type    __enable_mmu, %function
153    __enable_mmu:
.....
174        b    __turn_mmu_on


187        .align    5
188        .type    __turn_mmu_on, %function
189    __turn_mmu_on:
190        mov    r0, r0
191        mrc    p15, 0, r3, c0, c0, 0        @ read id reg
192        mov    r3, r3
193        mov    r3, r3
194        mov    pc, r13//设置完MMU之后跳转到__switch_data执行

__enable_mmu 执行完之后进入__switch_data执行,注意这时候的运行地址已经是初始化MMU之后的虚拟地址了。从15-24行可以看出pc=__mmap_switched,__mmap_switched的主要工作是将processor_id与__machine_arch_type初始化为当前MCU的编号与单板的编号

14        .type    __switch_data, %object
15    __switch_data:
16        .long    __mmap_switched
17        .long    __data_loc            @ r4
18        .long    __data_start            @ r5
19        .long    __bss_start            @ r6
20        .long    _end                @ r7
21        .long    processor_id            @ r4//之前找到的符合当前MCU的__arm920_proc_info结构体
22        .long    __machine_arch_type        @ r5//之前找到的符合单板的__mach_desc_S3C2440结构体
23        .long    cr_alignment            @ r6
24        .long    init_thread_union + THREAD_START_SP @ sp
25
26    /*
27     * The following fragment of code is executed with the MMU on in MMU mode,
28     * and uses absolute addresses; this is not position independent.
29     *
30     *  r0  = cp#15 control register
31     *  r1  = machine ID
32     *  r9  = processor ID
33     */
34        .type    __mmap_switched, %function
35    __mmap_switched://虚拟地址已经可以使用
36        adr    r3, __switch_data + 4//r3=__data_loc所在的地址
37
38        ldmia    r3!, {r4, r5, r6, r7}//r4=__data_loc所在地址;r5=__data_start所在地址依次类推 r3=__switch_data+4*4
39        cmp    r4, r5                @ Copy data segment if needed //检查是否有__data_loc段r4=r5说明没有__data_loc
40    1:    cmpne    r5, r6          
41        ldrne    fp, [r4], #4
42        strne    fp, [r5], #4
43        bne    1b
44
45        mov    fp, #0                @ Clear BSS (and zero fp)//清0BSS段
46    1:    cmp    r6, r7
47        strcc    fp, [r6],#4
48        bcc    1b
49
50        ldmia    r3, {r4, r5, r6, sp}//r4=processor_id、r5=__machine_arch_type、r6=cr_alignment、sp=init_thread_union + THREAD_START_SP
51        str    r9, [r4]            @ Save processor ID//processor_id=r9 = proc_info_list.cpu_val = 0x41009200
52        str    r1, [r5]            @ Save machine type//__machine_arch_type=r1 = machine_desc .nr =  MACH_TYPE_S3C2440 = 362
53        bic    r4, r0, #CR_A            @ Clear \'A\' bit
54        stmia    r6, {r0, r4}            @ Save control register values
55        b    start_kernel//跳转到start_kernel C函数

最终执行b start_kernel,跳到C函数,这是第二阶段的内容。

 

以上是关于Linux移植之内核启动过程引导阶段分析的主要内容,如果未能解决你的问题,请参考以下文章

Linux系统开机引导和启动过程-img文件

U-Boot之LINUX内核引导

linux-2.6.22.6内核启动分析之head.S引导段代码

Linux学习笔记之Linux系统启动过程

Linux内核分析之可执行程序的装载和启动

Linux内核启动及根文件系统载入过程