首页 > 解决方案 > Linux 内核初始化上未调用内置平台驱动程序 __initcall

问题描述

背景

我正在通过 Yocto 为一些供应商提供的嵌入式硬件提供 Linux 内核。我已将映像配置为通过 fitImage 启动,带有 initramfs 而没有 rootfs(有持久存储,但这完全是供用户空间应用程序使用的)。想想 PXE 实时图像,您就不会太远了。

在我的 initramfs 图像超过 ~128MB 标记之前,一切都进展顺利。在此之下,一切都按预期启动,并且所有驱动程序都没有问题。超过此标记,内核仍会启动,但许多驱动程序(尽管不是全部)未绑定。这是相当令人困惑的,因为所有驱动程序都是静态内置到内核中的(在这个平台上不使用任何模块)。不幸的是,其中一个模块运行平台看门狗,这会导致完全可预测的重启。

到目前为止,我已经验证了所有符号都存在于 vmlinux 映像中:

$ objdump -x vmlinux | grep mtk_wdt
0000000000000000 l    df *ABS*  0000000000000000 mtk_wdt.c
ffffff800880ac40 l     F .text  000000000000004c mtk_wdt_stop
ffffff800880ac90 l     F .text  0000000000000040 mtk_wdt_shutdown
ffffff80091de778 l     F .init.text     0000000000000020 mtk_wdt_driver_init
ffffff800880acd0 l     F .text  000000000000004c mtk_wdt_ping
ffffff800880ad20 l     F .text  0000000000000070 mtk_wdt_set_timeout
ffffff800880ad90 l     F .text  0000000000000074 mtk_wdt_start
ffffff800880ae08 l     F .text  0000000000000144 mtk_wdt_resume
ffffff800880af50 l     F .text  0000000000000120 mtk_wdt_suspend
ffffff800880b070 l     F .text  0000000000000080 mtk_wdt_remove
ffffff80088977a8 l     F .text  0000000000000210 mtk_wdt_isr
ffffff80091fe0a0 l     F .exit.text     000000000000001c mtk_wdt_driver_exit
ffffff800880b4f0 l     F .text  0000000000000310 mtk_wdt_probe
ffffff8008c2acd8 l     O .rodata        0000000000000028 mtk_wdt_info
ffffff8008c2ad00 l     O .rodata        0000000000000050 mtk_wdt_ops
ffffff8008c2ad98 l     O .rodata        00000000000000b8 mtk_wdt_pm_ops
ffffff8008c2ae50 l     O .rodata        0000000000000190 mtk_wdt_dt_ids
ffffff80093a3cb8 l     O .data  00000000000000b0 mtk_wdt_driver
ffffff800a199368 l     O .bss   0000000000000008 mtk_wdt1
ffffff8009285598 l     O .init.data     0000000000000008 __initcall_mtk_wdt_driver_init6

此外,我在 fitImage 程序集之前、fitImage 程序集之后和解压缩到系统内存之后(通过引导加载程序)对二进制内核(例如 linux.bin)、initramfs 和设备树进行了 sha256 校验和;都匹配。据我所知,构建的东西就是解包和启动的东西。

此外,我已经启用initcall_debug并且,当我看到其他 __initcall()s 时,未绑定的驱动程序毫无疑问地丢失了。

我知道设备存在于设备树中并且配置正确。启动后,我在看门狗启动之前获得了大约 5 秒的控制台访问权限;只是有足够的时间来完成一两个命令。在“工作”图像(initramfs < ~128MB)和失败图像(initramfs > ~128MB)上,内容/sys/bus/platform/devices是相同的,我可以看到(除其他外),我的看门狗:

$ ls -lha /sys/bus/platform/devices
...
lrwxrwxrwx 1 root root 0 Jan  1 00:00 10007000.watchdog -> ../../../devices/platform/10007000.watchdog

执行相同的测试但比较/sys/bus/platform/devices显示没有 __initcall() 的驱动程序丢失。

我检查过的其他一些集体事项:

鉴于以上所有情况,我唯一不知道如何验证的是从 vmlinux 跳转到 linux.bin。这是通过 objcopy 在 Yocto 中完成的,如下所示:

[ -n "${vmlinux_path}" ] && ${OBJCOPY} -O binary -R .note -R .comment -S "${vmlinux_path}" linux.bin

问题

  1. 如何验证给定符号是否包含在最终的 linux.bin 中?
  2. 哪些机制会影响构建时包含或排除给定符号?
  3. 内核构建和运行时的哪些部分受 initramfs 大小的影响?
  4. 是否有任何其他工具/技术/部落智慧可以帮助调试这种情况?

编辑 1

下面是所有内容所在位置和空间利用率的基本内存映射。正如上面和评论中提到的,我可以将内核、DTB 和 initramfs 重新定位到(几乎)任意位置,但问题仍然存在。

0x40000000 - 0x40001000 = Bootloader arg area (Fixed usage)
0x40080000 - 0x41EDFFFF = Kernel (~12MB / 29.5MB used)
0x41E00000 - 0x42FF5FFF = Trampoline (96 bytes / ~6MB used)
0x42FF6000 - 0x42FFFFFF = ATF BL3-1 (Fixed usage)
0x43000000 - 0x43FFFFFF = Trusted OS (~476K / 16M used)
0x44000000 - 0x44FFFFFF = DTB (~77.3K / 16M used)
0x45000000 - 0x47FFFFFF = Trusted OS memory (dynamic)
0x48000000 - 0x5FFFFFFF = Initramfs (~129MB / 384MB used)
0x60000000 - MEM END    = Free

标签: linuxlinux-kernelembedded-linuxyoctodebug-symbols

解决方案


所以,像大多数内核问题一样,真正的问题并不在我想的地方。事实证明,问题是由 init 列表中较早的其他驱动程序之一挂起核心引起的,从而阻止了看门狗驱动程序的注册。这如何受 initramfs 影响超出了我的范围,这是它自己的问题。

对于将来遇到此问题的任何人,我上面的具体问题的答案如下:

  1. 如何验证给定符号是否包含在最终的 linux.bin 中?

我无法弄清楚如何静态地做到这一点。也就是说,我可以通过将printk()s 添加到do_initcall_levelin来在运行时打印 init 函数的地址init/main.c。然后可以将打印的地址与 vmlinux 上的 objdump 的输出进行比较(有关咒语,请参阅我的问题)。

可以在此处找到对 initcall 过程的真正有用且深入的描述。

请注意,您也可以打开initcall_debug,这将打印每个函数名称。就我而言,我想要原始地址,这就是我选择该printk()方法的原因。

  1. 哪些机制会影响构建时包含或排除给定符号?

其中大部分归结为您的 .config。绝大多数包含/排除是通过预处理器完成的。其他有用的项目是用于您设备的链接描述文件公共头文件include/asm-generic/vmlinux.lds.h和平台链接描述文件arch/<arch>/*/*.lds

  1. 内核构建和运行时的哪些部分受 initramfs 大小的影响?

还没有这个想法。

  1. 是否有任何其他工具/技术/部落智慧可以帮助调试这种情况?

不要恐慌


推荐阅读