首页 > 解决方案 > x64 函数调用参数推送/移动顺序 (MSVC)

问题描述

我正在学习 x64 汇编,并使用带有 MS VC 工具集的基本示例应用程序。Microsoft 文档表明,对于整数和指针变量,前 4 个参数将被压入 RC、RD、R8、R9 中,其余变量将使用堆栈。我理解这一点,从下面的代码片段、程序集调试中看起来很像,但我无法理解为什么这些没有按顺序完成?在下面的示例中,我希望反汇编出现从右到左顺序推动参数 e、d、c、b、a、cp、ip 但我看到被推动的是 e、b、a 等。有人可以解释一下吗? TIA

代码片段

__declspec(noinline) int testArgsAsm(int* x, char* cp, int a, int b, int c, int d, int e)
{
    std::cout << *x << *cp;
    int sum = a + b + c + d + e;
    if (sum == 0)
        std::cout << "0";
    else
        std::cout << "Non 0";
    return sum;

}
int main(int argc, const char** args)
{
    int a, b, c, d, e;
    int* ip = new int; *ip = 0x101;
    char* cp = new char; *cp = ('g');
    std::cin >> a >> b >> c >> d >> e;
    testArgsAsm(ip, cp, a,b,c,d,e);
    return 0;
}

Assembly

    testArgsAsm(ip, cp, a,b,c,d,e);
00007FF694DB1359  mov         eax,dword ptr [e]  
00007FF694DB135D  mov         r9d,dword ptr [b]  
00007FF694DB1362  mov         r8d,dword ptr [a]  
00007FF694DB1367  mov         dword ptr [rsp+30h],eax  
00007FF694DB136B  mov         eax,dword ptr [d]  
00007FF694DB136F  mov         dword ptr [rsp+28h],eax  
00007FF694DB1373  mov         eax,dword ptr [c]  
00007FF694DB1377  mov         rdx,rbx  
00007FF694DB137A  mov         rcx,rdi  
00007FF694DB137D  mov         dword ptr [rsp+20h],eax  
00007FF694DB1381  call        testArgsAsm (07FF694DB1270h)  <= Instruction pointer

registers at this instant
    RAX = 0000000000000003 RBX = 0000025633A16030 RCX = 0000025633A13EC0 RDX = 0000025633A16030
RSI = 0000000000000000 RDI = 0000025633A13EC0 R8  = 0000000000000001 R9  = 0000000000000002 
R10 = 000000000000000F R11 = 000000F5016F0001 R12 = 0000000000000000 R13 = 0000000000000000 
R14 = 0000000000000000 R15 = 0000000000000000 RIP = 00007FF694DB1381 RSP = 000000F5016FFB00 
RBP = 0000000000000000 EFL = 00000202 

PS:这可能是一个菜鸟问题,因为我刚刚开始学习 asy

标签: c++assemblyvisual-c++x86-64disassembly

解决方案


我无法理解为什么这些没有按顺序完成?

重要的是在正确的寄存器中具有正确的值call。它们放在那里的顺序无关紧要。

与堆栈参数相反的唯一原因是当您在push存储它们的同时为它们分配堆栈空间。MSVC 选择不这样做,mov而是使用,所以(除了可能的性能差异)它在内存中写入参数的顺序为零差异,只要每个参数都写入正确的位置。

这个调用者已经为 args + 32 字节影子空间保留了空间(如果需要,被调用者可以将寄存器 args 溢出以形成 args 数组),所以它使用mov而不是push.


函数首先使用它们的第一个 args 并不少见,因此首先在调用者中设置它可能会避免延迟瓶颈,并且意味着乱序执行不必费尽心思就能找到输入就绪的指令前端开始从被调用函数发出指令。(http://agner.org/optimize/)。

或者只是编译器从左到右解析函数 args 并最终发出按该顺序排列的 asm。


推荐阅读