performance - Rust 编译器会自动删除不必要的中间变量吗?
问题描述
在某些语言中,我被告知编译器将执行优化以删除不必要的“中间”局部变量以提高执行效率。
有人知道 Rust 是否也这样做吗?例如,考虑以下代码片段:
fn main() {
// has four local variables
let x = 3;
let y = 5;
let temp_result = x + y;
let final_result = temp_result * 40;
println!("The final result is: {}", final_result);
}
与下面的实现相比,它似乎有零显式创建的局部变量
fn main() {
// has no explicitly created local variables
println!("The final result is: {}", (3+5) * 40);
}
这些会生成相同的机器代码吗?
换句话说,在给定硬编码整数输入的情况下,编译器是否“意识到”第一个实现中的四个局部变量与第二个实现等效?
解决方案
这是一个测试版本的游乐场链接。查看在发布模式下生成的程序集:
playground::main:
pushq %r15
pushq %r14
pushq %r12
pushq %rbx
subq $72, %rsp
####################### f1() here
movl $320, 4(%rsp) # whole function optimized to static value of 320
#######################
leaq 4(%rsp), %r14
movq %r14, 8(%rsp)
movq core::fmt::num::imp::<impl core::fmt::Display for i32>::fmt@GOTPCREL(%rip), %r15
movq %r15, 16(%rsp)
leaq .L__unnamed_2(%rip), %rax
movq %rax, 24(%rsp)
movq $2, 32(%rsp)
movq $0, 40(%rsp)
leaq 8(%rsp), %rbx
movq %rbx, 56(%rsp)
movq $1, 64(%rsp)
movq std::io::stdio::_print@GOTPCREL(%rip), %r12
leaq 24(%rsp), %rdi
callq *%r12
####################### f2() here
movl $320, 4(%rsp) # same as with f1()
#######################
movq %r14, 8(%rsp)
movq %r15, 16(%rsp)
leaq .L__unnamed_3(%rip), %rax
movq %rax, 24(%rsp)
movq $2, 32(%rsp)
movq $0, 40(%rsp)
movq %rbx, 56(%rsp)
movq $1, 64(%rsp)
leaq 24(%rsp), %rdi
callq *%r12
addq $72, %rsp
popq %rbx
popq %r12
popq %r14
popq %r15
retq
因为在您的示例中返回值是静态已知的,所以这些函数甚至不会出现在编译的代码中。即使您像这样定义函数,您实际上也会得到相同的结果:
fn f1(a: i32, b: i32, c:i32) -> i32 {
let x = a;
let y = b;
let temp_result = x + y;
let final_result = temp_result * c;
final_result
}
fn f2(a: i32, b: i32, c: i32) -> i32 {
(a + b) * c
}
pub fn main() {
println!("f1() = {}", f1(3, 5, 40));
println!("f2() = {}", f2(3, 5, 40));
}
如果在编译时不知道参数会怎样?这是另一个游乐场,这次随机计算的值和两个函数都被标记#[inline(never)]
:
playground::f1:
leal (%rdi,%rsi), %eax
imull %edx, %eax
retq
playground::main:
# rng initialization...
.LBB7_20:
movl 8(%rbp,%rax,4), %ebx
addq $1, %rax
movq %rax, (%rbp)
movl %r15d, %edi
movl %r12d, %esi
movl %ebx, %edx
######################## f1() called here
callq playground::f1 #
########################
movl %eax, 4(%rsp)
leaq 4(%rsp), %rax
movq %rax, 8(%rsp)
movq core::fmt::num::imp::<impl core::fmt::Display for i32>::fmt@GOTPCREL(%rip), %r13
movq %r13, 16(%rsp)
leaq .L__unnamed_3(%rip), %rax
movq %rax, 24(%rsp)
movq $2, 32(%rsp)
movq $0, 40(%rsp)
leaq 8(%rsp), %rbp
movq %rbp, 56(%rsp)
movq $1, 64(%rsp)
movq std::io::stdio::_print@GOTPCREL(%rip), %r14
leaq 24(%rsp), %rdi
callq *%r14
movl %r15d, %edi
movl %r12d, %esi
movl %ebx, %edx
######################## and again here!
callq playground::f1 #
########################
# ...
retq
编译器实际上已经认识到这些函数是相同的,并将它们折叠成一个定义。
推荐阅读
- javascript - 选择或 Jquery 有时无法加载
- java - 条件正则表达式
- javascript - 无法在 AngularJS 中的 Internet Explorer 11 中获取事件目标的父级
- javascript - 带有偏移量的画布 createPattern() 和 fill()
- python - 如何修复此 python 代码以获取我在代码中引用的表中的所有人员姓名?
- mips - 在 mips 程序集中显示浮点数的问题
- outlook-web-addins - outlook.office.com 上的插件是否存在额外边距出现的错误?
- java - 从 Alertdialog EditText 保存文本并显示到 Recyclerview 并永久保存
- networking - 我可以设置网络以在没有 Internet 访问权限的情况下共享信息吗?
- css - Angular:CSS封装bug-网格组件:悬停样式应用于兄弟网格组件