python - Julia 符号和数值性能与 Python
问题描述
我刚刚翻译了一组涉及矩阵的科学计算,其中元素是符号表达式,它们被区分并与各种其他数学表达式结合,然后进行数值积分。为了重现我遇到的性能差距,下面的代码片段构成了一个最小的示例。我知道符号区分然后数字积分没有意义,但同样,关键在于性能差距。需要注意的是,导入库并不代表太多时间,也不能解释性能差距。
朱莉娅代码:
using Symbolics, QuadGK
@variables x
m = [i * 10*x^3 + 1/i * sin(x) + 5*i*x^3 * cos(x) - 8i*x^2 + 2/sin(i*3.0)*x + exp(1/(x+10)) for i in 1:500]
m_d = expand_derivatives.(Differential(x).(m))
m_d_expr = build_function(m, x)
m_d_f = eval(m_d_expr[1])
v = quadgk(m_d_f, 0, 1)
print(v[1])
蟒蛇代码:
import pandas as pd
import numpy as np
from sympy import sin, diff, pi, lambdify, integrate, cos, exp
from sympy.abc import x
from sympy.matrices import Matrix
from scipy.integrate import quad
def integrate_matrix(m, v, a, b):
mi = np.zeros((m.rows, m.cols))
for i in range(m.rows):
for j in range(m.cols):
f = lambdify(v, m[i, j])
integral_value = quad(f, a, b)[0]
mi[i, j] = integral_value
return mi
m = Matrix([i * 10*x**3 + 1/i * sin(x) + 5*i*x**3 * cos(x) - 8*i*x**2 + 2/sin(i*3.0)*x + exp(1/(x+10)) for i in range(1, 501)])
v = integrate_matrix(m, x, 0, 1)
print(v)
我的问题:有没有办法改进 Julia 代码以匹配 Python 代码性能。每次我试图在 Julia 的表现上给我的码头留下深刻印象时,我都会感到尴尬。我仍然是 Julia 菜鸟,但我真的不知道该怎么办。
大约时间:Python:6 秒 Julia:30+ 秒
Julia 版本 1.6 Python 3.7
注意:由于差距很大,我发布了这个。不,CAS 并没有解释这一切。此外,我们正在做一个符号差异而不是集成,更不用说 sympy 被称为慢。我可以将代码添加到精确的时间,然后呢?我遇到问题的原始科学代码是 6 秒 Python 和 75 秒 Julia。多可惜。
解决方案
更快地运行整个事情是任何理智的人所关心的。
据我了解,Julia 关心的是运行速度快多次,而只运行一次总是更慢,因为 Julia 代码需要在执行之前进行编译。与 Julia 不同,Python 不进行任何 JIT 编译,并且始终准备好以相同的速度运行。
朱莉娅 1.6
因此,我将您的 Julia 代码粘贴到code.jl
并在同一会话中多次运行:
# New Julia session!
julia> @time include("code.jl")
[long array...]
24.660636 seconds (42.99 M allocations: 2.607 GiB, 3.82% gc time, 0.02% compilation time)
julia> @time include("code.jl")
[long array...]
2.761062 seconds (5.61 M allocations: 240.159 MiB, 10.39% gc time, 57.06% compilation time)
julia> @time include("code.jl")
[long array...]
2.608917 seconds (5.61 M allocations: 240.164 MiB, 4.47% gc time, 61.75% compilation time)
# Restarted Julia
julia> @time include("code.jl")
25.538249 seconds (42.99 M allocations: 2.607 GiB, 3.76% gc time, 0.02% compilation time)
julia> @time include("code.jl")
2.740550 seconds (5.61 M allocations: 240.159 MiB, 9.94% gc time, 56.72% compilation time)
因此,第一次运行代码大约需要 25 秒,再次运行大约需要 3 秒(!),即使这 3 秒中有 50% 用于编译内容。但是,最初的 25 秒中只有 0.02% 用于编译。显然,减速不是由于编译时间?还要注意它在第一次运行时执行了多少内存分配:4300 万对下一次运行大约 550 万(少 7倍!)。但无论如何,第一次运行真的很慢,而随后的运行速度很快。
第一次加载包也很慢:
julia> @time using Symbolics
3.503349 seconds (6.42 M allocations: 460.519 MiB, 3.53% gc time, 0.13% compilation time)
julia> @time using Symbolics
0.000241 seconds (136 allocations: 9.641 KiB)
0.000280 seconds (136 allocations: 9.641 KiB)
0.000249 seconds (136 allocations: 9.641 KiB)
0.000251 seconds (136 allocations: 9.641 KiB)
0.000252 seconds (136 allocations: 9.641 KiB)
0.000246 seconds (136 allocations: 9.641 KiB)
# I didn't import it before,
# but apparently `Symbolics` did
julia> @time using QuadGK
0.000276 seconds (137 allocations: 9.688 KiB)
0.000276 seconds (136 allocations: 9.641 KiB)
0.000240 seconds (136 allocations: 9.641 KiB)
0.000251 seconds (136 allocations: 9.641 KiB)
也就是说,仅使用导入运行代码的第一行就花费了 3.5 秒。我想,由于缓存,后续导入显然更快。
列表理解的第一次运行也很慢
julia> @time m = [i * 10*x^3 + 1/i * sin(x) + 5*i*x^3 * cos(x) - 8i*x^2 + 2/sin(i*3.0)*x + exp(1/(x+10)) for i in 1:500];
2.590259 seconds (4.69 M allocations: 284.672 MiB, 10.86% gc time, 98.69% compilation time)
julia> @time m = [i * 10*x^3 + 1/i * sin(x) + 5*i*x^3 * cos(x) - 8i*x^2 + 2/sin(i*3.0)*x + exp(1/(x+10)) for i in 1:500];
0.102573 seconds (231.21 k allocations: 12.507 MiB, 72.61% compilation time)
0.098871 seconds (231.21 k allocations: 12.508 MiB, 72.39% compilation time)
0.108458 seconds (231.21 k allocations: 12.512 MiB, 7.93% gc time, 67.73% compilation time)
0.099787 seconds (231.22 k allocations: 12.508 MiB, 72.99% compilation time)
0.098378 seconds (231.21 k allocations: 12.507 MiB, 73.80% compilation time)
同样,启动缓慢(98.69% 的编译时间),但下一次运行要快得多。
蟒蛇 3.9.2
~/t/SO_q $ time python3 thecode.py
________________________________________________________
Executed in 5,88 secs
~/t/SO_q $ time python3 thecode.py
________________________________________________________
Executed in 5,90 secs
Executed in 5,36 secs
Executed in 5,39 secs
Executed in 5,35 secs
Executed in 5,36 secs
Executed in 5,77 secs
Executed in 6,10 secs
Executed in 5,38 secs
因此,Python 代码持续运行大约6 秒。
这比后续运行 Julia 代码慢2 倍!但是,一旦启动 Python 解释器,您就会获得这种速度,而 Julia 将花时间编译代码并做……其他需要 4300 万内存分配的事情。但是 Julia 以糟糕的启动时间换取的是编译代码的性能(在这个例子中,Julia比 Python 快 2 倍)。
如何让 Julia 更快
推荐阅读
- php - PHP 中的 JSON_ERROR_CTRL_CHAR
- python - 我需要微调 ResNet50 等最先进的 CNN 模型中的最后一个卷积层吗?
- excel - 组合表 | PowerBI 与 VBA
- javascript - 如何设置 FabricJS 图像的 4 个角 X、Y 坐标值
- javascript - 提交表单然后在 Bootstrap 5 中禁用
- javascript - 单击时来回更改 div 的颜色
- html - 将带有专用 CSS 样式的自定义 HTML 添加到 Wordpress 上的现有主题
- excel - 删除行的 VBA 代码仅删除第一行
- visual-c++ - 即使定义了未解析的符号,链接器错误 lnk2001
- bash - 关于 $(...) 和 bash 中的引号的问题