首页 > 解决方案 > 如何提取 scipy.fft.dct 用于 2D 的余弦变换公式?

问题描述

对于一维余弦变换,文档在这里很清楚,我可以轻松地复制它:

公式为:

来自 scipy.fft.dct 文档的屏幕截图,详细说明了 II 型 DCT

在这里它是手动复制的,例如三次谐波:

import numpy as np
from scipy.fft import fft, dct

y = np.array([10,3,5])

# dct() call:
print(dct(y, 2))

# manual reproduction for k = 2:
N = 3
k = 2
n = np.array([0,1,2])
2 * (
    y[0] * np.cos((np.pi*k*(2*n[0]+1))/(2*N)) + 
    y[1] * np.cos((np.pi*k*(2*n[1]+1))/(2*N)) + 
    y[2] * np.cos((np.pi*k*(2*n[2]+1))/(2*N)))

在这两种情况下,我都得到 9。

但是没有关于 2D DCT 的文档,我用玩具矩阵破解公式的尝试没有成功:

相比:

z = np.array([[ 2,  3       ],
             [ 10, 15]])
dct(z, axis=0)  # dct() call

例如:

N = 2
M = 2
k = 0
l = 0
n = np.array([0,1])
m = np.array([0,1])
M*N * (
    z[0,0] * np.cos((np.pi*k*(2*n[0]+1))/(2*N)) * np.cos((np.pi*l*(2*m[0]+1))/(2*M)) + 
    z[0,1] * np.cos((np.pi*k*(2*n[0]+1))/(2*N)) * np.cos((np.pi*l*(2*m[1]+1))/(2*M)) +
    z[1,0] * np.cos((np.pi*k*(2*n[1]+1))/(2*N)) * np.cos((np.pi*l*(2*m[0]+1))/(2*M)) +
    z[1,1] * np.cos((np.pi*k*(2*n[1]+1))/(2*N)) * np.cos((np.pi*l*(2*m[1]+1))/(2*M))
)

为第一个系数。

任何人都可以帮助我将输出dct()与我尝试的手动计算相协调吗?

估计公式不是...

广义二维 DCT 公式的屏幕截图,用红线划掉

但是,如果我可以为上面示例矩阵中的一个系数手动获得相同的输出,那将非常容易纠正。

标签: pythonscipyfft

解决方案


您找不到多维模式的公式,因为该函数不进行多维余弦变换。关键字应该是可疑的axis:在 NumPy、SciPy 中,它通常确定应该执行低维操作的方向。

换句话说,dct(z, axis=0)只是一个按列的一维余弦变换:

import numpy as np
from scipy.fft import dct

z = np.array([[ 2,  3],
             [ 10, 15]])
print(dct(z, axis=0))  # dct() call
print(np.array([dct(column) for column in z.T]).T)
# both outputs
# [[ 24.          36.        ]
#  [-11.3137085  -16.97056275]]

请注意最后一行的两个转置:它所做的只是首先循环遍历数组以根据列对其进行切片,然后再将它们按列连接。后者可能会更好地说明为

res = np.stack([dct(column) for column in z.T], axis=1)

推荐阅读