首页 > 技术文章 > 矩阵基础

lykkk 2019-04-04 20:25 原文

矩阵的话还是慢慢来,前面的定义和基本运算很显然,看完定义就会,从矩阵乘法开始就难多了。

定义

\(n\times m\)个数\(a_ij\)排成的\(n\)\(m\)列的矩阵,记为

\[A=\begin{bmatrix} a_{11} & a_{12} & ··· & a_{1m} \\ a_{21} & a_{22} & ··· & a_{2m} \\ a_{31} & a_{32} & ··· & a_{3m} \\ ··· & ··· & & ··· \\ a_{m1} & a_{m2} & ··· & a_{nm} \\ \end{bmatrix} \]

\(n\times m\)个数称为矩阵\(A\)的元素,简称为元。数\(a_{ij}\)位于矩阵\(A\)的第\(i\)行第\(j\)列,称为矩阵\(A\)\((i,j)\)元,以数\(a_{ij}\)\((i,j)\)元的矩阵可以记为\(a_{ij}\)\((a_{ij}){n\times m}\)\(n\times m\)矩阵\(A\)也记作\(A_{nm}\)

元素是实数的矩阵称为实矩阵;
元素是复数的矩阵称为复矩阵;
行与列都等于\(n\)的矩阵称为\(n\)阶矩阵或\(n\)阶方阵
\(n\)阶方阵中所有\(i=j\)的元素\(a_{ij}\)组成的斜线称为(主)对角线
所有\(i+j=n+1\)的元素\(a_{ij}\)组成的斜线称为辅对角线。

基本运算:

矩阵的基本运算包括加法,减法,数乘, 共轭和共轭转置等。

加法与减法

对于两个同类型(行列数一样)的矩阵\(A\)\(B\),加法就是把对应\((i,j)\)元做加法运算 $$\begin{bmatrix}1 & 2 & 3 \3 & 0 &4\end{bmatrix}+\begin{bmatrix}2 & 3 & 3 \4 & 6 &1\end{bmatrix} = \begin{bmatrix}1+2 & 2+3 & 3+3 \3+4 & 0+6 &4+1\end{bmatrix} = \begin{bmatrix}3 & 5 & 6 \7 & 6 &5\end{bmatrix}$$
矩阵加法满足加法交换律和加法结合律

\[A+B=B+A \]

\[A+(B+C)=(A+B)+C \]

减法的运算与加法向类似

\[\begin{bmatrix}1 & 2 & 3 \\3 & 0 &4\end{bmatrix}-\begin{bmatrix}2 & 3 & 3 \\4 & 6 &1\end{bmatrix} = \begin{bmatrix}1-2 & 2-3 & 3-3 \\3-4 & 0-6 &4-1\end{bmatrix} = \begin{bmatrix}-1 & -1 & 0 \\-1 & -6 &3\end{bmatrix} \]

数乘

数乘就是一个数乘一个矩阵,只需要把这个数乘到每一个元\((i,j)\)

\[2\times \begin{bmatrix}1 & 0 & -2 \\3 & -3 &4\end{bmatrix} = \begin{bmatrix}1 \times 2 & 0\times 2 & -2\times 2 \\3\times 2 & -3\times 2 &4\times 2\end{bmatrix} = \begin{bmatrix}2 & 0 & -4 \\6 & -6 &8\end{bmatrix} \]

矩阵的数乘运算满足乘法的交换律,结合律,分配率

\[(\lambda \mu)A = \lambda(\mu A) \]

\[(\lambda+\mu)A=\lambda A+\mu A \]

\[\lambda(A+B) = \lambda A + \lambda B \]

乘法的加减法及数乘合称为矩阵的"线性"运算

转置

把矩阵\(A\)的行换成同序数的列得到的新的矩阵称为\(A\)的转置矩阵,这一过程称为矩阵的转置,简单说,就是把\((i,j)\)元的\(i\)\(j\)换一换,把\(a_{ij}\)变成\(a_{ji}\) $$\begin{bmatrix}1 & 0 & -2 \3 & -3 &4\end{bmatrix}^T=\begin{bmatrix}1 & 3 \ 0 &-3\-2&4\end{bmatrix}$$
矩阵的转置满足以下运算律
\(i\)\(j\)交换了两次又变回了原来的样子

\[(A^T)^T = A \]

剩下两个无非是先转再乘和先乘再转的区别,显然

\[(\lambda A)^T = \lambda A^T \]

\[(AB)^T=A^TB^T \]

共轭和共轭转置是在复矩阵上的,暂时还不研究

矩阵的乘法运算

上面的还比较简单,但到了矩阵乘法,一切都变了。

定义

两个矩阵的乘法仅当第一个矩阵\(A\)的列数和另一个矩阵B的行数相等时才能定义。如\(A\)\(m×n\)矩阵和\(B\)\(n×p\)矩阵,它们的乘积\(C\)是一个\(m×p\)矩阵\(C=(c_{ij})\),它的一个元素: $$c_{i,j} = a_{i,1}b_{1,j}+a_{i,2}b{2,j}+···+a_{i,n}b_{n,j} = \sum_{r=1}^na_{i,r}b_{r,j}$$
并将此乘积记为\(C=AB\) 例如:

\[\begin{bmatrix}1 & 2 & 3 \\3 & 0 &4\end{bmatrix}\times \begin{bmatrix}2 & 3\\1 & 4\\1 & 2\end{bmatrix} $$ $$= \begin{bmatrix}(1\times 2+ 2\times 1+3\times 1) & (1\times 3+2\times 4+3\times 2)\\(3\times 2+0\times 1+4\times 1)& (1\times 3+0\times 4+4\times 2)\end{bmatrix} = \begin{bmatrix}7&17\\10 & 17 \end{bmatrix} \]

满足结合律,左分配律,右分配律

\[A(BC)=(AB)C \]

\[(A+B)C=AC+BC \]

\[C(A+B)=CB+CA \]

但不满足交换律。

定义说完了,

why?

定义说完了,还是没懂,为什么是这么个规则?
矩阵的本质是线性方程,两者一一对应
给出一组线性方程

\[\begin{cases} 3x+4y=5\\ 2x+3y=3 \end{cases} \]

矩阵本来就是想为线性方程提供一个简单的表达形式

\[\begin{bmatrix}3&4\\2&3\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}=\begin{bmatrix}5\\3\end{bmatrix} \]

这样就差不多能看出矩阵乘法的规则了。
严格些说,对于三组未知数,\(x\)\(y\)\(z\)
\(x\)\(y\)的关系

\[\begin{cases} a_{11}x_1+a_{12}x_2=y_1\\ a_{21}x_1+a_{22}x_2=y_2 \end{cases}\]

得到

\[\begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix}\begin{bmatrix}x_1\\x_2\end{bmatrix}=\begin{bmatrix}y_1\\y_2\end{bmatrix} \]

\(x\)\(z\)的关系

\[\begin{cases} b_{11}z_1+b_{12}z_2=x_1\\ b_{21}z_1+b_{22}z_2=x_2 \end{cases}\]

得到

\[\begin{bmatrix}b_{11}&b_{12}\\b_{21}&b_{22}\end{bmatrix}\begin{bmatrix}t_1\\t_2\end{bmatrix}=\begin{bmatrix}x_1\\x_2\end{bmatrix} \]

这样就可以得到\(z\)\(y\)的关系

\[\begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix}\begin{bmatrix}b_{11}&b_{12}\\b_{21}&b_{22}\end{bmatrix}\begin{bmatrix}z_1\\z_2\end{bmatrix}=\begin{bmatrix}y_1\\y_2\end{bmatrix} \]

\[\begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix}\begin{bmatrix}b_{11}&b_{12}\\b_{21}&b_{22}\end{bmatrix} = \begin{bmatrix}y_1\\y_2\end{bmatrix}\div \begin{bmatrix}z_1\\z_2\end{bmatrix} \]

写到方程中就是

\[\begin{cases} a_{11}(b_{11}z_1+b_{12}z_2)+a_{12}(b_{21}z_1+b_{22}z_2)=y_1\\ a_{21}(b_{11}z_1+b_{12}z_2)+a_{22}(b_{21}z_1+b_{22}z_2)=y_2 \end{cases}\]

整理一下

\[\begin{cases} (a_{11}b_{11}+a_{12}b_{21})z_1+(a_{11}b_{12} + a_{12}b_{22})z_2=y_1\\ (a_{21}b_{11}+a_{22}b_{21})z_1+(a_{21}b_{12} + a_{22}b_{22})z_2=y_2 \end{cases}\]

\[==>\begin{bmatrix}a_{11}b_{11}+a_{12}b_{21}&a_{11}b_{12} + a_{12}b_{22}\\a_{21}b_{11}+a_{22}b_{21}&a_{21}b_{12} + a_{22}b_{22}\end{bmatrix}\begin{bmatrix}z_1\\z_2\end{bmatrix}=\begin{bmatrix}y_1\\y_2\end{bmatrix} \]

\[==>\begin{bmatrix}a_{11}b_{11}+a_{12}b_{21}&a_{11}b_{12} + a_{12}b_{22}\\a_{21}b_{11}+a_{22}b_{21}&a_{21}b_{12} + a_{22}b_{22}\end{bmatrix}=\begin{bmatrix}y_1\\y_2\end{bmatrix}\div \begin{bmatrix}z_1\\z_2\end{bmatrix} \]

\[==>\begin{bmatrix}a_{11}b_{11}+a_{12}b_{21}&a_{11}b_{12} + a_{12}b_{22}\\a_{21}b_{11}+a_{22}b_{21}&a_{21}b_{12} + a_{22}b_{22}\end{bmatrix}=\begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix}\begin{bmatrix}b_{11}&b_{12}\\b_{21}&b_{22}\end{bmatrix} \]

得到矩阵乘法的表达式。

推荐阅读