[Math] 矩陣微分

數學知識：矩陣微分
線代啟示錄
Wiki Matrix calculus

簡介：矩陣微分定義與基本性質

定義：scalar by vector 的導數

假設 $f$ 為 function，且擁有 $p$ 個獨立變數 $x_1,x_2,\cdots,x_p$
令 $\mathbf{x} = [x_1,x_2,\cdots,x_p]^{T} $
$\frac{\partial f}{\partial \mathbf{x}} = \left [\frac{\partial f}{\partial x_1},\frac{\partial f}{\partial x_2},\cdots,\frac{\partial f}{\partial x_p}\right ]^T$

定理(1)：$\frac{\partial \mathbf{x}^T\mathbf{x}}{\partial \mathbf{x}}=2\mathbf{x}$

定理(2)：$\frac{\partial \mathbf{x}^T\mathbf{y}}{\partial \mathbf{x}}=\mathbf{y}\Leftrightarrow \frac{\partial xy}{\partial x}=y$

定理(3)：$\frac{\partial \mathbf{A}^T\mathbf{x}}{\partial \mathbf{x}}=\mathbf{A}\Leftrightarrow \frac{\partial ax}{\partial x}=a$

定理(4)：$(i)\frac{\partial \mathbf{x}^T\mathbf{A}\mathbf{x}}{\partial \mathbf{x}}=(\mathbf{A}+\mathbf{A}^T)\mathbf{x} \quad (ii)If~ \mathbf{A}=\mathbf{A}^T\Rightarrow \frac{\partial \mathbf{x}^T\mathbf{A}\mathbf{x}}{\partial \mathbf{x}}=2\mathbf{A}\mathbf{x}\Leftrightarrow \frac{\partial }{\partial x}ax^2=2x$

定義：scalar by matrix 的導數

假設 $f$ 為 function，且擁有 $m \times n$ matrix $\mathbf{X}$ 變數 $$ \mathbf{X_{m\times n}}= \begin{bmatrix} x_{11} & x_{12} & \cdots & x_{1n}\\ x_{21} & x_{22} & \cdots & x_{2n}\\ \vdots & \vdots & \ddots & \vdots\\ x_{m1} & x_{m2} & \cdots & x_{mn}\\ \end{bmatrix} $$
假設所有 $\frac{\partial f}{\partial x_{ij}}$ 皆存在
$$ \frac{\partial f}{\partial \mathbf{X}}= \begin{bmatrix} \frac{\partial f}{\partial x_{11}} & \frac{\partial f}{\partial x_{12}} & \cdots & \frac{\partial f}{\partial x_{1n}}\\ \frac{\partial f}{\partial x_{21}} & \frac{\partial f}{\partial x_{22}} & \cdots & \frac{\partial f}{\partial x_{2n}}\\ \vdots & \vdots & \ddots & \vdots\\ \frac{\partial f}{\partial x_{m1}} & \frac{\partial f}{\partial x_{m2}} & \cdots & \frac{\partial f}{\partial x_{mn}}\\ \end{bmatrix}_{m\times n} $$

定義：matrix by scalar 的導數

假設 $\mathbf{F}$ 為 matrix function，且擁有 $x$ 變數
且所有 $\frac{\partial f_{ij}}{\partial x}$ 皆存在
$$ \frac{\partial \mathbf{F}}{\partial x}= \begin{bmatrix} \frac{\partial f_{11}}{\partial x} & \frac{\partial f_{12}}{\partial x} & \cdots & \frac{\partial f_{1n}}{\partial x}\\ \frac{\partial f_{21}}{\partial x} & \frac{\partial f_{22}}{\partial x} & \cdots & \frac{\partial f_{2n}}{\partial x}\\ \vdots & \vdots & \ddots & \vdots\\ \frac{\partial f_{m1}}{\partial x} & \frac{\partial f_{m2}}{\partial x} & \cdots & \frac{\partial f_{mn}}{\partial x}\\ \end{bmatrix}_{m\times n} $$

定理(5)：$\mathbf{X}_{n \times p} \Rightarrow \frac{\partial tr(\mathbf{X}^T\mathbf{X})}{\partial \mathbf{X}}=2\mathbf{X}$

定理(6)：$\mathbf{A}_{n \times p},\mathbf{X}_{n \times p} \Rightarrow \frac{\partial tr(\mathbf{A}^T\mathbf{X})} {\partial \mathbf{X}} = \mathbf{A}$

定理(7)：$\mathbf{A}_{n \times n},\mathbf{X}_{n \times p},\mathbf{B}_{p \times n} \Rightarrow \frac{\partial tr(\mathbf{A}^T\mathbf{X}\mathbf{B})} {\partial \mathbf{X}} = \mathbf{AB}^T$

定理(8)：$\mathbf{A}_{n \times n},\mathbf{X}_{n \times p} \Rightarrow \frac{\partial tr(\mathbf{X}^T\mathbf{A}\mathbf{X})} {\partial \mathbf{X}} = (\mathbf{A}+\mathbf{A}^T)\mathbf{X}$

定理(9)：$\mathbf{A}_{p \times p},\mathbf{X}_{n \times p} \Rightarrow \frac{\partial tr(\mathbf{X}\mathbf{A}\mathbf{X}^T)} {\partial \mathbf{X}} = \mathbf{X}(\mathbf{A}+\mathbf{A}^T)$

定理(10)：$\mathbf{X}_{p \times p}\Rightarrow \frac{\partial |\mathbf{X}|}{\partial \mathbf{X}}=|\mathbf{X}|(\mathbf{X}^{-1})^T$

定理(11)：$\mathbf{X}_{p \times p}\Rightarrow \frac{\partial \ln|\mathbf{X}|}{\partial \mathbf{X}}=(\mathbf{X}^{-1})^T$

子風的知識庫

搜尋此網誌