本人在研读论文时时常感觉力有不逮,感慨基础不牢地动山摇。深度学习的数学基础是一个重要的方面,本文将介绍一些深度学习中常用的数学概念和方法。
Notation(符号约定,来自d2l)
数字
- x:标量
- x:向量
- X:矩阵
- X:张量
- I:单位矩阵
- xi, [x]i:向量x第i个元素
- xij, [X]ij:矩阵X第i行第j列的元素
集合论
- X: 集合
- Z: 整数集合
- R: 实数集合
- Rn: n维实数向量集合
- Ra×b: 包含a行和b列的实数矩阵集合
- A∪B: 集合A和B的并集
- A∩B:集合A和B的交集
- A∖B:集合A与集合B相减,B关于A的相对补集
函数和运算符
- f(⋅):函数
- log(⋅):自然对数
- exp(⋅): 指数函数
- 1X: 指示函数
- (⋅)⊤: 向量或矩阵的转置
- X−1: 矩阵的逆
- ⊙: 按元素相乘
- [⋅,⋅]:连结
- ∣X∣:集合的基数
- ∥⋅∥p: :Lp 正则
- ∥⋅∥: L2 正则
- ⟨x,y⟩:向量x和y的点积
- ∑: 连加
- ∏: 连乘
- =def:定义
微积分
- dxdy:y关于x的导数
- ∂x∂y:y关于x的偏导数
- ∇xy:y关于x的梯度
- ∫abf(x)dx: f在a到b区间上关于x的定积分
- ∫f(x)dx: f关于x的不定积分
概率与信息论
- P(⋅):概率分布
- z∼P: 随机变量z具有概率分布P
- P(X∣Y):X∣Y的条件概率
- p(x): 概率密度函数
- Ex[f(x)]: 函数f对x的数学期望
- X⊥Y: 随机变量X和Y是独立的
- X⊥Y∣Z: 随机变量X和Y在给定随机变量Z的条件下是独立的
- Var(X): 随机变量X的方差
- σX: 随机变量X的标准差
- Cov(X,Y): 随机变量X和Y的协方差
- ρ(X,Y): 随机变量X和Y的相关性
- H(X): 随机变量X的熵
- DKL(P∥Q): P和Q的KL-散度
复杂度
深度学习中的矩阵求导基础 ↗