sigmoid 函数的通用逼近
sigmoidal function
神经网络相当于一个函数, 可以用于拟合任意的函数
但对于非线性的函数, 如果不加入某个非线性变换, 只靠神经网络自身结构, 那么得到的输出是输入的线性组合, 不能够表示一个任意的非线性函数
加入一个非线性函数就可以做到了, 就像把任意的函数傅里叶展开或泰勒展开
具体地, 我们说这样的函数
由 sigmoidal 函数组成的输出为
定义
给一些定义, 好像是泛函分析里面的, 现在不太懂
令
为 维单位矩阵 定义为在 上的连续函数空间 令
为在 上的有限有符号波雷尔测度 说
是 discriminatory 的, 如果对于一个测度
定理
定 理 令
为任意连续 discriminatory 函数, 那么 在 上是稠密的 即
需要两个预备定理: Hahn-Banach 定理 和 Riesz 表示定理
令
我们断言
具体地, 假设
由 Hahn-Banach 定理, 存在一个泛函
由 Riesz 表示定理, 存在
由于
但我们已知
这种情况下
所以反证得到
引 理 任意有界可测的 sigmoidal 函数
都是 discriminatory 的 特别地, 任何连续 sigmoidal 函数都是 discriminatory 的
需要预备定理: Lesbegue 有界收敛定理
有 界 收 敛 定 理 如果
有界 , 并且 , 那么
我们考察函数
在
记
那么
令
由 Lesbegue 有界收敛定理
并且我们要证
由于
即所有半平面上的测度都为
下面证明这个条件能推出测度
我们固定
对于有界可测函数
由于
令
那么
这对于开区间
由于线性性,
因为普通函数在
特别地, 令
由于
那么由于
所以
定 理 令
为任意连续 sigmoidal 函数, 那么 在 上是稠密的 即
由定理 1 和引理 1, 即得定理 2
这说明我们可以用 sigmoidal 函数去逼近任意的函数
ReLU 函数的通用逼近
ReLU 函数也有通用逼近性, 可以用将 ReLU 作为激活函数的神经网络逼近任意函数
具体见 [2]
参考