机器学习有很多关于核函数的说法,核函数的定义和作用是什
发布网友
发布时间:2024-10-23 04:42
我来回答
共1个回答
热心网友
时间:2024-11-01 21:53
核函数与映射之间不存在直接联系。核函数的实质是简化计算高维空间内积的一种便捷手段。
通常在英文文献中,核函数有Kernel Function和Kernel Trick两种提法。Kernel Trick一词表明其本质上只是一种运算技巧,并非深奥难懂。
对于原本线性不可分的数据集,我们有两种处理方式:一是容忍错误分类,即引入Soft Margin;二是对输入空间进行特征扩展,将其映射到高维空间中,形成特征空间。我们几乎可以认为(Caltech课堂用语),原本在低维空间中线性不可分的数据集在足够高的维度中存在线性可分的超平面。
围绕特征扩展选项,我们在特征空间中应用在线性可分情况下的优化方法,以找到最大化间隔的超平面。原理机制与输入空间中相同,都是二次规划,唯一不同在于代入数据不同,我们需要代入核函数计算内积,而不是原始数据。
核函数的真正意义在于简化计算内积的过程,具体来说,就是简化二次规划中的一步内积计算。原本必须求得的内积[公式],现在通过定义核函数[公式],我们能够在不需要显式计算每一个[公式]、甚至不需要知道[公式]长什么样的情况下,直接求出内积的值。
由此看来,核函数、内积、相似度这三个概念实际上是等价的。因为内积本质上是一种相似度的度量,而核函数与映射并无直接关联。
之所以有观点将核函数视为映射,主要是因为这两件事通常先后进行,容易混淆。此外,核函数让人们无需了解映射的具体形式,仅通过定义核函数即可计算内积,这往往被视作一种隐式映射。这一观点得益于Mercer定理,即只要核函数满足一定条件,那么映射空间必定存在。