白话支持向量机(SVM)
我们来玩一个游戏:
首先在桌子上放两种颜色的球,它们似乎存在某种关系,那你能不能用一根木棒将两种颜色分开呢?要求:尽可能在桌面上放置更多的小球后仍然适用。

你大概会这么放吧:

为了测试你的答案是不是符合要求,我在桌上又放了更加多的蓝红小球,可以发现,一个红球被分错了位置:

支持向量机(SVM)可以白话为:试图找到一个木棍放置的最佳位置,使得木棍的两边有尽可能大的间隙。

如此一来,即使我放更多的红蓝小球,木棍仍然可以正确分开两种颜色:

看来我出的题目还是太简单了,下面我给你出个难点儿的问题:桌面上的小球按下图放置,你肯定不能直接用木棍分开两种颜色的小球了,要怎么办呢?

你可以用力拍桌子,使球飞到空中,然后快速用一张纸插到两种颜色的球之间。

再从桌面的角度看这些小球,它们被完美地用一条曲线分开了。

我们可以定义几个高大上的名词,
把这些小球叫做数据(data),把棍子叫做分类器(classifier),最大间隙trick叫做优化(optimization), 拍桌子叫做核化(kernelling), 那张纸叫做超平面(hyperplane)。

3.5.1 支持向量机的原理
3.5.2 结构风险最小化准则
3.5.3 线性不可分时的SVM之一 软间隔支持向量机
3.5.4 线性不可分时的SVM之二 非线性支持向量机