回归算法
上一节
下一节
一、概念
二、“回归”的历史
回归这个词最早是被高尔顿提出的,高尔顿这个人是谁呢,他是达尔文的表兄。他非常痴迷他兄长的进化论说,所以一直希望把进化论的理论应用到实证中,来证明不同人为什么会具有不同的特性。
高尔顿最著名的发现之一是他发现了父亲的身高和儿子的身高之间存在着某种给定的关系,他通过进一步的研究发现了:事实上子辈的平均身高是其父辈平均身高以及他们所处族群平均身高的加权平均和。他把这种趋势平均化的现象写到了自己1886年的论文中。论文的全名叫:Regression towards Mediocrity in Hereditary Stature. 这篇论文当年被发在了大不列颠以及爱尔兰人类研究学院期刊上。我们现今把论文中的这种“回归”现象称为:均值回归或者平庸回归(reversion to the mean/reversion to mediocrity)。背后的意义是说:哪怕单看一组父亲和孩子的身高,两个人的身高可能差异很大,但是从整个人群上来看,父亲和孩子的身高分布应该是很相近的。
三、线性回归
【什么是线性回归?请看伦大博士立群以汽车加油和隔壁老五“王者荣耀”上星的案例展示单变量的线性回归】
【什么是多变量线性回归?生活中有哪些多变量线性回归?】
总结:线性回归的假设函数为多元线性方程
![]()
四、损失函数
五、模型求解(最优化:损失值最小)
【什么是梯度下降法?】


