课程门户-章节详情

陈维维

机器学习

概念：1959 年萨缪尔提出机器学习一词，其研制的西洋跳棋程序被视为第一个机器学习程序。卡耐基梅隆大学教授米特歇尔认为，计算机程序能针对任务 T 和性能指标 P，从经验 E 中学习，且性能随 E 增加而提高。例如机器人冲咖啡，通过多次尝试，提高在规定时间成功冲好咖啡的次数，体现机器学习能力。机器学习过程涵盖数据预处理、特征提取、模型训练、评估和调整等步骤，数据、算法、算力是影响其效果的关键因素。
特征：具备自动化，能自动从数据提取特征并预测决策；适应性，适应不同数据情境提升性能；可扩展性，处理大规模数据集并优化性能；基础性，作为解决多领域问题的核心方法，如图像、语音识别等。
与人类思考比较：人类靠经验归纳规律预测未来，机器学习以历史数据为经验，训练得到模型进行预测，且模型能持续完善。
相关概念：人工智能包含机器学习，机器学习又包含深度学习。深度学习是基于学习数据表征的机器学习方法，近年来地位凸显。在任务处理上，机器学习需先提取对象特征再分类求解，深度学习则在一个神经网络模型中整合特征提取和分类求解。

按学习中推理多少，可分为机械学习、示教学习、类比学习、示例学习等。机械学习是最简单的记忆策略，无需推理；示教学习需一定推理转化；类比学习要发现任务相似点制定方案；示例学习要分析总结推广得到规律。

分为诞生奠基阶段、停滞瓶颈阶段、出现希望阶段、现代成型阶段、爆发阶段。诞生奠基阶段有赫布学习理论、图灵测试、机器学习概念提出等事件；停滞瓶颈阶段进展缓慢；出现希望阶段有决策树算法等；现代成型阶段有算法发展；爆发阶段深度学习、大语言模型等涌现。