(一)机器学习的内涵
概念 :1959 年萨缪尔提出机器学习一词,其研制的西洋跳棋程序被视为第一个机器学习程序。卡耐基梅隆大学教授米特歇尔认为,计算机程序能针对任务 T 和性能指标 P,从经验 E 中学习,且性能随 E 增加而提高。例如机器人冲咖啡,通过多次尝试,提高在规定时间成功冲好咖啡的次数,体现机器学习能力。机器学习过程涵盖数据预处理、特征提取、模型训练、评估和调整等步骤,数据、算法、算力是影响其效果的关键因素。
特征 :具备自动化,能自动从数据提取特征并预测决策;适应性,适应不同数据情境提升性能;可扩展性,处理大规模数据集并优化性能;基础性,作为解决多领域问题的核心方法,如图像、语音识别等。
与人类思考比较 :人类靠经验归纳规律预测未来,机器学习以历史数据为经验,训练得到模型进行预测,且模型能持续完善。
相关概念 :人工智能包含机器学习,机器学习又包含深度学习。深度学习是基于学习数据表征的机器学习方法,近年来地位凸显。在任务处理上,机器学习需先提取对象特征再分类求解,深度学习则在一个神经网络模型中整合特征提取和分类求解。
(二)机器学习的分类
按学习中推理多少,可分为机械学习、示教学习、类比学习、示例学习等。机械学习是最简单的记忆策略,无需推理;示教学习需一定推理转化;类比学习要发现任务相似点制定方案;示例学习要分析总结推广得到规律。
(三)机器学习的常用方法
监督学习 :如人类学习猫的特征,要经过准备数据、训练模型、验证模型三个环节。即准备大量带标记的猫图训练计算机提取特征建立模型,再用未标记图验证模型成功与否。
无监督学习 :无指令数据,计算机自主学习发现规律。如 AlphaGo 第二阶段学习,计算机自行将猫图按颜色等分类。
强化学习 :类似人类在环境中学习,机器通过试错,在变化环境中找到最佳决策。如模拟猫在迷宫中寻找猫粮同时避免电击的过程,强化学习模型由状态、动作、奖励、策略组成。
(四)机器学习的发展历史
分为诞生奠基阶段、停滞瓶颈阶段、出现希望阶段、现代成型阶段、爆发阶段。诞生奠基阶段有赫布学习理论、图灵测试、机器学习概念提出等事件;停滞瓶颈阶段进展缓慢;出现希望阶段有决策树算法等;现代成型阶段有算法发展;爆发阶段深度学习、大语言模型等涌现。

