任务简介
上一节
下一节
背景知识
模式识别
机器学习的一个重要应用领域就是模式识别。它通过计算机用数学技术方法来研究模式的自动处理和判读,把环境与客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过程,其过程的一个重要形式是生命体对环境及客体的识别。模式识别以图像处理与计算机视觉、语音语言信息处理、脑网络组、类脑智能等为主要研究方向,研究人类模式识别的机理以及有效的计算方法。模式识别包括语音识别、图像识别、车牌识别、文字识别、人脸识别、信号识别等应用。
手写体识别
其中手写体文字识别,对于人类来说可以很容易理解一张图片所表达的信息,这是人类视觉系统数万年演变进化的结果。但对于计算机这个诞生进化不到百年的“新星”,要让它理解一张图像上的信息是一个复杂的过程。计算机理解图像是一个数字计算比较的过程。
图像的传统识别流程分为四个步骤:图像采集→图像预处理→特征提取→图像识别。要识别图像字符,首先需要模版库,即图像采集。对于识别简单字符,可自己训练,也可网上下载数据集。
训练的模型有很多可以选择,比如KNN、SVM、ANN、CNN等等,都可以达到较好的效果。要想把图像数据输入到训练好的模型中,需要对图像进行预处理:包括去除不必要的信息,比如:灰度化、二值化处理等,有的还需要对图像进行分割。切割后的图片对应一个字符,进行识别。
任务简介
接下来,我们将使用不同的方法对网络上公开的手写数字数据集进行训练,产生模型,要求训练好的模型可以准确地识别其中的数字。
具体实现过程可参考PPT及后续讲解内容
下载并完成实验报告,找到发布的作业并上传至平台:
ipynb版
本次实验用到的数字资源

