个人介绍
图像分析与检索

主讲教师:孟繁杰

学校: 西电学习服务平台
课程编号: ZJ0647147
课程介绍
图像分析与检索是认知与计算机学科中的一个令人兴奋的活跃分支,其实用性强、应用广泛。尤其是在互联网图像数据爆炸性增长后,很多实际应用如遥感、技术诊断、自主车导航、医学成像和自动监控等等都飞速发展。这无疑极大地吸引了广大大学生的求知欲望和学习兴趣。因此,我们开设了《图像分析与检索》这门课程。
这是一门本科生和研究生都可参加学习的创新研修课程。本课程主要采用“专题教学+上机实验+学生阅读文献+师生讨论+学生专题研究报告”的教学模式,侧重于学习和研究图像分析与检索领域的相关理论算法和最新的研究进展,目标是使学生学习了本课程之后,对数字图像分析与检索的基本原理以及解决问题的基本思想方法有一个较为全面的了解和领会;了解人工智能的最新相关应用;具备解决智能目标识别、检索等应用问题的初步能力,为以后从事计算机视觉、模式识别、图像通讯、多媒体技术等领域的研究与开发工作奠定基础。
你准备好了吗?现在就和我们一起开启《图像分析与检索》的学习旅程吧!
教学大纲

《图像分析与检索》教学大纲

 

课程编号:

课程名称:图像分析与检索                    英文名称:Image analysis and retrieval

学分/学时:2/32                            课程性质:任选课

适用专业:全校理工科专业

先修课程:计算机基础,信号与系统等

建议开设学期:第6学期                      开课单位:空间科学与技术学院

一、课程的教学目标与任务

《图像分析与检索》是一门本科生创新研修课程。本课程主要采用“专题教学+上机实验+学生阅读文献+师生讨论+学生专题研究报告”的教学模式,侧重于学习和研究图像处理、分析与检索领域的相关理论算法,然后通过MATLAB编程实现这些算法。目标是使学生学习了本课程之后,对数字图像分析与检索的基本原理以及解决问题的基本思想方法有一个较为全面的了解和领会;了解人工智能的相关应用;具备解决智能目标识别、检索等应用问题的初步能力,为以后从事计算机视觉、模式识别、图像通讯、多媒体技术等领域的研究与开发工作奠定基础。

二、课程具体内容及基本要求

(一)图像预处理  ( 2学时)

讲授图像预处理的常见方法。

1.基本要求:

1)掌握图像平滑方法;

2)掌握图像增强方法。

2.重点、难点

重点:噪声抑制的统计原理、中值滤波、非线性均值滤波、直方图均衡。

难点:直方图均衡。

3.作业及课外学习要求:用MATLAB对图像进行直方图均衡化,并解释直方图均衡化的原理。

(二)图像及其数学与物理背景  ( 2学时)

讲授图像的几何变换、几何失真与矫正、小波变换、NSCT变换。

1.基本要求:

1)掌握图像的几何变换;

2)掌握图像的几何失真与矫正;

3)了解小波变换原理;

4)了解NSCT变换原理。

2.重点、难点

重点:几何变换、几何失真与矫正、小波变换基本原理、NSCT变换基本原理。

难点:小波变换基本原理、NSCT变换基本原理。

3.作业及课外学习要求:用MATLAB对图像进行几何变换;用MATLAB对图像进行小波分解和NSCT分解。

(三)图像分割  ( 4学时)

讲授视觉认知模式、基于边缘的图像分割技术、基于区域的图像分割技术、图像分割评价。

1.基本要求:

1)了解人类视觉的认知模式;

2)掌握基于边界的基本图像分割技术(边缘检测、微分算子、哈夫变换、图搜索、动态规划等);

3)掌握基于区域的基本图像分割技术(阈值分割、区域标记、区域生长、分裂合并等);

4)掌握基本的图像分割评价方法和测度等。

2.重点、难点

重点:边缘检测、微分算子、阈值分割、区域生长、评价测度、哈夫变换、分裂合并。

难点:区域生长、哈夫变换、分裂合并。

3.作业及课外学习要求:用MATLAB对图像进行区域分割。

(四)图像特征的提取与表达  ( 4学时)

讲授图像颜色特征的提取和表达方法、形状特征的提取和表达方法以及纹理特征的提取和表达方法。

1.基本要求:

1)掌握颜色直方图、颜色矩;

2)掌握兴趣点检测方法;

3)掌握边界特征的表达、测量及描述方法(链码、边界段、标记、形状树、矩、傅立叶描述符);

4)掌握区域特征的特征表达、测量及描述方法(空间占有数组、四叉树、骨架、拓扑描述符、形状描述符、纹理描述符、不变矩);

5)掌握基于灰度共生矩阵、基于模型的纹理分析技术;

6)掌握特征提取和特征选择,掌握分类器的设计和训练,了解一些常用的统计分类方法(最大似然估计、Bayes估计、先验概率方法等)。

2.重点、难点

重点:边界特征及区域特征的表达、测量和描述方法。

难点:边界特征及区域特征的表达、测量和描述方法。

3.作业及课外学习要求:用MATLAB对图像区域分割后提取特征。

(五)物体识别  ( 6学时)

讲授统计模式识别、神经元网络、句法模式识别、作为图匹配的识别、模式识别中的Boosting方法。

1.基本要求:

1)掌握知识的表示;

2)掌握统计模式识别分类原理;

3)掌握支持向量机、聚类分析;

4)了解神经网络,以及模式识别中的Boosting方法;

5)了解句法模式识别原理、作为图匹配的识别原理。

2.重点、难点

重点:统计模式识别分类原理。

难点:神经网络。

(六)图像理解( 4学时)

讲授图像理解的控制策略、图像的语义分割和理解、隐马尔可夫模型。

1.基本要求:

1)掌握隐马尔可夫模型的基本原理;

2)理解图像的语义分割和理解。

2.重点、难点

重点:图像的语义分割和理解、隐马尔可夫模型。

难点:图像的语义分割和理解、隐马尔可夫模型。

3.作业及课外学习要求:基于OpenCV 实现基于隐马尔可夫模型的人脸识别。

(七)运动分析( 4学时)

讲授视频跟踪、光流法、卡尔曼滤波算法。

1.基本要求:

1)掌握光流法;

2)掌握卡尔曼滤波算法。

2.重点、难点

重点:光流法、卡尔曼滤波算法。

难点:卡尔曼滤波算法。

3.作业及课外学习要求:实现基于光流法和卡尔曼滤波的运动目标跟踪。

(八)图像检索( 6学时)

讲授基于颜色特征的图像检索方法、基于纹理特征的图像检索方法、基于形状特征的图像检索方法,相关反馈方法,图像语义分类和图像的自动语义标注,图像检索性能评价方法。

1.基本要求:

1)掌握基于内容的图像检索基本原理;

2)掌握基于颜色、形状和纹理特征的图像检索技术;

3)掌握相关反馈方法;

4)掌握图像检索性能评价方法;

5)掌握基本的图像语义分类和标注方法。

2.重点、难点

重点:基于颜色、形状和纹理特征的图像检索技术、图像语义分类和图像自动语义标注技术。

难点:相关反馈、图像语义分类。

3.作业及课外学习要求:在一个图像库中进行某幅图像的查找和检索。

(九)图像数据压缩( 2学时)

讲授预测压缩方法、矢量量化、分层和渐进的压缩方法、哈夫曼编码。

1.基本要求:

1)理解预测压缩方法、矢量量化、分层和渐进的压缩方法、哈夫曼编码。

2.重点、难点

重点:预测压缩方法、矢量量化、分层和渐进的压缩方法、哈夫曼编码。

难点:哈夫曼编码。

3.作业及课外学习要求:写一个使用三阶预测器的DPCM图像压缩程序。

(十)图像处理工具( 2学时)

讲授MATLABOpenCVPython

1.基本要求:

1)掌握MATLAB图像处理编程方法;

2)掌握OpenCV使用方法;

2)掌握Python编程方法。

2.重点、难点

重点:MATLABOpenCVPython

难点:OpenCVPython

3.作业及课外学习要求:练习使用MATLABOpenCVPython

三、教学安排及方式

总学时24+8学时,其中:讲授24学时,实验(或上机或综合练习或多种形式)8 学时。

序号

课程内容

学时

教学方式

1

(一)图像预处理

2

讲授+实验

2

(二)图像及其数学与物理背景

2

讲授+实验

3

(三)图像分割

4

讲授+实验

4

(四)图像特征的提取与表达

2

讲授+实验

5

(五)物体识别

4

讲授+实验

6

(六)图像理解

4

讲授+实验

7

(七)运动分析

4

讲授+实验

8

(八)图像检索

6

讲授+实验

9

(九)图像数据压缩

2

讲授

10-

(十)图像处理工具

2

讲授

注:教学方式填写“讲授、实验或实践、上机、综合练习、多种形式”。

四、本课程对培养学生能力和素质的贡献点

指标点3-2:能够将专业讲授课程中的创新性思想及意识在设计过程中体现;

指标点3-3:能够在设计过程中考虑复杂工程问题的应用背景、系统特征、器件指标、设计流程等因素;

指标点3-1:能够掌握本专业涉及的工程设计概念、原则和方法,能够针对复杂工程问题制定合理的解决方案。

指标点5-4:能够对实验结果进行合理分析、解释,并反馈到工程设计和实践中。

指标点8-2:能够应用现代工程仿真工具进行工程设计。

五、考核及成绩评定方式

最终成绩由大作业(占50%)和专题研究报告(占50%)组合而成。

六、教材及参考书目

教材:

Milan SonkaVaclav HlavacRoger Boyle 著,兴军亮、艾海舟等译,图像处理、分析与机器视觉·第4版,北京:清华大学出版社,2016

参考书目:

  1. 1.  章毓晋著,基于内容的视觉信息检索,北京:科学出版社,2003

  2. 2. 徐飞著,Matlab应用图像处理,西安:西安电子科技大学,2003

 

(执笔人:孟繁杰    审核人:闫允一

201804 20

 

 

 

课程评价

教学资源
课程章节 | 文件类型   | 大小 | 备注
1.1 图像平滑
视频
.mp4
254.36MB
1.2 基于双边滤波器的图像增强算法
视频
.mp4
461.48MB
2.1 图像的几何变换
视频
.mp4
518.46MB
2.2 图像几何失真和校正
视频
.mp4
391.23MB
2.3 小波理论概述
视频
.mp4
532.88MB
2.4 从傅里叶变换到小波变换
视频
.mp4
537.41MB
2.5 小波变换基本原理
视频
.mp4
249.66MB
2.6 NSCT
视频
.mp4
204.64MB
3.1 最大类间方差阈值分割算法
视频
.mp4
284.89MB
3.2 图像边缘的微分原理
视频
.mp4
323.69MB
3.3 图像的边缘检测
视频
.mp4
254.36MB
3.4 图像阈值处理
视频
.mp4
445.78MB
3.5 图论
视频
.mp4
266.70MB
3.6 图搜索策略
视频
.mp4
296.52MB
3.7 DFS、BFS算法
视频
.mp4
313.42MB
4.1 低层特征的提取和表达
视频
.mp4
435.87MB
4.2 基于视觉注意机制的视觉信息通道
视频
.mp4
707.45MB
4.3 兴趣点检测
视频
.mp4
277.28MB
4.4 SIFT:尺度不变特征转换
视频
.mp4
321.05MB
4.5 颜色模型
视频
.mp4
286.80MB
4.6 多边形近似
视频
.mp4
260.16MB
4.7 基于3D-SIFT的目标识别算法
视频
.mp4
477.53MB
4.8 结合兴趣点和显著图的目标提取算法
视频
.mp4
377.37MB
5.1 空间非合作目标位姿测量系统
视频
.mp4
571.44MB
5.2 卷积神经网络在图像识别中的应用
视频
.mp4
316.57MB
5.3 K中心聚类算法
视频
.mp4
196.22MB
5.4 模糊表示与模糊计算
视频
.mp4
256.83MB
5.5 K近邻算法
视频
.mp4
261.84MB
5.6 聚类分析
视频
.mp4
205.55MB
5.7 支持向量机SVM
视频
.mp4
242.44MB
5.8 句法模式识别
视频
.mp4
139.26MB
5.9 模拟退火算法
视频
.mp4
269.91MB
5.10 Boosting算法
视频
.mp4
189.72MB
5.11 随机森林
视频
.mp4
259.28MB
6.1 辅助视觉导航技术
视频
.mp4
397.89MB
6.2 最大熵模型
视频
.mp4
380.66MB
6.3 隐马尔可夫模型
视频
.mp4
474.13MB
6.4 图像语义分割和理解
视频
.mp4
250.75MB
7.1 基于例子滤波的多目标跟踪算法
视频
.mp4
764.30MB
7.2 光流法
视频
.mp4
220.46MB
7.3 视频跟踪
视频
.mp4
402.20MB
7.4 基于差影的视频跟踪算法
视频
.mp4
303.07MB
7.5 卡尔曼滤波
视频
.mp4
462.79MB
8.1 WWW技术
视频
.mp4
399.49MB
8.2 网络爬虫
视频
.mp4
611.01MB
8.3 图像检索概述
视频
.mp4
381.93MB
8.4 图像检索评价准则
视频
.mp4
191.82MB
8.5 词袋模型
视频
.mp4
230.62MB
8.6 基于兴趣点环形直方图的图像检索算法
视频
.mp4
535.82MB
8.7 基于兴趣点凸包的图像检索算法
视频
.mp4
627.46MB
8.8 基于生态选择例子群优化反馈的图像检索算法
视频
.mp4
546.60MB
8.9 基于多示例学习的图像检索算法
视频
.mp4
613.61MB
8.10 语义传播算法
视频
.mp4
495.79MB
8.11 混合多示例学习算法
视频
.mp4
366.14MB
8.12 哈希编码
视频
.mp4
286.66MB
9.1 图像压缩编码
视频
.mp4
325.21MB
9.2 基于BP神经网络的图像压缩算法
视频
.mp4
359.77MB
10.1 OpenCV入门
视频
.mp4
288.00MB
10.2 Open CV简单应用
视频
.mp4
226.90MB
10.3 MATLAB遗传算法及其应用
视频
.mp4
367.42MB
10.4 Python常用的IDE工具
视频
.mp4
99.52MB
课程章节
提示框
提示框
确定要报名此课程吗?
确定取消

京ICP备10040544号-2

京公网安备 11010802021885号