课程介绍 教师团队 课程章节

计算机视觉目标检测技术及应用

主讲:徐慧英 教师团队:4

  • 学校 浙江师范大学
  • 学分 2
  • 开课院系 计算机科学与技术学院
  • 课时 32
  • 专业大类 计算机科学与技术
  • 课程视频总时长(分钟) 481
  • 开课专业 智能科学与技术
  • 课程编号

课程介绍

1. 课程简介
本课程系统讲解计算机视觉核心任务——目标检测的理论、技术与前沿进展。课程将从经典两阶段与单阶段检测器(如Faster R-CNN、YOLO系列)的基石原理出发,深入剖析当前研究热点,包括实时高精度检测、小目标检测、多模态融合、Transformer与Mamba等新架构的应用,以及视频目标追踪等高级任务。通过理论与实践相结合,培养学员解决工业级视觉检测问题的综合能力。


2. 课程目标
完成本课程后,学员将能够:
深入理解 目标检测的基本范式、关键技术(如锚框、NMS、特征金字塔)及其演变脉络。
掌握原理 主流及前沿检测模型(如YOLOv5/v10, Swin Transformer, DETR)的核心架构与设计思想。
具备能力 针对特定应用场景(如航拍图像、遥感影像、视频流)选择合适的模型并进行优化、部署。
跟踪前沿 洞察目标检测领域的最新研究趋势,并具备阅读相关学术论文的能力。

3. 课程特色

脉络清晰:梳理从YOLOv1到YOLOv10的技术演进史,揭示性能提升背后的核心驱动力。
前沿深度:不局限于经典模型,深度解读如SwinFIR、MambaVision、ODTrack 等前沿工作,涵盖超分辅助检测、状态空间模型、在线跟踪等交叉方向。
问题导向:聚焦实际应用中的核心挑战,设有“小目标检测”、“模型轻量化”、“多模态融合”等专题模块,讲解如ESOD、SuperYOLO、RemDet、Mamba-YOLO、Equivariant Fusion 等针对性解决方案。
实践赋能:结合主流的MMDetection 工具箱和YOLOv5 框架,通过“口罩检测”等实战案例,完成从数据准备、模型训练、调优到可视化分析的全流程实践。

4. 课程大纲

模块一:基础与范式:目标检测任务定义、评价指标、两阶段与单阶段检测器经典模型剖析。

模块二:YOLO王朝演进:从YOLOv1到YOLOv10的架构革新与设计哲学深度解读。

模块三:工业实战:基于YOLOv5和MMDetection的完整项目实战(数据、训练、调试、部署)。

模块四:前沿专题:
实时与轻量化检测(如PKINet、FBRT-YOLO)

小目标与高分辨率检测(如ESOD、Towards Precise Supervision)

多模态与上下文感知检测(如SuperYOLO、Context Modulated)

Transformer与新兴架构(如Swin Transformer、MambaVision)

视频目标追踪(如MCITrack、ODTrack)

5. 面向群体
计算机视觉领域的研究生、高年级本科生。
希望系统提升目标检测技术深度和广度的算法工程师、研发人员。
对人工智能和计算机视觉有浓厚兴趣,具备一定深度学习基础的技术爱好者。
查看更多

教师团队

徐慧英

浙江师范大学 | 计算机科学与技术学院 | 副教授

副教授,计算机科学与技术专业、电子信息专业硕士生导师,主要从事深度学习、机器视觉中的目标检测、跟踪及其应用研究、图像分割、生成对抗网络、扩散模型、VAR图像生成算法及应用研究、医学影像AI等算法及其应用研究。作为主要完成人获得国家科技进步二等奖及浙江省科学技术一等奖、教育部科技进步(推广类)二等奖等3项国家级、省部级科技成果奖励。她申请和授权发明专利40余项(其中,授权PCT国际专利20余项),发表IEEE Trans及CCF A类论文10余篇,其中以通讯作者/第一作者在CCF A类人工智能领域国际顶级学术会议上发表论文10余篇。曾以第一指导老师指导学生获得2023年度第十八届“挑战杯”全国大学生课外学术科技作品竞赛“揭榜挂帅”专项赛·华为疲劳驾驶智能识别竞赛特等奖,这是学校历史上第三个特等奖、“揭榜挂帅”专项赛项目第一个特等奖及浙江省“挑战杯”及“互联网+”大学生创新创业大赛二等奖、中国互联网+国赛银奖、大学生服务外包竞赛全国一等奖、睿抗机器人大赛夺宝奇兵全国一等奖等。指导本科生承担完成4项浙江省“新苗人才计划”项目,3项国家级大学生创新创新计划项目等。

查看更多

朱信忠

浙江师范大学 | 计算机科学与技术学院 | 教授

浙江省特级专家,国家级高层次人才,浙江师范大学杭州人工智能研究院院长,浙江省高校高水平重点资助创新团队“人工智能与智能制造交叉融合创新团队”负责人及团队带头人,工信部2021年度人工智能产业创新任务“智能机器人”揭榜挂帅项目负责人。团队聚焦人工智能、大模型、无人机、移动机器人、具身智能及智能制造等AI+新质生产力,主要研究方向:计算机视觉、ROS机器人、激光视觉SLAM、目标检测、分割、识别与跟踪、Mamba变体创新应用等视觉认知计算和多模态人机交互产品研发,运筹优化与机器学习在智能仓储和柔性制造中的应用、大模型微调训练推理与垂类应用场景融合创新,AIGC图像/视频生成与编辑(包括扩散模型在2D/3D应用)、开放世界目标检测与分割(覆盖医学影像、遥感与SAR图像等场景)、视觉感知、多模态推理与强化学习以及多模态定位与检索(包括行人重识别、图文语音跨模态检索)等前沿领域,赋能各行业创新应用等,帮助企业进行完整AI落地全流程开发指导,包括模型训练、推理优化、嵌入部署及指导,已形成“数据采集-数据清洗-数据标注-模型开发-实际场景应用”的研究模式,在大数据人工智能分析和应用自动创建关键技术领域有技术突破。作为第一完成人获国家科技进步二等奖及浙江省科学技术一等奖、教育部科技进步(推广类)二等奖、中国产学研合作创新奖等5项国家级、省部级科技成果奖励。在IEEE T-PAMI等IEEE Trans人工智能领域顶刊及NeurIPS、CVPR、 ICML、IJCAI、AAAI、ACM MM等CCF A类顶会发表论文50余篇。

查看更多

陈震东

浙江师范大学 | 计算机科学与技术学院 | 讲师

工学博士,毕业于北京理工大学计算机科学与技术专业,目前为浙江师范大学计算机学院讲师。主要研究方向为多模态,大语言模型以及医学图像处理。在WWW、AAAI、Neural Networks和Neurocomputing等国内外高水平期刊与会议上发表高水平论文10余篇。参与一项科技部重大专项,三项国家自然科学基金面上项目。

查看更多

何雪东

浙江师范大学 | 计算机科学与技术学院 | 讲师

工学博士,硕士生导师,毕业于中山大学计算机科学与技术专业,目前为浙江师范大学计算机学院讲师。主要研究方向视频图像处理,多模态融合,目标检测与跟踪,以第一作者发表CCF-A和中科院一区TOP论文6篇,以第一发明人授权发明专利3项,主持浙江省自然科学基金青年项目和金华市科技项目各一项,参与国自然面上项目两项。

查看更多
举报
下载资源

京ICP备10040544号-2

京公网安备 11010802021885号