个人介绍
智能语音技术与应用 江苏高等继续教育智慧教育平台

主讲教师:贾克辉

教师团队:共4

  • 贾克辉
  • 成珏飞
  • 罗伟
  • 卜峰
本课程分为7个项目,包括19个任务单元。绪论部分介绍了智能语音基础、产业技术、产业应用、产业人才现状;项目一介绍了语音信号的采集与转换,包括语音信号的采集、音频文件读取与波形绘制、音频参数的转换任务;项目二介绍了语音信号的时域特征,包括语音信号的分帧、语音信号的时域特征提取、语音信号的端点检测、语音信号的基音周期估计任务;项目三介绍了语音信号的频域特征,包括语音信号频谱图的绘制、语音信号语谱图的绘制、语音信号 MFCC 特征的提取任务;项目四介绍了语音识别,包括个性化定义语音操控命令和离线简单语音识别任务;项目五介绍了自然语言处理,包括中文自然语言处理、英文自然语言处理、中文文本可视化分析任务;项目六介绍了语音合成,包括中文文字转语音处理、离线语音合成任务;项目七介绍了语音标注,包括用Praat工具标注对话语音、平台语音标注任务;项目案例以主流开源库为基础,采用 Python语言编程实现。
学校: 江苏高等继续教育智慧教育平台
开课院系: 苏州市职业大学电子信息工程学院
专业大类: 电子信息类
开课专业: 智能产品开发与应用、人工智能技术应用
课程负责人: 贾克辉
课程编号: ZJ0065631
学分: 3
课时: 48
                                                                                                                                                                            
 

序号

 
 

课程单元

 
 

主要教学知识点

 
 

学习目标及能力要求

 
 

育人元素

 
 

融入途径、方式

 
 

参考学时

 
 

01

 
 

智能语音概述

 
 

什么是智能语音

 
 

1.了解智能语音的基本概念;

 

2.掌握智能语音技术的流程;

 

3.了解智能语音产业、技术和人才现状;

 
 

职业理想、科技自信

 
 

国内人工智能的发展与领军企业的介绍

 
 

2

 
 

智能语音技术流程

 
 

智能语音产业现状

 
 

02

 
 

语音信号的采集与转换

 
 

声音基础

 
 

1.了解语音信号的一些重要特征、产生机理和数学模型;

 

2.掌握语音信号的采集;

 

3.掌握音频文件读取与波形绘制方法;

 

4.掌握音频参数的转换方法;

 
 

科学严谨

 
 

案例引入

 
 

6

 
 

声音的拾取装置

 
 

语音信号的数字化过程

 
 

03

 
 

语音信号的时域特征

 
 

时域特征的介绍

 
 

1.理解语音信号时域分析的作用;

 

2.理解各种时域特征的计算提取过程和实际意义;

 

3.掌握分帧与加窗的方法;

 

4.掌握语音的端点检测方法;

 

5.掌握语音信号的基音周期估计方法;

 
 

科学严谨

 
 

案例引入

 
 

8

 
 

分帧与加窗

 
 

常用的时域特征表示

 
 

语音的端点检测

 
 

语音的基音周期估计

 
 

04

 
 

语音信号的频域特征

 
 

频域特征的介绍

 

 

 

 

 
 

1.理解语音信号频域分析的基本概念和特征种类;

 

2.掌握语音信号频谱、语谱、倒谱所表征的含义;

 

3.掌握语音信号频谱、语谱图的绘制;

 

4.掌握提取语音信号MFCC特征的方法;

 
 

科学严谨

 
 

案例引入

 
 

8

 
 

频谱图与语谱图

 

 

 
 

Mel频率倒谱系数(MFCC)

 
 

05

 
 

语音识别

 
 

语音识别概述

 
 

1.了解语音识别的应用以及主要技术方法及流程;

 

2.了解语音识别的评价方法;

 

3.掌握个性化定义语音操控命令;

 

4.掌握离线简单语音识别;

 

 

 
 

艰苦奋斗、科技兴国

 
 

案例引入

 
 

6

 
 

语音识别的应用与场景

 
 

语音识别的基本流程

 
 

语音识别的效果评价

 
 

06

 
 

自然语言处理

 
 

自然语言处理简介

 
 

1.了解自然语言处理技术及应用场景;

 

2.掌握中文自然语言处理基本方法;

 

3.掌握英文自然语言处理基本方法;

 

4.掌握中文文本可视化分析方法;

 
 

科技创新

 
 

案例引入

 
 

6

 
 

自然语言处理的应用与场景

 
 

自然语言处理技术

 
 

中英文自然语言处理技术的差异

 
 

07

 
 

语音合成

 
 

语音合成简介

 
 

1.了解语音合成技术及应用场景;

 

2.了解语音合成基本方法;

 

3.掌握中文文字转语音处理方法;

 

4.掌握离线语音合成方法;

 
 

科学严谨

 
 

案例引入

 
 

6

 
 

语音合成的应用与场景

 
 

语音合成技术

 
 

语音合成技术的效果评价

 
 

08

 
 

语音标注

 
 

为什么需要语音标注

 
 

1.了解语音标注的意义;

 

2.了解语音标注的种类及标注通用规则;

 

3.掌握Praat工具标注对话语音的方法;

 

4.理解平台语音标注方法;

 
 

科学严谨

 
 

案例引入

 
 

6

 
 

语音标注的种类

 
 

语音标注的规则

 
 

语音数据标注工具与平台

 
 

编程实现调用语音识别、对话管理、语音合成实现人机对话系统。

 
 

掌握通过编程(Python/Java)调用AI平台(百度/科大讯飞)中多种语音处理功能,实现完整的人机对话系统。

 
 

合计学时:

 
 

48

 

贾克辉

职称:讲师

单位:苏州市职业大学

成珏飞

职称:副教授

单位:苏州市职业大学

部门:电子信息工程学院

罗伟

职称:副教授

单位:苏州市职业大学

部门:电子信息工程学院

卜峰

职称:讲师

单位:苏州市职业大学

部门:电子信息工程学院

提示框
取消 进入课程
提示框
确定要报名此课程吗?
确定取消

京ICP备10040544号-2

京公网安备 11010802021885号