-
1 文档
-
2 视频
-
3 PPT
-
4 小测试
对于数据分析与统计函数,Matlab主要在统计工具箱(Statisticstoolbox)中提供了分析函数。数据分析常用基本函数如表4-2所示。
表4-2 数据分析常用基本函数
| 函数名称 | 功能 | 函数名称 | 功能 |
| corrcoef | 相关系数 | mode | 使用频率最高的值 |
| cov | 协方差矩阵 | std | 标准差 |
| max | 最大元素 | var | 方差 |
| cummax | 列元素的累加和 | range | 极差 |
| mean | 平均值 | iqr | 四分位差 |
| median | 中间值 | moment | 中心矩 |
| min | 最小元素 | skewness | 偏度 |
| cummin | 累积最小元素 | kurtosis | 峰度 |
说明:
1. 向量的标准差定义

2. 偏度(skewness)是描述某变量取值分布对称性的统计量。正态分布的偏度为0。
3. 峰度(kurtosis)是描述某变量所有取值分布形态陡缓程度的统计量。峰度小于3时表示总体分布密度比有相同方差的正态分布的密度更平坦或者有更粗的腰部。
下面通过实例介绍Matlab中常用的数据基本分析函数。

>> a=[7 2 5 6 8 9]; b=[5 1 1 2 8 3];
>> x=[4 1 7 6 9;3 4 7 1 3;7 4 2 1 5;7 6 6 4 2];
>> y=max(a) %最大值函数
y =
9
>> [xm,index]=max(x) %返回矩阵x各列的最大值及其对应下标
xm =
7 6 7 6 9
index =
3 4 1 1 1
>> y=max(x,[],2) %指定维中最大值,即求x各行最大值
y =
9
7
7
7
>> mean(x) %求矩阵x各列的平均值
ans =
5.2500 3.7500 5.5000 3.0000 4.7500
>> median(x,2)' % 参数2表示求矩阵x各行的中间值
ans =
6 3 4 6
>> sum(x) %求和
ans =
21 15 22 12 19
>> x=randn(1,100);
>> s1=std(x) %同s1=std(x,0);按(4-5)标准差公式计算
s1 =
0.9769
>> s2=std(x,1) %按(4-6)标准差公式计算
s2 =
0.9720
>> var(x) %等于std(x)* std(x)
ans =
0.9544
>> var(x,1) %等于std(x,1)* std(x,1)
ans =
0.9448
[例4-16] 某厂生产的某种型号的细轴20个,测得其直径数据如下:13.26、13.63、13.13、13.47、13.40、13.56、13.35、13.56、13.38、13.20、13.48、13.58、13.57、13.37、13.48、13.46、13.51、13.29、13.42、13.69,对以上数据:(1)求样本均值,中位数,0.25分位数;(2)求样本方差,样本标准差,极差,偏度,峰度;(3)求二阶、三阶和四阶中心矩。
>> %已输入数据赋给变量a
>> [mean(a),median(a),prctile(a,25)] %求样本均值,中位数,0.25分位数
ans =
13.4395 13.4650 13.3600
>> [var(a),std(a)] %求样本方差,样本标准差
ans =
0.0211 0.1452
>> [range(a),skewness(a),kurtosis(a)] %求极差,偏度,峰度
ans =
0.5600 -0.3916 2.5553
>> [moment(a,2),moment(a,3),moment(a,4)] %求二阶、三阶和四阶中心矩
ans =
0.0200 -0.0011 0.0010
>> (a-mean(a))/std(a) %数据标准化,即每个数据减去均值,再除以标准差
ans =
Columns 1 through 7
-1.2364 1.3121 -2.1318 0.2101 -0.2721 0.8300 -0.6165
Columns 8 through 14
0.8300 -0.4098 -1.6496 0.2790 0.9677 0.8989 -0.4787
Columns 15 through 20
0.2790 0.1412 0.4856 -1.0297 -0.1343 1.7254
偏度为-0.3916,负偏度表明总体分布密度有较长的右尾,即分布向左偏斜。峰度为2.5553。峰度小于3时表示总体分布密度比有相同方差的正态分布的密度更平坦或者有更粗的腰部。
[例4-17] 求协方差与相关系数。
>> x=[4 1 7 6 9;3 4 7 1 3;7 4 2 1 5;7 6 6 4 2];
>> y=cov(x) %y对角线元素是矩阵x每列的方差
y =
4.2500 2.4167 -3.5000 -0.3333 -1.9167
2.4167 4.2500 -1.1667 -2.3333 -6.0833
-3.5000 -1.1667 5.6667 3.0000 0.5000
-0.3333 -2.3333 3.0000 6.0000 4.3333
-1.9167 -6.0833 0.5000 4.3333 9.5833
>> m=x(:,1); %取第1列
>> var(m) %其方差等于协方差结果阵第1行第1列元素
ans =
4.2500
>> n=x(:,2);cov(m,n) %取第2列,并求第1列与第2列的协方差
ans =
4.2500 2.4167
2.4167 4.2500
>> corrcoef(n,m) %求相关系统函数corrcoef
ans =
1.0000 0.5686
0.5686 1.0000

