下表是从A、B两家公司分别抽取部分员工的基本信息,分别建立两份SPSS数据文件,并录入数据。
表1 A公司员工数据
| 序号 | 性别 | 文化程度 | 在公司工作的时间 | 年龄 | 月工资 |
| A1 | 男 | 本科 | 5 | 30 | 2000 |
| A2 | 女 | 高中 | 4 | 25 | 1900 |
| A3 | 女 | 本科 | 5 | 28 | 2000 |
| A4 | 男 | 高中 | 1 | 25 | 1500 |
| A5 | 男 | 硕士 | 8 | 35 | 3000 |
| A6 | 男 | 高中 | 3 | 29 | 1850 |
| A7 | 男 | 本科 | 10 | 34 | 3200 |
| A8 | 女 | 本科 | 8 | 30 | 1950 |
| A9 | 女 | 高中 | 3 | 27 | 1600 |
| A10 | 女 | 硕士 | 15 | 38 | 4200 |
| A11 | 男 | 本科 | 8 | 35 | 3000 |
| A12 | 男 | 本科 | 5 | 32 | 2000 |
| A13 | 女 | 高中 | 2 | 25 | 1550 |
| A14 | 女 | 硕士 | 9 | 30 | 2100 |
| A15 | 女 | 本科 | 14 | 34 | 3500 |
| A16 | 女 | 高中 | 3 | 26 | 1600 |
| A17 | 男 | 硕士 | 10 | 36 | 4000 |
| A18 | 女 | 本科 | 9 | 34 | 3150 |
| A19 | 男 | 高中 | 6 | 28 | 1800 |
| A20 | 男 | 高中 | 2 | 28 | 1800 |
| A21 | 女 | 高中 | 3 | 28 | 1850 |
| A22 | 男 | 高中 | 10 | 30 | 1900 |
| A23 | 男 | 本科 | 20 | 50 | 3400 |
| A24 | 女 | 本科 | 15 | 38 | 3200 |
表2 B公司员工数据
| 序号 | 性别 | 文化程度 | 在公司工作的时间 | 年龄 | 月工资 |
| B1 | 男 | 本科 | 16 | 46 | 3300 |
| B2 | 男 | 本科 | 16 | 45 | 3300 |
| B3 | 男 | 硕士 | 25 | 48 | 4800 |
| B4 | 男 | 本科 | 10 | 34 | 4500 |
| B5 | 女 | 本科 | 5 | 29 | 2000 |
| B6 | 女 | 硕士 | 30 | 51 | 5000 |
| B7 | 男 | 本科 | 10 | 33 | 4500 |
| B8 | 女 | 本科 | 5 | 29 | 2100 |
| B9 | 女 | 高中 | 5 | 33 | 1500 |
| B10 | 女 | 本科 | 18 | 48 | 4700 |
| B11 | 男 | 硕士 | 5 | 27 | 3050 |
| B12 | 男 | 硕士 | 15 | 38 | 3200 |
| B13 | 男 | 本科 | 18 | 48 | 4700 |
| B14 | 男 | 本科 | 6 | 35 | 3100 |
| B15 | 女 | 硕士 | 1 | 25 | 1500 |
| B16 | 男 | 本科 | 6 | 35 | 3100 |
| B17 | 男 | 高中 | 4 | 24 | 2000 |
| B18 | 女 | 本科 | 3 | 25 | 2600 |
| B19 | 女 | 本科 | 7 | 31 | 3400 |
| B20 | 男 | 本科 | 3 | 25 | 2800 |
| B21 | 女 | 硕士 | 2 | 26 | 3200 |
(1)将两份数据文件进行合并,另存为新的数据文件。
(2)将月工资进行重新编码,2000以下(含2000)为1,2001-3000为2,3001-4000为 3,4000以上为4,重新编码的结果保存为“工资等级”。
(3)根据AB公司员工信息数据汇总表,制作出格式规范的工资等级分布表,要求包括频数和频率分布。
(4)利用SPSS计算AB公司员工的工龄、年龄和月工资的平均数、众数、中位数、标准差和四分位差。
(5)根据AB公司员工信息数据汇总表,利用SPSS绘制男性和女性月工资比较的复合条形图,和A公司员工与B公司员工文化程度比较的复合条形图。
(6)试计算A公司和B公司中,哪个公司员工的月工资差异更大?
(7)在95%置信度下分别估计A、B两个公司员工的平均月工资的置信区间。