目录

  • 1 第一章 大数据及其应用
    • 1.1 课程介绍及考核要求
    • 1.2 课程PPT
    • 1.3 应实践拓展
    • 1.4 章节测试
    • 1.5 weka软件下载
  • 2 第二章 分类算法
    • 2.1 课程PPT
    • 2.2 应实践拓展
    • 2.3 Weka数据预测
    • 2.4 章节测试
  • 3 第三章 聚类算法
    • 3.1 课程PPT
    • 3.2 应实践拓展
    • 3.3 章节测试
  • 4 第四章 网络分析
    • 4.1 课程PPT
    • 4.2 应实践拓展
    • 4.3 章节测试
  • 5 第五章 购物篮算法
    • 5.1 课程PPT
    • 5.2 应实践拓展
    • 5.3 章节测试
  • 6 第六章 神经网络
    • 6.1 课程PPT
    • 6.2 应实践拓展
    • 6.3 章节测试
  • 7 第七章 如何领导数据分析团队
    • 7.1 课程PPT
    • 7.2 应实践拓展
    • 7.3 章节测试
  • 8 期末考核及安排
    • 8.1 期末考核安排
    • 8.2 Weka软件自带数据集
    • 8.3 UCL数据集
    • 8.4 其它数据集
Weka数据预测
weka对数据进行预测

1、注意待预测数据集和训练用数据集各个属性的设置必须是一致的。即使你没有待预测数据集的Class属性的值,你也要添加这个属性,可以将该属性在各实例上的值均设成缺失值。比如你可以将欲预测的类别设为?即缺失值。

2、在“Test Opion”中选择“Supplied test set”,并且“Set”成你要应用模型的数据集。

3、右键点击“Result list”中刚产生的那一项,选择“Re-evaluate model on current test set”。右边显示结果的区域中会增加一些内容,告诉你该模型应用在这个数据集上表现将如何。如果你的Class属性都是些缺失值,那这些内容是无意义的,我们关注的是模型在新数据集上的预测值。
4、点击右键菜单中的“Visualize classifier errors”,将弹出一个新窗口显示一些有关预测误差的散点图。点击这个新窗口中的“Save”按钮,保存一个Arff文件。打开这个文件可以看到在倒数第二个位置多了一个属性(predictedpep),这个属性上的值就是模型对每个实例的预测值。