Introduction to Rule-based Classifier in Financial Scenario 基于规则的分类器与金融应用——算法介绍
上一节
下一节
主要知识点:
什么是基于规则的分类器
基于规则的分类器是使用一组“if...then...”规则集来对数据对象进行分类的方法。每一个分类规则都可以表示为下图的形式,其中,规则的右边称为规则后件,是分类中的类别标签y,规则的左边称为规则前件或者条件,是属性测试条件的合取项,合取项表示为Ai op(operation) vi,其中,(Ai,vi)是一对属性值,op是比较运算符,如=,>,< 等等。

实际金融场景下基于规则的分类器的结构
如下图所示,金融场景设定为借贷风险的预警问题,有一个数据集表1(traning set)和一个基于规则的分类器表2,该分类器就是通过相应的学习算法从左边的训练集中产生的。从训练集中可以看出,共有五个属性(ID,Gender,Marital Status,Income和Mortgage),还有一个是标签,即class风险高低。基于规则的分类器是用一组规则集来表示的,该规则集包含R1,R2,R3三条规则,每条规则的左边都拥有各自的属性测试条件的合取项,规则右边都有对应的类别标签。

规则集的性质
互斥,即规则集不存在两条规则被同一数据对象触发。
穷举,即对于属性值的任一组合,规则集中都存在一条规则能够覆盖。
规则质量的评价
规则覆盖率,表示为数据集中触发规则的记录所占的比例。
规则准确率,表示为触发规则的数据对象中类标签等于规则后件所占的比例。

