Association Analysis in Financial Scenario-basic concept and idea 关联分析与金融应用——基本概念与思想
上一节
下一节
主要知识点:
1.金融关联分析
在金融商业领域,存在大量的事务数据需要进行关联分析,例如经典的啤酒尿布案例。那么关联分析就是用于隐藏在大型数据中的有意义的联系,这种联系可以用频繁项集或者关联规则来进行表示。
2.关联分析的基本术语
项集,包含零个或多个项的集合称之为项集。
支持度计数,即包含某个特定项集的事务个数。
支持度,表示为支持度计数除以总的事务数。
频繁项集,即满足最小支持度阈值的项集。
关联规则,即形如下式的规则,其中X和Y是不相交的项集,即项集X和项集Y的交集为空集。

3.金融关联规则挖掘的任务
对于给定的金融事务数据T,需要找到满足以下两个条件的金融关联规则:1)支持度大于等于最小支持度阈值;2)置信度大于等于最小置信度阈值。
提高金融关联规则挖掘算法性能的关键步骤是拆分支持度和置信度要求。
关联分析的算法通常将关联规则挖掘任务分解为两阶段任务:第一个阶段,产生频繁项集,即发现满足支持度最小阈值的所有项集;第二个阶段,产生关联规则,即从上述频繁项集中产生高置信度的规则。

