Apriori Algorithm in Financial Scenario (2)-Candidate Generation & Pruning Apriori算法与金融应用——候选生成与剪枝
上一节
下一节
主要知识点:
1.候选金融项集的产生方法
简单的暴力方法,该方法将所有的k-项集都看成可能的候选项集,然后使用候选剪枝除去不必要的候选项集。该方法过程较为简单,但会产生很多不必要的候选,不是一个有效的候选项集产生过程。
Fk-1乘以F1方法,该方法用不是(k-1)-项集子集的频繁项来扩展频繁(k-1)-项集,此处是指每一个k-频繁项集都是由频繁(k-1)-项集和F1项集产生的。相对于暴力方法而言,其产生的候选项集相对较少,但该方法会重复产生相同的候选项集。
Fk-1乘以Fk-1方法,也是Apriori算法中采用的方法,该算法中使用candidate-gen函数产生候选项集,将一对前k-2个项按照字典序都相同的频繁(k-1)-项集进行合并产生k-项集。
2.候选金融项集的剪枝过程
对于暴力方法,需要对每个候选k-项集检查k个大小为(k-1)的子集。
对于Fk-1乘以F1方法,由于产生过程保证了至少有一个(k-1)-项集是频繁的,因此需要检查(k-1)个大小为(k-1)的子集。
对于Fk-1乘以Fk-1方法,由于产生过程保证了至少有两个(k-1)-项集是频繁的,因此需要检查(k-2)个大小为(k-1)的子集。

