Apriori Algorithm in Financial Scenario (3)-Hash Tree Apriori算法与金融应用——哈希树
上一节
下一节
主要知识点:
哈希树
在Apriori算法中,候选项集会被划分为不同的桶,哈希树就是用来存放这些桶的一种结构。在进行支持度计数时,不再需要将每个事务与所有的候选项集进行比对,而只需要将事务中的项集散列到相应的桶中,从而只需要对比它们与同一桶内的候选项集,进而减少了比对的次数。图1是格结构方式展示的候选项集,图2是采用哈希树桶状结构展示的候选项集。

2. 哈希树的构建过程
需要一个哈希函数,即怎么样去进行分枝存储操作,如字典顺序,p mod 3(表示的是用p除以3求余数的方式来确定应该沿着哪个分枝向下操作)等。
需要确定最大叶结点的个数,也就是说一旦超过最大叶结点个数,就需要对结点进行划分,保持方法的有效性。

