关联分析算法习题
上一节
下一节
第5章 关联分析算法习题
1.设某事务项集如表5.4所示,填空完成其中支持度和置信度的计算。
2.对于表5.5所示的事务集合,设最小支持度计数为3,采用Apriori算法求出所有的频繁项集。
以下两题作为思考,可不提交,原理相同
3.有一个事务集合如表5.6所示,设最小支持度计数为2和3,采用Apriori算法求出两种最小支持度下所有的频繁项集。
4.有一个事务集合如表5.7所示,设最小支持度计数为4,采用Apriori算法求出所有的频繁项集。
5.某个食品连锁店每周的事务记录如表5.8所示,每个事务表示在一项收款机业务中卖出的商品项集,
假定min_sup=40%,min_conf=40%,使用Apriori算法生成的强关联规则。
6.假定有一个购物篮数据集,包含100个事务和20个项。如果项a的支持度为25%,项b的支持度为90%,且项集{a,b}的支持度为20%。
令最小支持度阈值和最小置信度阈值分别为10%和60% 。
计算关联a →b的置信度。
7.一个事务数据库D有4笔交易,如表5.9所示。设min_sup=60%,min_conf=80%。使用Apriori算法找出频繁项集和所有三个项的强关联规则。

