考虑下表所示的事务,购物篮事务的例子的商品
事务ID
购买的商品
1
薄片食物,饼十,通碳酸饮料,火腿
2
薄片食物,火腿,鸡肉,节食酸饮料
3
火腿,熏肉,整鸡,普通碳酸饮料
4
薄片食物,火腿,鸡肉,节食碳酸饮料
5
薄片食物,萬肉,鸡肉
6
薄片食物,火掘,票肉,整鸡,普道碳酸饮料
7
蹲片食物,饼干,鸡肉,节食碳酸饮料
(a)挖据带产品分类的关联规则的主要挑战是什么?
(b)考虑下面的方法:每个事务t用扩展的事务r替换,t’包含t中所有商品和它们的祖先。
例如,事务t=(薄片食物,饼干)用t’={薄片食物,饼干,点心,食品}替换。使用该方法导出所有支持度大于或等于70%的频繁项集(长度不超过4)。
(c)考虑另一种方法,其中频繁项集逐层产生。开始,产生分层结构顶层的所有频繁项集。然后,使用较高层发现的频繁项集,产牛涉及较低层中项的候选项集。例如,仅当{点心,碳酸饮料}频繁时,才产生候选项集{薄片食物,节食碳酸饮料}。使用该方法导出所有支持度大于或等于70%的频繁项集(长度不超过4)
(d)比较(b)和(c)找出的频繁项集。评述算法的有效性和完全性。
2019-11-24