(a)挖据带产品分类的关联规则的主要挑战是什么?
(b)考虑下面的方法:每个事务t用扩展的事务r替换,t’包含t中所有商品和它们的祖先。
例如,事务t=(薄片食物,饼干)用t’={薄片食物,饼干,点心,食品}替换。使用该方法导出所有支持度大于或等于70%的频繁项集(长度不超过4)。
(c)考虑另一种方法,其中频繁项集逐层产生。开始,产生分层结构顶层的所有频繁项集。然后,使用较高层发现的频繁项集,产牛涉及较低层中项的候选项集。例如,仅当{点心,碳酸饮料}频繁时,才产生候选项集{薄片食物,节食碳酸饮料}。使用该方法导出所有支持度大于或等于70%的频繁项集(长度不超过4)
(d)比较(b)和(c)找出的频繁项集。评述算法的有效性和完全性。
数据洞察实训工作空间--提供数据分析、市场调查、数字人项目、数据爬取等大学生实习实训项目,连接校园与职场的数字化人才认证学习平台">
| 事务ID |
购买的商品 |
| 1 |
薄片食物,饼十,通碳酸饮料,火腿 |
| 2 |
薄片食物,火腿,鸡肉,节食酸饮料 |
| 3 |
火腿,熏肉,整鸡,普通碳酸饮料 |
| 4 |
薄片食物,火腿,鸡肉,节食碳酸饮料 |
| 5 |
薄片食物,萬肉,鸡肉 |
| 6 |
薄片食物,火掘,票肉,整鸡,普道碳酸饮料 |
| 7 |
蹲片食物,饼干,鸡肉,节食碳酸饮料 |
(a)挖据带产品分类的关联规则的主要挑战是什么?
(b)考虑下面的方法:每个事务t用扩展的事务r替换,t’包含t中所有商品和它们的祖先。
例如,事务t=(薄片食物,饼干)用t’={薄片食物,饼干,点心,食品}替换。使用该方法导出所有支持度大于或等于70%的频繁项集(长度不超过4)。
(c)考虑另一种方法,其中频繁项集逐层产生。开始,产生分层结构顶层的所有频繁项集。然后,使用较高层发现的频繁项集,产牛涉及较低层中项的候选项集。例如,仅当{点心,碳酸饮料}频繁时,才产生候选项集{薄片食物,节食碳酸饮料}。使用该方法导出所有支持度大于或等于70%的频繁项集(长度不超过4)
(d)比较(b)和(c)找出的频繁项集。评述算法的有效性和完全性。
数字化人才认证学习中心提供BDA数据分析师初/中/高级认证课程、会员自习、题库实训等服务,助力数据分析能力提升。">
更多功能已迁移至学员中心小程序,请微信扫码查询
1970年01月01日

学员中心
联系我们
中国信息协会市场研究业分会
中经数(北京)数据应用技术研究院
监督电话