事务ID 购买的商品 1 薄片食物,饼十,通碳酸饮料,火腿 2 薄片食物,火腿,鸡肉,节食酸饮料 3 火腿,熏肉,整鸡,普通碳酸饮料 4 薄片食物,火腿,鸡肉,节食碳酸饮料 5 薄片食物,萬肉,鸡肉 6 薄片食物,火掘,票肉,整鸡,普道碳酸饮料 7 蹲片食物,饼干,鸡肉,节食碳酸饮料
(a)挖据带产品分类的关联规则的主要挑战是什么?
(b)考虑下面的方法:每个事务t用扩展的事务r替换,t’包含t中所有商品和它们的祖先。
例如,事务t=(薄片食物,饼干)用t’={薄片食物,饼干,点心,食品}替换。使用该方法导出所有支持度大于或等于70%的频繁项集(长度不超过4)。
(c)考虑另一种方法,其中频繁项集逐层产生。开始,产生分层结构顶层的所有频繁项集。然后,使用较高层发现的频繁项集,产牛涉及较低层中项的候选项集。例如,仅当{点心,碳酸饮料}频繁时,才产生候选项集{薄片食物,节食碳酸饮料}。使用该方法导出所有支持度大于或等于70%的频繁项集(长度不超过4)
(d)比较(b)和(c)找出的频繁项集。评述算法的有效性和完全性。 数据洞察实训工作空间--提供数据分析、市场调查、数字人项目、数据爬取等大学生实习实训项目,连接校园与职场的数字化人才认证学习平台"> 事务ID 购买的商品 1 薄片食物,饼十,通碳酸饮料,火腿 2 薄片食物,火腿,鸡肉,节食酸饮料 3 火腿,熏肉,整鸡,普通碳酸饮料 4 薄片食物,火腿,鸡肉,节食碳酸饮料 5 薄片食物,萬肉,鸡肉 6 薄片食物,火掘,票肉,整鸡,普道碳酸饮料 7 蹲片食物,饼干,鸡肉,节食碳酸饮料
(a)挖据带产品分类的关联规则的主要挑战是什么?
(b)考虑下面的方法:每个事务t用扩展的事务r替换,t’包含t中所有商品和它们的祖先。
例如,事务t=(薄片食物,饼干)用t’={薄片食物,饼干,点心,食品}替换。使用该方法导出所有支持度大于或等于70%的频繁项集(长度不超过4)。
(c)考虑另一种方法,其中频繁项集逐层产生。开始,产生分层结构顶层的所有频繁项集。然后,使用较高层发现的频繁项集,产牛涉及较低层中项的候选项集。例如,仅当{点心,碳酸饮料}频繁时,才产生候选项集{薄片食物,节食碳酸饮料}。使用该方法导出所有支持度大于或等于70%的频繁项集(长度不超过4)
(d)比较(b)和(c)找出的频繁项集。评述算法的有效性和完全性。 数字化人才认证学习中心提供BDA数据分析师初/中/高级认证课程、会员自习、题库实训等服务,助力数据分析能力提升。">
分享封面
更多功能已迁移至学员中心小程序,请微信扫码查询
1970年01月01日

学员中心
考试时间
联系我们
中国信息协会市场研究业分会 中经数(北京)数据应用技术研究院
北京市东城区东四十条21号
监督电话
010-64642001
@ Copyright BDA WebSite. Collect From 大数据分析师官网 京ICP备2021005223号-1