A B C 1 1 1 2 1 1 3 1 0 4 1 0 5 1 1 6 0 1 7 0 0 8 1 1 9 0 0 10 0 0 11 0 0 12 0 1
(a)计算这两个规则的支持度和置信度。
(b)为了使用传统的 Apriori算法找出这些规则,我们需要离散化连续属性A.假定我们使用等宽分箱方法离散化该数据,其中bin- width=2,3,4。对于每个bim-widh,上面两个规则是否能够被 Aprior算法发现?(注意,由于属性A可能具有较宽或较窄的区间,规则不一定与前而的规则完全同。)对于每个与前面规则对应的规则,计算其支持度和置信度。
(c)评述使用等宽分箱方法对上述数据集分类的有效性。是否有合适的箱宽度,以便很好地发现上面两个规则?如果没有,可以使用何种其他方法,以确保能够同时发现以上两个规则?数据洞察实训工作空间--提供数据分析、市场调查、数字人项目、数据爬取等大学生实习实训项目,连接校园与职场的数字化人才认证学习平台"> A B C 1 1 1 2 1 1 3 1 0 4 1 0 5 1 1 6 0 1 7 0 0 8 1 1 9 0 0 10 0 0 11 0 0 12 0 1
(a)计算这两个规则的支持度和置信度。
(b)为了使用传统的 Apriori算法找出这些规则,我们需要离散化连续属性A.假定我们使用等宽分箱方法离散化该数据,其中bin- width=2,3,4。对于每个bim-widh,上面两个规则是否能够被 Aprior算法发现?(注意,由于属性A可能具有较宽或较窄的区间,规则不一定与前而的规则完全同。)对于每个与前面规则对应的规则,计算其支持度和置信度。
(c)评述使用等宽分箱方法对上述数据集分类的有效性。是否有合适的箱宽度,以便很好地发现上面两个规则?如果没有,可以使用何种其他方法,以确保能够同时发现以上两个规则?数字化人才认证学习中心提供BDA数据分析师初/中/高级认证课程、会员自习、题库实训等服务,助力数据分析能力提升。">
分享封面
更多功能已迁移至学员中心小程序,请微信扫码查询
1970年01月01日

学员中心
考试时间
联系我们
中国信息协会市场研究业分会 中经数(北京)数据应用技术研究院
北京市东城区东四十条21号
监督电话
010-64642001
@ Copyright BDA WebSite. Collect From 大数据分析师官网 京ICP备2021005223号-1