(a)计算这两个规则的支持度和置信度。
(b)为了使用传统的 Apriori算法找出这些规则,我们需要离散化连续属性A.假定我们使用等宽分箱方法离散化该数据,其中bin- width=2,3,4。对于每个bim-widh,上面两个规则是否能够被 Aprior算法发现?(注意,由于属性A可能具有较宽或较窄的区间,规则不一定与前而的规则完全同。)对于每个与前面规则对应的规则,计算其支持度和置信度。
(c)评述使用等宽分箱方法对上述数据集分类的有效性。是否有合适的箱宽度,以便很好地发现上面两个规则?如果没有,可以使用何种其他方法,以确保能够同时发现以上两个规则?数据洞察实训工作空间--提供数据分析、市场调查、数字人项目、数据爬取等大学生实习实训项目,连接校园与职场的数字化人才认证学习平台">
| A |
B |
C |
| 1 |
1 |
1 |
| 2 |
1 |
1 |
| 3 |
1 |
0 |
| 4 |
1 |
0 |
| 5 |
1 |
1 |
| 6 |
0 |
1 |
| 7 |
0 |
0 |
| 8 |
1 |
1 |
| 9 |
0 |
0 |
| 10 |
0 |
0 |
| 11 |
0 |
0 |
| 12 |
0 |
1 |
(a)计算这两个规则的支持度和置信度。
(b)为了使用传统的 Apriori算法找出这些规则,我们需要离散化连续属性A.假定我们使用等宽分箱方法离散化该数据,其中bin- width=2,3,4。对于每个bim-widh,上面两个规则是否能够被 Aprior算法发现?(注意,由于属性A可能具有较宽或较窄的区间,规则不一定与前而的规则完全同。)对于每个与前面规则对应的规则,计算其支持度和置信度。
(c)评述使用等宽分箱方法对上述数据集分类的有效性。是否有合适的箱宽度,以便很好地发现上面两个规则?如果没有,可以使用何种其他方法,以确保能够同时发现以上两个规则?数字化人才认证学习中心提供BDA数据分析师初/中/高级认证课程、会员自习、题库实训等服务,助力数据分析能力提升。">
更多功能已迁移至学员中心小程序,请微信扫码查询
1970年01月01日

学员中心
联系我们
中国信息协会市场研究业分会
中经数(北京)数据应用技术研究院
监督电话