(a)画出表小表所示数据集的项集格。用下面的字母标记格中每个结点。
N:如果该项集被 Apriori算法认为不是铁选项集。一个项集不是候选项集有兩种可能的原因:它没有在候选项集产生步骤产生,或它在候选项集产生步骤产生,但是由于它的一个子集是非频繁的而在候选项集的枝步骤被丢掉
F:如果该候选项樂被 Apriori算法认为是频繁的。
I如果经过支持度计数后,该横选项集被发现是频繁的。
(b)频繁项集的百分比是多少?(考虑格中所有的集)
(c)对于该数据集, Apriori算法的明被率是多少?(剪枝率定义为由于如下原因不认为是侯选的项集所占的百分比;在侯选项集产生时未被产生,或在侯选剪枝步骤被丢掉)
(d)假警告率是多少?(假警告率是指经过支待度计算后被发现是非频繁的候选项集所占的自分比。)数据洞察实训工作空间--提供数据分析、市场调查、数字人项目、数据爬取等大学生实习实训项目,连接校园与职场的数字化人才认证学习平台">
| 顾客ID |
购买项 |
| 1 |
{a,d,e} |
| 1 |
{a,b,c,e} |
| 2 |
{a,b,d,e} |
| 2 |
{a,c,d,e} |
3 |
{b,c,e} |
3 |
{b,d,e} |
4 |
{c,d} |
4 |
{a,b,c} |
5 |
{a,d,e} |
5 |
{a,b,e} |
(a)画出表小表所示数据集的项集格。用下面的字母标记格中每个结点。
N:如果该项集被 Apriori算法认为不是铁选项集。一个项集不是候选项集有兩种可能的原因:它没有在候选项集产生步骤产生,或它在候选项集产生步骤产生,但是由于它的一个子集是非频繁的而在候选项集的枝步骤被丢掉
F:如果该候选项樂被 Apriori算法认为是频繁的。
I如果经过支持度计数后,该横选项集被发现是频繁的。
(b)频繁项集的百分比是多少?(考虑格中所有的集)
(c)对于该数据集, Apriori算法的明被率是多少?(剪枝率定义为由于如下原因不认为是侯选的项集所占的百分比;在侯选项集产生时未被产生,或在侯选剪枝步骤被丢掉)
(d)假警告率是多少?(假警告率是指经过支待度计算后被发现是非频繁的候选项集所占的自分比。)数字化人才认证学习中心提供BDA数据分析师初/中/高级认证课程、会员自习、题库实训等服务,助力数据分析能力提升。">
更多功能已迁移至学员中心小程序,请微信扫码查询
1970年01月01日

学员中心
联系我们
中国信息协会市场研究业分会
中经数(北京)数据应用技术研究院
监督电话