考虑表5-10中的数据集。
表5-10数据集
记录ABC类
1000+
2001-
3011-
4011-
5001+
6101+
7101-
8101-
9111+
10101+
(a)估计条件概率P(A|+),P(B+),P(C+),P(A-),P(B-)和P(C-)
(b)根据(a)中的条件概率,使用朴素贝叶斯方法预测测试样本(A=0,B=1,C=0)的类标号
(c)使用m估计方法(p=1/2且m=4)估计条件概率
(d)同(b),使用(c)中的条件概率。
(e)比较估计概率的两种方法。哪一种更好?为什么?
2020-07-12