考虑任务:为随机数据建立分类器,其中属性值随机产生,与类标号无关。假设数据集包含两个类“+”和“-”的记录。数据集的一半用于训练,而剩下的一半用于测试。
(1)假设数据集中正例和反例的数目相等,决策树分类器把所有测试记录预测为正类则分类器在测试数据上的期望误差率是多少?
(2)假设分类器把每个测试记录预测为正类的概率是0.8,预测为负类的概率是0.2,重复前面的分析。
(3)假设2/3的数据属于正类,1/3的数据属于负类。分类器把每个测试记录预测为正类的期望误差是多少?
(4)假设分类器把每个测试记录预测为正类的概率是23,预测为负类的概率是1/3,重复前面的分析。
2020-07-06