这个课程中没有介绍到的:
剪枝如何操作?ID3的算法的缺点是什么?如何改进?还有其他的算法没有?什么是基尼系数?和熵,信息增益有什么关系?Sklearn决策树算法中可以调节的参数有哪些?
吴恩达:机器学习:https://www.bilibili.com/video/av9912938/?p=60






 





 
当变量有多个时(不是只有A和B两个变量了)

 

当变成异或时,(奇校验码)复杂度变为2的n次方。



这样XOR问题可以转换为组合问题:
 


 




增长的速率是非常非常非常快的。



 








 







 
 


 
 
限定偏差:











 
优选偏差:
 
 
归纳偏差:





 

 
第三点是由第一点自然得到的。













 



 


想法:
 

 





剪枝操作:

如果误差太大的话可以不用剪枝,如果误差比较小可以使用剪枝。
 
 
 




 


比如:
 
 
原文:https://www.cnblogs.com/JasonPeng1/p/12118738.html