首页 > 其他 > 详细

朴素贝叶斯分类器

时间:2020-03-24 16:41:14      阅读:56      评论:0      收藏:0      [点我收藏+]

公式:

\[p(A|B) = \frac {p(B|A)*p(A)}{p(B)} \]

解释:

\[类别(结果)A出现在特征B样本里的概率 = \frac {在已有的出现类别A的样本中特征B的概率*已有样本中类别A的总概率}{特征B在样本中的总概率} \]

示例问题1:

假设一个学校里有60%男生和40%女生。女生穿裤子的人数和穿裙子的人数相等,所有男生穿裤子。
随机看到了一个穿裤子的学生,那么这个学生是女生的概率是多少?

\[ \begin{align} 特征:& 穿裤子 \类别:& 女生 \p(女生|穿裤子) & = \frac{p(穿裤子|女生)*p(女生)}{p(穿裤子)} \& = \frac{p(女生里穿裤子的人占比)*p(女生占比)}{p(穿裤子的总占比)} \& = \frac{0.5*0.4}{0.8} \& = 25\% \end{align} \]

随机看到了一个穿裙子的学生,那么这个学生是男生的概率是多少?

\[ \begin{align} p(男生|穿裙子) & = \frac{p(男生里穿群子的人占比)*p(男生占比)}{p(穿裙子的人的总占比)} \& = \frac{0*0.6}{0.2} \& = 0\% \end{align} \]

公式扩展

前提:特征 X、Y、Z 相互独立无联系

\[p(A|XYZ) = \frac {p(XYZ|A)*p(A)}{p(XYZ)} = \frac {p(X|A)*p(Y|A)*p(Z|A)*p(A)}{p(X)*p(Y)*p(Z)} \]

示例问题2:

如果一对男女朋友,男生想女生求婚,男生的四个特点分别是不帅,性格不好,身高矮,不上进,请判断一下女生是嫁还是不嫁?
已有样本如下:

样本 特征1 [外貌] 特征2 [性格] 特征3 [身高] 特征3 [进取] 类别A [嫁]
1 不好 不上进 不嫁
2 不帅 上进 不嫁
3 上进
4 不帅 上进
5 不好 上进 不嫁
6 不帅 不好 不上进 不嫁
7 不上进
8 不帅 上进
9 上进
10 不帅 不好 上进
11 不上进 不嫁
12 不上进 不嫁

\[ \begin{align} p(嫁|不帅、不好、矮、不上进) & = \frac {p(不帅、不好、矮、不上进|嫁)*p(嫁)}{p(不帅、不好、矮、不上进)} \\ & = \frac{p(不帅|嫁)*p(不好|嫁)*p(矮|嫁)*p(不上进|嫁)*p(嫁)}{p(不帅)*p(不好)*p(矮)*p(不上进)} \ 其中: & \ p(嫁) & = \frac{1}{2} \qquad(12个样本里类别[嫁]占6个) \ p(不帅|嫁) & = \frac{1}{2} \qquad(6个[嫁]的样本里不帅占3个) \ p(不好|嫁) & = \frac{1}{6} \qquad(6个[嫁]的样本里不好占1个) \ p(矮|嫁) & = \frac{1}{6} \qquad(6个[嫁]的样本里矮占1个) \ p(不上进|嫁) & = \frac{1}{6} \qquad(6个[嫁]的样本里不上进占1个) \ p(不帅) & = \frac{5}{12} \ p(不好) & = \frac{1}{3}\ p(矮) & = \frac{7}{12}\ p(不上进) & = \frac{5}{12} \ p(嫁|不帅、不好、矮、不上进) & = \frac{\frac{1}{2}*\frac{1}{6}*\frac{1}{6}*\frac{1}{6}*\frac{1}{2}}{\frac{5}{12}*\frac{1}{3}*\frac{7}{12}*\frac{5}{12}} \ & = \frac{1}{864}*\frac{22464}{175} \ & \approx 14.86\% \end{align} \]

朴素贝叶斯分类器

原文:https://www.cnblogs.com/kktech/p/12559513.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!