贝叶斯可以用来过滤垃圾邮件,方法是统计某些“垃圾单词” 设收到的邮件为垃圾邮件为事件A,在邮件中抽到某个单词事件B, 某个单词来自垃圾邮件的可能性为 P(A|B) = P(AB)/P(A) = P(A)P(B|A)/P(A)P(B|A)+P(A)P(!B|A) P(B) = 该单词出现次数/所有单词数 P(A) = 垃圾邮件数/邮件总数 P(B|A) = 该单词在垃圾邮件中出现次数/垃圾邮件单词总数 P(!B|A) = 除该单词外其他单词在垃圾邮件中出现次数/垃圾邮件单词总数 这样就可以统计除每个单词是来自垃圾邮件的单词的概率,一旦超过某个概率比如90% 就认定它为垃圾单词,一旦一封邮件的垃圾单词数达到一定比例比如2/3,我们就可以 把他当作立即邮件过滤掉 还有我写着写着发现上面的与其叫实例不如叫应用,如果只是理解的话 可以参考这个 假设有N个盒子,标号1~n,其中各有若干个红白小球,问,如果拿到 红球,来自k号盒子的概率。 试着用贝叶斯公式来解决这道题,会的话就理解了 (喂,等等,说好的讲解呢? 贝叶斯公式就是用来追究责任。 数学弱鸡,以上有错的话,欢迎指正
在说贝叶斯公式,你必须要知道什么是全概率公式和条件概率公式。 贝叶斯公式就是这两者的结合 。 全概率就是好多人干同一件事,然后我们把这群人分成不同种类的,这群人互相独立(完备事件组)。比如你们班级同学做作业,男同学有55%,女同学有45%,这样就分好了,就是完备事件组。然后男同学交作业的概率是0.6,女同学交作业的概率是0.9,现在问你一个同学交作业的概率是多少? 设A为交作业,B1为此同学为男同学,B2为此同学为女同学。 那么我们就要用全概率,这个同学可能是男生,那么交作业的概率就是0.55*0.6; 这个同学可能是女同学,那么交作业的概率是0.45*0.9 好了,这个同学可能男同学也可能女同学,所以概率就是把上面的两种概率加起来:0.55*0.6 + 0.45*0.9 这个就是全概率。 下面就是贝叶斯啦,坚持住: 现在我们已知这个同学交了作业,他是男同学的概率是多少? P{B1/A} = P{B1A}/P{A}(条件概率公式) =0.55*0.6/(0.55*0.6 + 0.45*0.9) 把它算出来就好啦。 这就是贝叶斯公式的应用。为什么你看到的贝叶斯公式看起来很大一坨,而这里这么短呢? 因为P{A}那个全概率公式我没写出来。P{A} = P{B1}*P{A/B1} + P{B2} * P{A/B2}(是男同学的概率*男同学交作业的概率 + 是女同学的概率*女同学交作业的概率) 要是写在一起,也是一大坨啦。 P{B1/A} = P{B1A}/P{A} = P{B1A}/(P{B1}*P{A/B1} + P{B2} * P{A/B2}) 你明白了吗?#31t