喵宅苑 MewoGarden × 技术宅社区II | Z站 Z Station 棒棒哒纯文字二次元技术社区

正文

贝叶斯可以用来过滤垃圾邮件

作者:苏武器
贝叶斯可以用来过滤垃圾邮件,方法是统计某些“垃圾单词” 设收到的邮件为垃圾邮件为事件A,在邮件中抽到某个单词事件B, 某个单词来自垃圾邮件的可能性为 P(A|B) = P(AB)/P(A) = P(A)P(B|A)/P(A)P(B|A)+P(A)P(!B|A) P(B) = 该单词出现次数/所有单词数 P(A) = 垃圾邮件数/邮件总数 P(B|A) = 该单词在垃圾邮件中出现次数/垃圾邮件单词总数 P(!B|A) = 除该单词外其他单词在垃圾邮件中出现次数/垃圾邮件单词总数 这样就可以统计除每个单词是来自垃圾邮件的单词的概率,一旦超过某个概率比如90% 就认定它为垃圾单词,一旦一封邮件的垃圾单词数达到一定比例比如2/3,我们就可以 把他当作立即邮件过滤掉 还有我写着写着发现上面的与其叫实例不如叫应用,如果只是理解的话 可以参考这个 假设有N个盒子,标号1~n,其中各有若干个红白小球,问,如果拿到 红球,来自k号盒子的概率。 试着用贝叶斯公式来解决这道题,会的话就理解了 (喂,等等,说好的讲解呢? 贝叶斯公式就是用来追究责任。 数学弱鸡,以上有错的话,欢迎指正

回复

0%
站点地图友情链接:
喵宅苑
喵空间社区程序
喵宅苑 静态版
宅喵RPG地图编辑器
络合兔
Lanzainc
技术宅
小五四博客
莉可POI
Mithril.js
枫の主题社
Project1
午后少年
机智库
七濑胡桃
xiuno
幻想の日常
魂研社
Nothentai
0xffff
欲望之花
泽泽社长
淀粉月刊
HAYOU