Bayes
来自Jack's Lab
1 基本思想
- 样本中金子含量我知道
- 某种骚方法能分类成两份,一份含量高(提纯成功),一份含量低(垃圾)
- 骚方法也有成功率
- 提纯成功的金子含量已知,则可求得是金子时提纯成功率
2 曲奇饼问题
- 碗 1 中有 30 个香草曲奇、10 个巧克力曲奇
- 碗 2 中有 20 个香草曲奇、20 个巧克力曲奇
则取到的香草曲奇在碗 1 的概率是多少?
其实是个 Bayes 分类问题:
- 香草曲奇的总概率:5/8
- 碗 1 香草曲奇的概率:3/4;碗 2 香草曲奇的概率:1/2
- 分类到 碗 1 概率 1/2,碗 2 的概率 1/2
则 P(碗 1 | 香草曲奇) = 3/4 * 1/2 / 5/8 = 3/5
3 乳腺癌筛查
- 人群中乳腺癌概率已知为 5%
- X 光筛选人群,13% 阳性 (Positive),87% 阴性 (Negative)
- X 光呈现阳性 (Positive) 的人,乳腺癌概率 4/13;阴性 (Negative) 的人,乳腺癌概率 1/87
则 乳腺癌的阳性率 = 阳性时乳腺癌率*阳性率 / 乳腺癌率 = 4/13 * 0.13 / 0.05 = 8.75%
没有乳腺癌的阳性率 = 阳性时没有乳腺癌率*阳性率 / 没有乳腺癌率 = 9/13 * 0.13 / 0.95 = 9.47%