文章目录
- 引言
- I 预备知识:置信度(Confidence Level)
-
- II 误判的代价函数
- 2.1 信息偏差带来的损失
- 2.2 库尔贝勒交叉熵的应用
- 2.3 古德-图灵估计(Good-Turing Estimate)
引言
从所有预见到的事情中拿出很少一些资源,分配给没有预见到的事情。
I 预备知识:置信度(Confidence Level)
1.1 置信度的定义
置信度:量化地衡量自己有多么确定一件事
置信度可以帮你衡量一个信息到底是否可靠,带有随机性质的结论,需要有95%的置信度。
1.1 提高置信度
增加所统计的样本的数量。对于能够重复的事情,要被检验足够多次之后,置信度才高。
II 误判的代价函数
库尔贝勒交叉熵