率的可信区间计算

Python 3.10-3.12
R 4.1-4.4
Build 202505
⏱️ 计算中,请稍候。
请输入正整数
率的可信区间计算介绍

在二项分布中,样本数(n)和事件发生的概率(p)是两个核心的参数。他们的交互作用可以按以下两种情况考虑:

  1. np>5,并且n(1-p)>5

    正常情况或大样本情况:当样本数乘以概率 np 大于5,并且样本数乘以1减去概率 n(1-p) 大于5,这是一个理想的情况。因为在这种情况下,正态近似法(Normal Approximation Method)可以有效地用来估计二项分布的置信区间。

  2. np≤5,或n(1-p)≤5

    极端情况或小样本情况:当样本数乘以概率np 小于等于5,或者样本数乘以1减去概率 n(1-p) 小于等于5,这是一个不理想的情况。因为在这种情况下,正态近似法可能会失效。对于这些情况,通常需要使用更为精确的置信区间估计方法,例如Clopper-Pearson方法,也被称为精确置信区间法。

  3. 关于np

    我们通常称它为"期望成功次数"或"预期成功次数"。

  4. 关于n(1-p)

    我们通常称它为"期望失败次数"或"预期失败次数"

  5. 阀值的确定

    请注意,以上阈值5是经验性的,用于决定是否可以使用正态近似法。这不是一个固定的规则,而是一种通常被接受的实践。

基于Python的生存分析工具集 by Lokyshin