<div id="ehzpg"><video id="ehzpg"><div id="ehzpg"></div></video></div>

統(tǒng)計(jì)基礎(chǔ)理論與相關(guān)知識(shí):二項(xiàng)分布與Poisson分布

字號(hào):

二項(xiàng)分布和Poisson分布均是常見的離散型分布,在分類資料的統(tǒng)計(jì)推斷中有非常廣泛的應(yīng)用。
    一、二項(xiàng)分布的概念及應(yīng)用條件
    1.二項(xiàng)分布的概念:
    如某實(shí)驗(yàn)中小白鼠染毒后死亡概率P為0.8,則生存概率為=1-P=0.2,故
    對(duì)一只小白鼠進(jìn)行實(shí)驗(yàn)的結(jié)果為:死(概率為P)或生(概率為1-P)
    對(duì)二只小白鼠(甲乙)進(jìn)行實(shí)驗(yàn)的結(jié)果為:甲乙均死(概率為P2)、甲死乙生[概率為P(1-P)]、乙死甲生[概率為(1-P)P]或甲乙均生[概率為(1-P)2],概率相加得P2+P(1-P)+(1-P)P+(1-P)2=[P+(1-P)]2
    依此類推,對(duì)n只小白鼠進(jìn)行實(shí)驗(yàn),所有可能結(jié)果的概率相加得Pn+cn1P(1-P)n-1+...+cnxPx(1-P)n-x+...+(1-P)x=[P+(1-P)]n其中n為樣本含量,即事件發(fā)生總數(shù),x為某事件出現(xiàn)次數(shù),cnxPx(1-P)n-x為二項(xiàng)式通式,cnx=n!/x!(n-x)!,P為總體率。
    因此,二項(xiàng)分布是說明結(jié)果只有兩種情況的n次實(shí)驗(yàn)中發(fā)生某種結(jié)果為x次的概率分布。其概率密度為:
    P(x)=cnxPx(1-P)n-x,x=0,1,...n。
    2.二項(xiàng)分布的應(yīng)用條件:
    醫(yī)學(xué)領(lǐng)域有許多二分類記數(shù)資料都符合二項(xiàng)分布(傳染病和遺傳病除外),但應(yīng)用時(shí)仍應(yīng)注意考察是否滿足以下應(yīng)用條件:(1)每次實(shí)驗(yàn)只有兩類對(duì)立的結(jié)果;(2)n次事件相互獨(dú)立;(3)每次實(shí)驗(yàn)?zāi)愁惤Y(jié)果的發(fā)生的概率是一個(gè)常數(shù)。
    3.二項(xiàng)分布的累計(jì)概率
    二項(xiàng)分布下最多發(fā)生k例陽性的概率為發(fā)生0例陽性、1例陽性、...、直至k例陽性的概率之和。至少發(fā)生k例陽性的概率為發(fā)生k例陽性、k+1例陽性、...、直至n例陽性的概率之和。
    4.二項(xiàng)分布的圖形
    二項(xiàng)分布的圖形有如下特征:(1)二項(xiàng)分布圖形的形狀取決于P和n的大??;(2)當(dāng)P=0.5時(shí),無論n的大小,均為對(duì)稱分布;(3)當(dāng)P<>0.5,n較小時(shí)為偏態(tài)分布,n較大時(shí)逼近正態(tài)分布。
    5.二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差
    二項(xiàng)分布的均數(shù)µ=np,當(dāng)用率表示時(shí)µ=p
    二項(xiàng)分布的標(biāo)準(zhǔn)差為np(1-p)的算術(shù)平方根,當(dāng)用率表示時(shí)為p(1-p)的算術(shù)平方根。
    二、二項(xiàng)分布的應(yīng)用
    二項(xiàng)分布主要用于符合二項(xiàng)分布分類資料的率的區(qū)間估計(jì)和假設(shè)檢驗(yàn)。當(dāng)P=0.5或n較大,nP及n(1-P)均大于等于5時(shí),可用(p-u0.05sp,p+u0.05sp)對(duì)總體率進(jìn)行95%的區(qū)間估計(jì)。當(dāng)總體率P接近0.5,陽性數(shù)x較小時(shí),可直接計(jì)算二項(xiàng)分布的累計(jì)概率進(jìn)行單側(cè)的假設(shè)檢驗(yàn)。當(dāng)P=0.5或n較大,nP及n(1-P)均大于等于5時(shí),可用正態(tài)近似法進(jìn)行樣本率與總體率,兩個(gè)樣本率比較的u檢驗(yàn)。
    三、Poisson分布的概念及應(yīng)用條件
    1.Poisson分布的概念:
    Poisson分布是二項(xiàng)分布n很大而P很小時(shí)的特殊形式,是兩分類資料在n次實(shí)驗(yàn)中發(fā)生x次某種結(jié)果的概率分布。其概率密度函數(shù)為:P(x)=e-µ*µx/x!x=0,1,2...n,其中e為自然對(duì)數(shù)的底,µ為總體均數(shù),x為事件發(fā)生的陽性數(shù)。
    2.Poisson分布的應(yīng)用條件:
    醫(yī)學(xué)領(lǐng)域中有很多稀有疾病(如腫瘤,交通事故等)資料都符合Poisson分布,但應(yīng)用中仍應(yīng)注意要滿足以下條件:(1)兩類結(jié)果要相互對(duì)立;(2)n次試驗(yàn)相互獨(dú)立;(3)n應(yīng)很大,P應(yīng)很小。
    3.Poisson分布的概率
    Poisson分布的概率利用以下遞推公式很容易求得:
    P(0)=e-µ
    P(x+1)=P(x)*µ/x+1,x=0,1,2,...
    4.Poisson分布的性質(zhì):
    (1)Poisson分布均數(shù)與方差相等;
    (2)Poisson分布均數(shù)µ較小時(shí)呈偏態(tài),µ>=20時(shí)近似正態(tài);
    (3)n很大,P很小,nP=µ為常數(shù)時(shí)二項(xiàng)分布趨近于Poisson分布;
    (4)n個(gè)獨(dú)立的Poisson分布相加仍符合Poisson分布
    四、Poisson分布的應(yīng)用
    Poisson分布也主要用于符合Poisson分布分類資料率的區(qū)間估計(jì)和假設(shè)檢驗(yàn)。當(dāng)µ>=20時(shí),根據(jù)正態(tài)近似的原理,可用(x-u0.05*x的算術(shù)平方根,x+u0.05*x的算術(shù)平方根)對(duì)總體均數(shù)進(jìn)行95%的區(qū)間估計(jì)。同樣,也可通過直接計(jì)算Poisson分布的累計(jì)概率進(jìn)行單側(cè)的假設(shè)檢驗(yàn),在符合正態(tài)近似條件時(shí),也可用u檢驗(yàn)進(jìn)行樣本率與總體率,兩個(gè)樣本率比較的假設(shè)檢驗(yàn)。