歷年AP統(tǒng)計學真題解析及答案

字號:

AP統(tǒng)計學考試有選擇題和簡答題兩種類型,相對于選擇題來說,簡答題的難點在于根據(jù)實驗目的,明確實驗步驟,注重實驗細節(jié),并用英文表述出來。因為可以使用計算器,因此計算的部分一般不是難點,但解答過程又不能直接寫出使用計算器得出的數(shù)字結(jié)果,還要分步驟寫出計算過程。
    

    考點:1.用box plot展示兩組數(shù)據(jù)的分布;

    2.計算數(shù)據(jù)的特征值,從而做出統(tǒng)計決策。

    分析:a.兩個箱線圖的分布中,集中程度的指標(采用中位數(shù))是近似一樣的,離散程度的指標(極差和四分位差)是有區(qū)別的。注意對異常值的描述。在這個問題中,不用描述數(shù)據(jù)分布的信息(即判斷分布是對稱、左偏或有偏),因為箱線圖并不能直觀展示這一特征。

    b.A比B好在值比較大,B比A好在最小值比較大。(答題過程中要注意上下文的背景信息。)

    參考答案:

    

    往年考題中也有很多對比描述的問題,如 2011-B-1、2012-3、2013-6(對用histogram、line graph展示的兩組數(shù)據(jù)進行比較)。

    

    考點:1.用置信區(qū)間進行總體比例的假設檢驗;

    2.在做總體比例的區(qū)間估計時,樣本量和邊際誤差之間的關(guān)系。

    分析:a.通過一個樣本值,估計出總體比例的置信區(qū)間為(0.09,0.21),包含給定的總體值0.2,故不能拒絕這一總體值;

    b.樣本量變大4倍時,抽樣分布的標準差變小為原來的1/√(4),邊際誤差也變?yōu)樵瓉淼囊话?。寫出邊際誤差的計算公式即可看出數(shù)量關(guān)系。

    c.邊際誤差變小后,置信區(qū)間變小,不再包含給定的總體值,只能拒絕這一總體值。

    參考答案:

    

    考點:1.離散型隨機變量的概率分布;

    2.離散型隨機變量概率分布的期望值;

    3.條件概率;

    4.給定變量值下的期望值。

    分析:a.給定離散型隨機變量的概率分布,事件的并,用加法;

    b.給定離散型隨機變量的概率分布,計算期望值;

    c.條件概率的計算;

    d.樣本空間變化后,得到新的離散型隨機變量的概率分布,計算期望值。

    參考答案:

    

    考點:兩個總體比例差的假設檢驗

    分析:實驗目的:檢驗服用低劑量的阿司匹林是否能減低患大腸癌的幾率;

    實驗思路:1000個人隨機分成兩組,分別進行兩個處理(服用低劑量的阿司匹林、服用安慰劑),測試患病的比例,比較兩個比例的差值,從而驗證低劑量的阿司匹林能夠降低患病的幾率。用兩個總體比例差的假設檢驗即可。

    注意:1.兩個總體比例差的假設檢驗的4個步驟;

    2.左尾檢驗

    3.聯(lián)合比例的計算

    計算器操作:STAT-TEST-2 proportion Z test

    參考答案:

    

    此類題目在往年的考試真題中并不鮮見,比如2007-A-5、2007-B-6均考察的是總體比例差的假設檢驗問題。

    

    考點:1.散點圖的描述;

    2.獲取和解釋散點圖的線性回歸直線;

    3.利用回歸方程預測函數(shù)值。

    分析:a.散點圖的描述步驟:shape、direction、strength,注意結(jié)合背景內(nèi)容;

    b.區(qū)分y=x、y>x、y<x在平面內(nèi)對應的區(qū)域(數(shù)學中的線性規(guī)劃問題)

    c.最小二乘法確定的直線是對散點圖進行線性回歸的方法,用來預測給定x值下的函數(shù)值。

    參考答案:

    

    考點:1.描述不同抽樣方法下樣本的數(shù)據(jù);

    2.描述兩種不同抽樣方法下的抽樣分布;

    3.選擇能夠更好估計總體均值的抽樣方法。

    分析:第一種抽樣方法是從兩個生產(chǎn)線的一共200,000個玉米餅中隨機抽取200個玉米餅作為樣本,計算該樣本直徑均值的抽樣分布;

    第二種抽樣方法是從兩個生產(chǎn)線中任意抽取一個生產(chǎn)線生產(chǎn)的100,000個玉米餅中隨機抽取200個玉米餅作為樣本,計算該樣本直徑均值的抽樣分布。

    a.第二種方法抽取的樣本的直徑并不能代表當天所有玉米餅的總體直徑的情況,因為它只能代表一個生產(chǎn)線的產(chǎn)品直徑信息;

    b.題設中的直方圖的分布是雙峰的,意味著樣本的信息來源于兩個均值不同的總體,所以最有可能是用第一種的抽樣方法獲取的。假如用第二種的抽樣方法,樣本信息很有可能是均值為5.9inches或者6.1inches的單峰分布;

    c.某一天中,用第二種方法抽取的樣本的波動性小,因為它是從兩個生產(chǎn)線中的一個中隨機抽取的。假如采用第一種抽樣方法,則會包含兩個分布不同的總體的信息,波動性較大;

    d.因為n=200>30,根據(jù)中心極限定理,樣本均值的抽樣分布的期望值等于總體均值,標準差等于總體標準差/√(n);

    e.一年365天中均采用同一種抽樣方法的話,第一種方法計算的樣本均值的標準差(即波動性)小,均值和標準差的數(shù)值參見答案;

    d.如若采用第二種方法,則大概有一半的樣本均值約等于5.9inches,另一半的樣本均值約等于6.1inches;

    f.第一種方法更容易得到均值為6inches的樣本。因為當兩種抽樣的結(jié)果是無偏的情況下,樣本均值的抽樣分布的標準差越小,越能得到穩(wěn)定的結(jié)果。根據(jù)e問,得出此問的答案。

    難點:考察一個樣本量為200的樣本的分布,和用所有樣本量為200的樣本計算抽樣分布是不同的。

    參考答案: