知識(shí)結(jié)構(gòu)
一、知識(shí)結(jié)構(gòu) 統(tǒng)計(jì)這一部分包括六章:
(一)統(tǒng)計(jì)與統(tǒng)計(jì)數(shù)據(jù)
(二)統(tǒng)計(jì)數(shù)據(jù)的整理與顯示
(三)數(shù)據(jù)特征的測(cè)度
(四)時(shí)間序列
(五)統(tǒng)計(jì)指數(shù)
(六)相關(guān)與回歸
整體來看,可以分成兩大塊,
• 前三章主要講統(tǒng)計(jì)數(shù)據(jù),這是統(tǒng)計(jì)的基礎(chǔ);后三章更進(jìn)一步,講到了序列、指數(shù)、相關(guān)與回歸關(guān)系。時(shí)間序列就是把某一統(tǒng)計(jì)指標(biāo)在各個(gè)不同時(shí)間上的數(shù)值按時(shí)間先后順序編制形成的序列,指數(shù)單從形式上看就是兩個(gè)數(shù)值對(duì)比形成的相對(duì)數(shù);相關(guān)與回歸也是衡量數(shù)據(jù)之間的聯(lián)系??傊?,后三章實(shí)際上是一種對(duì)數(shù)據(jù)的高級(jí)處理方法,基礎(chǔ)還是數(shù)據(jù)。
• 第一章 統(tǒng)計(jì)與統(tǒng)計(jì)數(shù)據(jù),主要是對(duì)統(tǒng)計(jì)數(shù)據(jù)所做的概述,包括統(tǒng)計(jì)數(shù)據(jù)的計(jì)量尺度、類型、來源及質(zhì)量。統(tǒng)計(jì)數(shù)據(jù)的計(jì)量尺度是新加的一節(jié),不可忽視,但內(nèi)容比較簡(jiǎn)單;重點(diǎn)是掌握數(shù)據(jù)的類型,定量數(shù)據(jù),由定距和定比尺度形成,就指數(shù)值型數(shù)據(jù);定性數(shù)據(jù)包括分類數(shù)據(jù)和順序數(shù)據(jù),由定類尺度和定序尺度形成。還有一點(diǎn)是掌握時(shí)期指標(biāo)和時(shí)點(diǎn)指標(biāo)之間的區(qū)分。
• 第二章 統(tǒng)計(jì)數(shù)據(jù)的整理與顯示,分別講述對(duì)定性數(shù)據(jù)和定量數(shù)據(jù)的整理,對(duì)定性數(shù)據(jù),主要是頻數(shù)分布表的編制;對(duì)定量數(shù)據(jù),主要掌握數(shù)據(jù)分組方法。
• 第三章 數(shù)據(jù)特征的測(cè)度,包括集中趨勢(shì)和離散程度兩個(gè)相反的方面。要概括地描述一組數(shù)據(jù),也就是描述清楚它的集中趨勢(shì)和離散程度。
• 第四章 時(shí)間序列,對(duì)時(shí)間序列的分析包括水平分析和速度分析兩方面。水平分析包括發(fā)展水平與平均發(fā)展水平、增長量與平均增長量;速度分析包括發(fā)展速度與增長速度、平均發(fā)展速度與平均增長速度、增長1%的絕對(duì)值這樣三個(gè)知識(shí)點(diǎn)。需要掌握各自的定義及計(jì)算。
• 第五章 統(tǒng)計(jì)指數(shù),需要清楚是根據(jù)基期加權(quán)還是根據(jù)報(bào)告期加權(quán),重點(diǎn)是指數(shù)體系的分析。
• 第六章 相關(guān)與回歸,要能夠根據(jù)相關(guān)系數(shù)判斷相關(guān)關(guān)系的程度;掌握一元線性回歸方程正誤的判斷。對(duì)于相關(guān)系數(shù)和一元線性回歸系數(shù)的計(jì)算公式,03年沒有考這樣繁瑣的內(nèi)容,但能記住。
• 本部分是容易出計(jì)算題的部分,除了搞清楚基本概念外,必須多做練習(xí),掌握基本題型的解題步驟,提高計(jì)算的準(zhǔn)確性。
二、主要考點(diǎn)
(一)統(tǒng)計(jì)與統(tǒng)計(jì)數(shù)據(jù)
1 掌握統(tǒng)計(jì)的含義
2 掌握統(tǒng)計(jì)數(shù)據(jù)的不同類型以及變量的含義和類型
3 掌握統(tǒng)計(jì)指標(biāo)的含義、分類
4 掌握普查、抽樣調(diào)查、統(tǒng)計(jì)報(bào)表的含義、特點(diǎn)和應(yīng)用場(chǎng)合;
5 掌握登記性誤差和代表性誤差的含義、區(qū)別
(二)統(tǒng)計(jì)數(shù)據(jù)的整理與顯示
1 掌握比例、百分比和比率的計(jì)算方法
2 掌握分類數(shù)據(jù)頻數(shù)分布表的編制方法
3 掌握條形圖的作用、特點(diǎn)和繪制方法
4 掌握累積頻數(shù)和累計(jì)頻率的計(jì)算方法
5 掌握順序數(shù)據(jù)頻數(shù)分布表和累積頻數(shù)分布表的編制方法
6 掌握數(shù)據(jù)分組的方法
7 掌握組中值的作用和計(jì)算方法
8 掌握直方圖和折線圖的繪制方法
9 掌握統(tǒng)計(jì)表的基本結(jié)構(gòu)和設(shè)計(jì)要求
(三)數(shù)據(jù)特征的測(cè)度
1 掌握眾數(shù)的計(jì)算方法、特點(diǎn)和應(yīng)用范圍
2 掌握中位數(shù)的計(jì)算方法、特點(diǎn)和應(yīng)用場(chǎng)合
3 掌握簡(jiǎn)單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)的計(jì)算方法、算術(shù)平均數(shù)的特點(diǎn)和應(yīng)用場(chǎng)合
4 掌握幾何平均數(shù)的計(jì)算方法和應(yīng)用場(chǎng)合
5 掌握標(biāo)準(zhǔn)差和方差的計(jì)算方法和應(yīng)用
6 掌握離散系數(shù)的計(jì)算方法和具體應(yīng)用
(四)時(shí)間序列
1 掌握不同時(shí)間序列序時(shí)平均數(shù)的計(jì)算方法
2 掌握增長量、逐期增長量、累積增長量和平均增長量的計(jì)算方法
3 掌握發(fā)展速度和增長速度的計(jì)算方法,定基發(fā)展速度與環(huán)比發(fā)展速度之間的關(guān)系并能相互推算
4 掌握平均發(fā)展速度和平均增長速度的計(jì)算方法,掌握增長1%絕對(duì)值的計(jì)算方法
(五)統(tǒng)計(jì)指數(shù)
1 掌握指數(shù)的分類
2 掌握基期加權(quán)綜合指數(shù)和報(bào)告期加權(quán)綜合指數(shù)的含義和計(jì)算方法
3 掌握指數(shù)體系中價(jià)值指數(shù)與各因素指數(shù)之間的相對(duì)數(shù)量關(guān)系和絕對(duì)數(shù)量關(guān)系,并掌握指數(shù)體系的分析方法
(六)相關(guān)與回歸
1 掌握相關(guān)關(guān)系的種類
2 掌握相關(guān)表的編制方法和散點(diǎn)圖的繪制方法
3 掌握相關(guān)系數(shù)的計(jì)算方法,并能根據(jù)實(shí)際數(shù)據(jù)編制相關(guān)表、繪制散點(diǎn)圖、計(jì)算相關(guān)系數(shù),并進(jìn)行分析。
4 掌握一元線性回歸方程的求法,能夠解釋回歸系數(shù)的實(shí)際意義,能夠根據(jù)實(shí)際數(shù)據(jù)求解回歸方程并進(jìn)行分析和預(yù)測(cè)
三、內(nèi)容詳解
(一) 統(tǒng)計(jì)與統(tǒng)計(jì)數(shù)據(jù)
1.含義:統(tǒng)計(jì)工作;統(tǒng)計(jì)數(shù)據(jù);統(tǒng)計(jì)學(xué)
2.統(tǒng)計(jì)數(shù)據(jù)的計(jì)量尺度:定類尺度、定序尺度、定距尺度、定比尺度。
定類尺度、定序尺度、定距尺度、定比尺度。
定類尺度:只進(jìn)行分類或分組,不反映各類的優(yōu)劣、量的大小或順序,不可以進(jìn)行數(shù)學(xué)運(yùn)算;例如:將人口分為男女兩類。
定序尺度:可以反映各類的優(yōu)劣、量的大小或順序,不可以進(jìn)行數(shù)學(xué)運(yùn)算;例如:將學(xué)生成績分成優(yōu)、良、中、及格和不及格五類。
定距尺度:可以反映現(xiàn)象在量方面的精確差異,可以進(jìn)行加、減運(yùn)算;例如:某物長10米,重100千克等。
定比尺度:相對(duì)數(shù)(或平均數(shù)),可以進(jìn)行加、減、乘、除等數(shù)學(xué)運(yùn)算
多選 (2004年試題):以定距尺度計(jì)量的統(tǒng)計(jì)數(shù)據(jù)可以進(jìn)行( )
A,加 B,減 C,乘 D,除 E,比較大小
答案:ABE
3. 類型
類型:分類數(shù)據(jù);順序數(shù)據(jù);數(shù)值型數(shù)據(jù)(通常我們處理的大多為數(shù)值型數(shù)據(jù)),其中分類數(shù)據(jù)和順序數(shù)據(jù)是定性數(shù)據(jù)或品質(zhì)數(shù)據(jù);數(shù)值型數(shù)據(jù)是定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。
對(duì)不同類型的數(shù)據(jù)應(yīng)采用不同的統(tǒng)計(jì)方法來處理和分析。品質(zhì)數(shù)據(jù)可計(jì)算各組的頻數(shù)或頻率,而數(shù)值型數(shù)據(jù)可以采取更多計(jì)算方法。
變量及其類型::分類變量、順序變量、數(shù)值型變量。數(shù)據(jù)型變量又有離散變量和連續(xù)變量之分。
多選(2004年試題):連續(xù)變量具有( )的特點(diǎn)
A,可以取無窮多個(gè)值
B,取值連續(xù)不斷
C,只可以取有限個(gè)值
D,其取值都以整位數(shù)斷開
E,取值不能一一列舉
答案:ABE
4.統(tǒng)計(jì)指標(biāo)及其類型
分類:總量指標(biāo)、相對(duì)指標(biāo)和平均指標(biāo)
其中,總量指標(biāo)可分為時(shí)期指標(biāo)和時(shí)點(diǎn)指標(biāo)
例題:03單選 經(jīng)濟(jì)增長率指標(biāo)屬于( )
A,總量指標(biāo)
B,相對(duì)指標(biāo)
C,平均指標(biāo)
D,時(shí)點(diǎn)指標(biāo)
答案:B
5.統(tǒng)計(jì)數(shù)據(jù)的來源
(1)直接來源,稱第一手或直接的統(tǒng)計(jì)數(shù)據(jù)
方式:普查、抽樣調(diào)查、統(tǒng)計(jì)報(bào)表
(2)間接來源,第二手或間接的統(tǒng)計(jì)數(shù)據(jù)
主要有:公開的出版物、未公開的內(nèi)部調(diào)查等。
單選(2005年試題)從使用者角度看,從( )中取得的統(tǒng)計(jì)數(shù)據(jù)是第二手統(tǒng)計(jì)數(shù)據(jù)。
A.經(jīng)濟(jì)普查
B.農(nóng)產(chǎn)量抽樣調(diào)查
C.《中國人口統(tǒng)計(jì)年鑒》
D.固定資產(chǎn)投資月度統(tǒng)計(jì)報(bào)表
答案:C
6.統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量
誤差來源主要有:登記性誤差(從理論上講可以消除)和代表性誤差(通常無法消除,但可以事先進(jìn)行控制或計(jì)算)。登記性誤差的原因:調(diào)查方案中有關(guān)的規(guī)定或解釋不明確導(dǎo)致的填報(bào)錯(cuò)誤、抄錄錯(cuò)誤、匯總錯(cuò)誤;因人為因素干擾形成的有意虛報(bào)或瞞報(bào)調(diào)查數(shù)據(jù)。代表性誤差的原因:抽取樣本時(shí)沒有遵循隨即原則;樣本結(jié)構(gòu)與總體結(jié)構(gòu)存在差異;樣本容量不足等。
單選(2005年試題)抽樣時(shí),由于樣本容量不足造成的誤差與因?yàn)? )造成的誤差,都屬于代表性誤差。
A.被調(diào)查者有意虛報(bào)
B.數(shù)據(jù)匯總錯(cuò)誤
C.填報(bào)錯(cuò)誤
D.沒有遵循隨機(jī)原則
答案:D
(二) 統(tǒng)計(jì)數(shù)據(jù)的整理和顯示
1.品質(zhì)數(shù)據(jù)的整理與顯示
指標(biāo):頻數(shù)與頻數(shù)分布,比例,百分比,比率
頻數(shù)分布表:把數(shù)據(jù)的各個(gè)類別及其相應(yīng)的頻數(shù)全部列出來就是頻數(shù)分布或稱次數(shù)分布,將其用表格的形式表現(xiàn)出來就是頻數(shù)分布表。
比例是一個(gè)總體中各個(gè)部分的數(shù)量占總體數(shù)量的比重
百分比是將比例乘以100而得出
比率是各個(gè)不同類別的數(shù)量的比值
圖示:主要用條形圖和圓形圖
單選(2004年試題):根據(jù)第五次全國人口普查的結(jié)果,我國男性占總?cè)丝诘?1.63%,女性占總?cè)丝诘?8.37%,那么人口的性別比為( )
A, 100:106.74
B, 93.67:100
C, 106.74:100
D, 100:93.67
答案:C
多選(2004年試題):2001年底,我國共有博物館1458個(gè),其中綜合性博物館769個(gè),歷史類博物館521個(gè),藝術(shù)類博物館57個(gè),自然科技類博物館19個(gè),其他類型博物館92個(gè)。這一構(gòu)成應(yīng)通過繪制( )來顯示。
A,條形圖
B,累積頻數(shù)分布圖
C,圓形圖
D,直方圖
E,折線圖
答案:AC
2.順序數(shù)據(jù)的整理與顯示
除了可以用分類數(shù)據(jù)的整理及圖示方法外,還有累積頻數(shù)和累計(jì)頻率。
累積頻數(shù):將各類別的頻數(shù)逐級(jí)累加起來,一種方法是從類別順序的開始一方向類別順序的最后一方累加頻數(shù);另一種方法是從類別順序的最后一方向類別順序的開始一方累加頻數(shù)
累計(jì)頻率:將各類別的百分比逐級(jí)累加起來
3.數(shù)值型數(shù)據(jù)的整理與顯示
組距分組的步驟:
(1)確定分組組數(shù),經(jīng)驗(yàn)公式:K= 1+ log10N / log102;
(2)對(duì)原始資料進(jìn)行排序;
(3)求極差:觀察值減去最小觀察值。
(4)確定各組組距:組距=極差/組數(shù)=某組的上限值-該組的下限值
(5)確定組限:組中值=(上限+下限)/ 2
(6)確定各組觀察值出現(xiàn)的頻數(shù):組距分組遵循“不重不漏”的原則;分組時(shí)“上組限不在內(nèi)”以防止重復(fù)。
(7)制作頻數(shù)分布表
直方圖與條形圖的區(qū)別:前者用面積而后者用條形的長度來表示各類別頻數(shù)的多少,前者高度與寬度均有意義,前者的各矩形通常是連續(xù)排列而后者通常是分開排列。
4統(tǒng)計(jì)表
基本結(jié)構(gòu):表頭、行標(biāo)題、列標(biāo)題和數(shù)字資料
設(shè)計(jì)要求:科學(xué)、實(shí)用、簡(jiǎn)練、美觀
要合理安排統(tǒng)計(jì)表的結(jié)構(gòu);表頭一般應(yīng)包括表號(hào)、總標(biāo)題和表中數(shù)據(jù)的單位等內(nèi)容;表中的上下兩條橫線一般用粗線,中間的其他線要用細(xì)線,這樣使人看起來清楚、醒目;在使用統(tǒng)計(jì)表時(shí),必要時(shí)可在表的下方加上注釋,特別要注意注明資料的來源,以示對(duì)他人勞動(dòng)成果的尊重,并備讀者查閱使用
多選(2004年試題):通常情況下,設(shè)計(jì)統(tǒng)計(jì)表要求( )
A,沒有數(shù)字的單元格應(yīng)空白
B,左右兩邊不封口
C,表中數(shù)據(jù)一般是右對(duì)齊
D,列標(biāo)題之間一般用豎線隔開
E,行標(biāo)題之間不必用橫線隔開
答案:BCDE
(三)數(shù)據(jù)特征的測(cè)度
1.集中趨勢(shì)的測(cè)度
眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值;它是一個(gè)位置代表值,特點(diǎn)是不受數(shù)據(jù)中極端值的影響
中位數(shù):是一組數(shù)據(jù)按一定順序排序后,處于中間位置上的數(shù)值。當(dāng)數(shù)值個(gè)數(shù)為奇數(shù)時(shí),取中間位置的數(shù);當(dāng)數(shù)值個(gè)數(shù)為偶數(shù)時(shí),取中間位置兩個(gè)數(shù)的均值。
它將全部數(shù)據(jù)等分成兩部分,也是一個(gè)位置代表值,其特點(diǎn)是不受極端值的影響,在研究收入分配時(shí)很有用
單選(2004年試題):2003年,某市下轄六個(gè)縣的棉花種植面積按規(guī)模由小到大依次為800公頃、900公頃、1100公頃、1400公頃、1500公頃、3000公頃,這六個(gè)縣棉花種植面積的中位數(shù)是( )公頃。
A,1450
B,1250
C,1100
D,1400
答案:B
解析:變量值一共有6個(gè),偶數(shù)個(gè),中位數(shù)為最中間兩個(gè)數(shù)的平均數(shù),即第三和第四個(gè)數(shù)的平均數(shù),為1/2*(1100+1400)= 1250。
算術(shù)平均數(shù):也稱均值,是全部數(shù)據(jù)的算術(shù)平均。它是集中趨勢(shì)的最主要測(cè)度值。
簡(jiǎn)單均值:等于所有數(shù)值相加之和 / 數(shù)值個(gè)數(shù);加權(quán)均值:(各組組中值*各組頻數(shù)) / 頻數(shù)之和。
均值是一組數(shù)據(jù)的重心所在,是數(shù)據(jù)誤差相互抵消后的必然結(jié)果,反映出事物必然性的數(shù)量特征。其缺點(diǎn)是容易受極端值的影響
幾何平均數(shù):將一組中n個(gè)數(shù)據(jù)連乘后再開n次方。是適用于特殊數(shù)據(jù)的一種平均數(shù),主要用于計(jì)算比率或速度的平均。實(shí)踐中,主要用于計(jì)算社會(huì)經(jīng)濟(jì)現(xiàn)象的平均發(fā)展速度
2.離散程度的測(cè)度
標(biāo)準(zhǔn)差:各變量與其均值離差平方和的平均數(shù)的平方根,它是數(shù)測(cè)量數(shù)據(jù)離散程度的最主要方法,也是實(shí)際中應(yīng)用最廣泛的離散程度測(cè)度值。在對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行分析是主要使用標(biāo)準(zhǔn)差。
例:一組5個(gè)數(shù)據(jù), 1、2、3、4、5,求其標(biāo)準(zhǔn)差。
解:先求均值等于(1+2+3+4+5)/ 5 =3;
再求離差,分別為:(1-3)=-2,(2-3)=-1,(3-3)=0,(4-3)=1,(5-3)=2。
離差平方,分別為:4,1,0,1,4。離差平方和等于4+1+0+1+4=10
離差平方和的平均數(shù):10/5=2,所以方差為2
把2開平方,即得標(biāo)準(zhǔn)差。
離散系數(shù):一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比,是測(cè)度數(shù)據(jù)離散程度的相對(duì)指標(biāo),其作用主要是用于比較不同組別數(shù)據(jù)的離散程度。
上例中,離散系數(shù)等于2的平方根除以3。
單選(2004年試題):某學(xué)校學(xué)生的平均年齡為20歲,標(biāo)準(zhǔn)差為3歲;該校教師的平均年齡為38歲,標(biāo)準(zhǔn)差為3歲。比較該校學(xué)生年齡和教師年齡的離散程度,則( )
A,學(xué)生年齡和教師年齡的離散程度相同
B,教師年齡的離散程度大一些
C,教師年齡的離散程度是學(xué)生年齡離散程度的1.9倍
D,學(xué)生年齡的離散程度大一些
答案:D
解析:比較不同組別數(shù)據(jù)的離散程度應(yīng)該用離散系數(shù)。學(xué)生年齡的離散系數(shù)為(3/20),教師年齡的離散系數(shù)為(3/38),學(xué)生年齡的離散系數(shù)要大一些。
多選(2005年多選)下列數(shù)據(jù)特征的測(cè)度值中,易受極端值影響的有( )。
A.加權(quán)算術(shù)平均數(shù)
B.簡(jiǎn)單算術(shù)平均數(shù)
C.極差
D.眾數(shù)
E.中位數(shù)
答案:ABC
一、知識(shí)結(jié)構(gòu) 統(tǒng)計(jì)這一部分包括六章:
(一)統(tǒng)計(jì)與統(tǒng)計(jì)數(shù)據(jù)
(二)統(tǒng)計(jì)數(shù)據(jù)的整理與顯示
(三)數(shù)據(jù)特征的測(cè)度
(四)時(shí)間序列
(五)統(tǒng)計(jì)指數(shù)
(六)相關(guān)與回歸
整體來看,可以分成兩大塊,
• 前三章主要講統(tǒng)計(jì)數(shù)據(jù),這是統(tǒng)計(jì)的基礎(chǔ);后三章更進(jìn)一步,講到了序列、指數(shù)、相關(guān)與回歸關(guān)系。時(shí)間序列就是把某一統(tǒng)計(jì)指標(biāo)在各個(gè)不同時(shí)間上的數(shù)值按時(shí)間先后順序編制形成的序列,指數(shù)單從形式上看就是兩個(gè)數(shù)值對(duì)比形成的相對(duì)數(shù);相關(guān)與回歸也是衡量數(shù)據(jù)之間的聯(lián)系??傊?,后三章實(shí)際上是一種對(duì)數(shù)據(jù)的高級(jí)處理方法,基礎(chǔ)還是數(shù)據(jù)。
• 第一章 統(tǒng)計(jì)與統(tǒng)計(jì)數(shù)據(jù),主要是對(duì)統(tǒng)計(jì)數(shù)據(jù)所做的概述,包括統(tǒng)計(jì)數(shù)據(jù)的計(jì)量尺度、類型、來源及質(zhì)量。統(tǒng)計(jì)數(shù)據(jù)的計(jì)量尺度是新加的一節(jié),不可忽視,但內(nèi)容比較簡(jiǎn)單;重點(diǎn)是掌握數(shù)據(jù)的類型,定量數(shù)據(jù),由定距和定比尺度形成,就指數(shù)值型數(shù)據(jù);定性數(shù)據(jù)包括分類數(shù)據(jù)和順序數(shù)據(jù),由定類尺度和定序尺度形成。還有一點(diǎn)是掌握時(shí)期指標(biāo)和時(shí)點(diǎn)指標(biāo)之間的區(qū)分。
• 第二章 統(tǒng)計(jì)數(shù)據(jù)的整理與顯示,分別講述對(duì)定性數(shù)據(jù)和定量數(shù)據(jù)的整理,對(duì)定性數(shù)據(jù),主要是頻數(shù)分布表的編制;對(duì)定量數(shù)據(jù),主要掌握數(shù)據(jù)分組方法。
• 第三章 數(shù)據(jù)特征的測(cè)度,包括集中趨勢(shì)和離散程度兩個(gè)相反的方面。要概括地描述一組數(shù)據(jù),也就是描述清楚它的集中趨勢(shì)和離散程度。
• 第四章 時(shí)間序列,對(duì)時(shí)間序列的分析包括水平分析和速度分析兩方面。水平分析包括發(fā)展水平與平均發(fā)展水平、增長量與平均增長量;速度分析包括發(fā)展速度與增長速度、平均發(fā)展速度與平均增長速度、增長1%的絕對(duì)值這樣三個(gè)知識(shí)點(diǎn)。需要掌握各自的定義及計(jì)算。
• 第五章 統(tǒng)計(jì)指數(shù),需要清楚是根據(jù)基期加權(quán)還是根據(jù)報(bào)告期加權(quán),重點(diǎn)是指數(shù)體系的分析。
• 第六章 相關(guān)與回歸,要能夠根據(jù)相關(guān)系數(shù)判斷相關(guān)關(guān)系的程度;掌握一元線性回歸方程正誤的判斷。對(duì)于相關(guān)系數(shù)和一元線性回歸系數(shù)的計(jì)算公式,03年沒有考這樣繁瑣的內(nèi)容,但能記住。
• 本部分是容易出計(jì)算題的部分,除了搞清楚基本概念外,必須多做練習(xí),掌握基本題型的解題步驟,提高計(jì)算的準(zhǔn)確性。
二、主要考點(diǎn)
(一)統(tǒng)計(jì)與統(tǒng)計(jì)數(shù)據(jù)
1 掌握統(tǒng)計(jì)的含義
2 掌握統(tǒng)計(jì)數(shù)據(jù)的不同類型以及變量的含義和類型
3 掌握統(tǒng)計(jì)指標(biāo)的含義、分類
4 掌握普查、抽樣調(diào)查、統(tǒng)計(jì)報(bào)表的含義、特點(diǎn)和應(yīng)用場(chǎng)合;
5 掌握登記性誤差和代表性誤差的含義、區(qū)別
(二)統(tǒng)計(jì)數(shù)據(jù)的整理與顯示
1 掌握比例、百分比和比率的計(jì)算方法
2 掌握分類數(shù)據(jù)頻數(shù)分布表的編制方法
3 掌握條形圖的作用、特點(diǎn)和繪制方法
4 掌握累積頻數(shù)和累計(jì)頻率的計(jì)算方法
5 掌握順序數(shù)據(jù)頻數(shù)分布表和累積頻數(shù)分布表的編制方法
6 掌握數(shù)據(jù)分組的方法
7 掌握組中值的作用和計(jì)算方法
8 掌握直方圖和折線圖的繪制方法
9 掌握統(tǒng)計(jì)表的基本結(jié)構(gòu)和設(shè)計(jì)要求
(三)數(shù)據(jù)特征的測(cè)度
1 掌握眾數(shù)的計(jì)算方法、特點(diǎn)和應(yīng)用范圍
2 掌握中位數(shù)的計(jì)算方法、特點(diǎn)和應(yīng)用場(chǎng)合
3 掌握簡(jiǎn)單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)的計(jì)算方法、算術(shù)平均數(shù)的特點(diǎn)和應(yīng)用場(chǎng)合
4 掌握幾何平均數(shù)的計(jì)算方法和應(yīng)用場(chǎng)合
5 掌握標(biāo)準(zhǔn)差和方差的計(jì)算方法和應(yīng)用
6 掌握離散系數(shù)的計(jì)算方法和具體應(yīng)用
(四)時(shí)間序列
1 掌握不同時(shí)間序列序時(shí)平均數(shù)的計(jì)算方法
2 掌握增長量、逐期增長量、累積增長量和平均增長量的計(jì)算方法
3 掌握發(fā)展速度和增長速度的計(jì)算方法,定基發(fā)展速度與環(huán)比發(fā)展速度之間的關(guān)系并能相互推算
4 掌握平均發(fā)展速度和平均增長速度的計(jì)算方法,掌握增長1%絕對(duì)值的計(jì)算方法
(五)統(tǒng)計(jì)指數(shù)
1 掌握指數(shù)的分類
2 掌握基期加權(quán)綜合指數(shù)和報(bào)告期加權(quán)綜合指數(shù)的含義和計(jì)算方法
3 掌握指數(shù)體系中價(jià)值指數(shù)與各因素指數(shù)之間的相對(duì)數(shù)量關(guān)系和絕對(duì)數(shù)量關(guān)系,并掌握指數(shù)體系的分析方法
(六)相關(guān)與回歸
1 掌握相關(guān)關(guān)系的種類
2 掌握相關(guān)表的編制方法和散點(diǎn)圖的繪制方法
3 掌握相關(guān)系數(shù)的計(jì)算方法,并能根據(jù)實(shí)際數(shù)據(jù)編制相關(guān)表、繪制散點(diǎn)圖、計(jì)算相關(guān)系數(shù),并進(jìn)行分析。
4 掌握一元線性回歸方程的求法,能夠解釋回歸系數(shù)的實(shí)際意義,能夠根據(jù)實(shí)際數(shù)據(jù)求解回歸方程并進(jìn)行分析和預(yù)測(cè)
三、內(nèi)容詳解
(一) 統(tǒng)計(jì)與統(tǒng)計(jì)數(shù)據(jù)
1.含義:統(tǒng)計(jì)工作;統(tǒng)計(jì)數(shù)據(jù);統(tǒng)計(jì)學(xué)
2.統(tǒng)計(jì)數(shù)據(jù)的計(jì)量尺度:定類尺度、定序尺度、定距尺度、定比尺度。
定類尺度、定序尺度、定距尺度、定比尺度。
定類尺度:只進(jìn)行分類或分組,不反映各類的優(yōu)劣、量的大小或順序,不可以進(jìn)行數(shù)學(xué)運(yùn)算;例如:將人口分為男女兩類。
定序尺度:可以反映各類的優(yōu)劣、量的大小或順序,不可以進(jìn)行數(shù)學(xué)運(yùn)算;例如:將學(xué)生成績分成優(yōu)、良、中、及格和不及格五類。
定距尺度:可以反映現(xiàn)象在量方面的精確差異,可以進(jìn)行加、減運(yùn)算;例如:某物長10米,重100千克等。
定比尺度:相對(duì)數(shù)(或平均數(shù)),可以進(jìn)行加、減、乘、除等數(shù)學(xué)運(yùn)算
多選 (2004年試題):以定距尺度計(jì)量的統(tǒng)計(jì)數(shù)據(jù)可以進(jìn)行( )
A,加 B,減 C,乘 D,除 E,比較大小
答案:ABE
3. 類型
類型:分類數(shù)據(jù);順序數(shù)據(jù);數(shù)值型數(shù)據(jù)(通常我們處理的大多為數(shù)值型數(shù)據(jù)),其中分類數(shù)據(jù)和順序數(shù)據(jù)是定性數(shù)據(jù)或品質(zhì)數(shù)據(jù);數(shù)值型數(shù)據(jù)是定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。
對(duì)不同類型的數(shù)據(jù)應(yīng)采用不同的統(tǒng)計(jì)方法來處理和分析。品質(zhì)數(shù)據(jù)可計(jì)算各組的頻數(shù)或頻率,而數(shù)值型數(shù)據(jù)可以采取更多計(jì)算方法。
變量及其類型::分類變量、順序變量、數(shù)值型變量。數(shù)據(jù)型變量又有離散變量和連續(xù)變量之分。
多選(2004年試題):連續(xù)變量具有( )的特點(diǎn)
A,可以取無窮多個(gè)值
B,取值連續(xù)不斷
C,只可以取有限個(gè)值
D,其取值都以整位數(shù)斷開
E,取值不能一一列舉
答案:ABE
4.統(tǒng)計(jì)指標(biāo)及其類型
分類:總量指標(biāo)、相對(duì)指標(biāo)和平均指標(biāo)
其中,總量指標(biāo)可分為時(shí)期指標(biāo)和時(shí)點(diǎn)指標(biāo)
例題:03單選 經(jīng)濟(jì)增長率指標(biāo)屬于( )
A,總量指標(biāo)
B,相對(duì)指標(biāo)
C,平均指標(biāo)
D,時(shí)點(diǎn)指標(biāo)
答案:B
5.統(tǒng)計(jì)數(shù)據(jù)的來源
(1)直接來源,稱第一手或直接的統(tǒng)計(jì)數(shù)據(jù)
方式:普查、抽樣調(diào)查、統(tǒng)計(jì)報(bào)表
(2)間接來源,第二手或間接的統(tǒng)計(jì)數(shù)據(jù)
主要有:公開的出版物、未公開的內(nèi)部調(diào)查等。
單選(2005年試題)從使用者角度看,從( )中取得的統(tǒng)計(jì)數(shù)據(jù)是第二手統(tǒng)計(jì)數(shù)據(jù)。
A.經(jīng)濟(jì)普查
B.農(nóng)產(chǎn)量抽樣調(diào)查
C.《中國人口統(tǒng)計(jì)年鑒》
D.固定資產(chǎn)投資月度統(tǒng)計(jì)報(bào)表
答案:C
6.統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量
誤差來源主要有:登記性誤差(從理論上講可以消除)和代表性誤差(通常無法消除,但可以事先進(jìn)行控制或計(jì)算)。登記性誤差的原因:調(diào)查方案中有關(guān)的規(guī)定或解釋不明確導(dǎo)致的填報(bào)錯(cuò)誤、抄錄錯(cuò)誤、匯總錯(cuò)誤;因人為因素干擾形成的有意虛報(bào)或瞞報(bào)調(diào)查數(shù)據(jù)。代表性誤差的原因:抽取樣本時(shí)沒有遵循隨即原則;樣本結(jié)構(gòu)與總體結(jié)構(gòu)存在差異;樣本容量不足等。
單選(2005年試題)抽樣時(shí),由于樣本容量不足造成的誤差與因?yàn)? )造成的誤差,都屬于代表性誤差。
A.被調(diào)查者有意虛報(bào)
B.數(shù)據(jù)匯總錯(cuò)誤
C.填報(bào)錯(cuò)誤
D.沒有遵循隨機(jī)原則
答案:D
(二) 統(tǒng)計(jì)數(shù)據(jù)的整理和顯示
1.品質(zhì)數(shù)據(jù)的整理與顯示
指標(biāo):頻數(shù)與頻數(shù)分布,比例,百分比,比率
頻數(shù)分布表:把數(shù)據(jù)的各個(gè)類別及其相應(yīng)的頻數(shù)全部列出來就是頻數(shù)分布或稱次數(shù)分布,將其用表格的形式表現(xiàn)出來就是頻數(shù)分布表。
比例是一個(gè)總體中各個(gè)部分的數(shù)量占總體數(shù)量的比重
百分比是將比例乘以100而得出
比率是各個(gè)不同類別的數(shù)量的比值
圖示:主要用條形圖和圓形圖
單選(2004年試題):根據(jù)第五次全國人口普查的結(jié)果,我國男性占總?cè)丝诘?1.63%,女性占總?cè)丝诘?8.37%,那么人口的性別比為( )
A, 100:106.74
B, 93.67:100
C, 106.74:100
D, 100:93.67
答案:C
多選(2004年試題):2001年底,我國共有博物館1458個(gè),其中綜合性博物館769個(gè),歷史類博物館521個(gè),藝術(shù)類博物館57個(gè),自然科技類博物館19個(gè),其他類型博物館92個(gè)。這一構(gòu)成應(yīng)通過繪制( )來顯示。
A,條形圖
B,累積頻數(shù)分布圖
C,圓形圖
D,直方圖
E,折線圖
答案:AC
2.順序數(shù)據(jù)的整理與顯示
除了可以用分類數(shù)據(jù)的整理及圖示方法外,還有累積頻數(shù)和累計(jì)頻率。
累積頻數(shù):將各類別的頻數(shù)逐級(jí)累加起來,一種方法是從類別順序的開始一方向類別順序的最后一方累加頻數(shù);另一種方法是從類別順序的最后一方向類別順序的開始一方累加頻數(shù)
累計(jì)頻率:將各類別的百分比逐級(jí)累加起來
3.數(shù)值型數(shù)據(jù)的整理與顯示
組距分組的步驟:
(1)確定分組組數(shù),經(jīng)驗(yàn)公式:K= 1+ log10N / log102;
(2)對(duì)原始資料進(jìn)行排序;
(3)求極差:觀察值減去最小觀察值。
(4)確定各組組距:組距=極差/組數(shù)=某組的上限值-該組的下限值
(5)確定組限:組中值=(上限+下限)/ 2
(6)確定各組觀察值出現(xiàn)的頻數(shù):組距分組遵循“不重不漏”的原則;分組時(shí)“上組限不在內(nèi)”以防止重復(fù)。
(7)制作頻數(shù)分布表
直方圖與條形圖的區(qū)別:前者用面積而后者用條形的長度來表示各類別頻數(shù)的多少,前者高度與寬度均有意義,前者的各矩形通常是連續(xù)排列而后者通常是分開排列。
4統(tǒng)計(jì)表
基本結(jié)構(gòu):表頭、行標(biāo)題、列標(biāo)題和數(shù)字資料
設(shè)計(jì)要求:科學(xué)、實(shí)用、簡(jiǎn)練、美觀
要合理安排統(tǒng)計(jì)表的結(jié)構(gòu);表頭一般應(yīng)包括表號(hào)、總標(biāo)題和表中數(shù)據(jù)的單位等內(nèi)容;表中的上下兩條橫線一般用粗線,中間的其他線要用細(xì)線,這樣使人看起來清楚、醒目;在使用統(tǒng)計(jì)表時(shí),必要時(shí)可在表的下方加上注釋,特別要注意注明資料的來源,以示對(duì)他人勞動(dòng)成果的尊重,并備讀者查閱使用
多選(2004年試題):通常情況下,設(shè)計(jì)統(tǒng)計(jì)表要求( )
A,沒有數(shù)字的單元格應(yīng)空白
B,左右兩邊不封口
C,表中數(shù)據(jù)一般是右對(duì)齊
D,列標(biāo)題之間一般用豎線隔開
E,行標(biāo)題之間不必用橫線隔開
答案:BCDE
(三)數(shù)據(jù)特征的測(cè)度
1.集中趨勢(shì)的測(cè)度
眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值;它是一個(gè)位置代表值,特點(diǎn)是不受數(shù)據(jù)中極端值的影響
中位數(shù):是一組數(shù)據(jù)按一定順序排序后,處于中間位置上的數(shù)值。當(dāng)數(shù)值個(gè)數(shù)為奇數(shù)時(shí),取中間位置的數(shù);當(dāng)數(shù)值個(gè)數(shù)為偶數(shù)時(shí),取中間位置兩個(gè)數(shù)的均值。
它將全部數(shù)據(jù)等分成兩部分,也是一個(gè)位置代表值,其特點(diǎn)是不受極端值的影響,在研究收入分配時(shí)很有用
單選(2004年試題):2003年,某市下轄六個(gè)縣的棉花種植面積按規(guī)模由小到大依次為800公頃、900公頃、1100公頃、1400公頃、1500公頃、3000公頃,這六個(gè)縣棉花種植面積的中位數(shù)是( )公頃。
A,1450
B,1250
C,1100
D,1400
答案:B
解析:變量值一共有6個(gè),偶數(shù)個(gè),中位數(shù)為最中間兩個(gè)數(shù)的平均數(shù),即第三和第四個(gè)數(shù)的平均數(shù),為1/2*(1100+1400)= 1250。
算術(shù)平均數(shù):也稱均值,是全部數(shù)據(jù)的算術(shù)平均。它是集中趨勢(shì)的最主要測(cè)度值。
簡(jiǎn)單均值:等于所有數(shù)值相加之和 / 數(shù)值個(gè)數(shù);加權(quán)均值:(各組組中值*各組頻數(shù)) / 頻數(shù)之和。
均值是一組數(shù)據(jù)的重心所在,是數(shù)據(jù)誤差相互抵消后的必然結(jié)果,反映出事物必然性的數(shù)量特征。其缺點(diǎn)是容易受極端值的影響
幾何平均數(shù):將一組中n個(gè)數(shù)據(jù)連乘后再開n次方。是適用于特殊數(shù)據(jù)的一種平均數(shù),主要用于計(jì)算比率或速度的平均。實(shí)踐中,主要用于計(jì)算社會(huì)經(jīng)濟(jì)現(xiàn)象的平均發(fā)展速度
2.離散程度的測(cè)度
標(biāo)準(zhǔn)差:各變量與其均值離差平方和的平均數(shù)的平方根,它是數(shù)測(cè)量數(shù)據(jù)離散程度的最主要方法,也是實(shí)際中應(yīng)用最廣泛的離散程度測(cè)度值。在對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行分析是主要使用標(biāo)準(zhǔn)差。
例:一組5個(gè)數(shù)據(jù), 1、2、3、4、5,求其標(biāo)準(zhǔn)差。
解:先求均值等于(1+2+3+4+5)/ 5 =3;
再求離差,分別為:(1-3)=-2,(2-3)=-1,(3-3)=0,(4-3)=1,(5-3)=2。
離差平方,分別為:4,1,0,1,4。離差平方和等于4+1+0+1+4=10
離差平方和的平均數(shù):10/5=2,所以方差為2
把2開平方,即得標(biāo)準(zhǔn)差。
離散系數(shù):一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比,是測(cè)度數(shù)據(jù)離散程度的相對(duì)指標(biāo),其作用主要是用于比較不同組別數(shù)據(jù)的離散程度。
上例中,離散系數(shù)等于2的平方根除以3。
單選(2004年試題):某學(xué)校學(xué)生的平均年齡為20歲,標(biāo)準(zhǔn)差為3歲;該校教師的平均年齡為38歲,標(biāo)準(zhǔn)差為3歲。比較該校學(xué)生年齡和教師年齡的離散程度,則( )
A,學(xué)生年齡和教師年齡的離散程度相同
B,教師年齡的離散程度大一些
C,教師年齡的離散程度是學(xué)生年齡離散程度的1.9倍
D,學(xué)生年齡的離散程度大一些
答案:D
解析:比較不同組別數(shù)據(jù)的離散程度應(yīng)該用離散系數(shù)。學(xué)生年齡的離散系數(shù)為(3/20),教師年齡的離散系數(shù)為(3/38),學(xué)生年齡的離散系數(shù)要大一些。
多選(2005年多選)下列數(shù)據(jù)特征的測(cè)度值中,易受極端值影響的有( )。
A.加權(quán)算術(shù)平均數(shù)
B.簡(jiǎn)單算術(shù)平均數(shù)
C.極差
D.眾數(shù)
E.中位數(shù)
答案:ABC