久久无码高潮喷水抽搐,极品馒头泬19p,久久人人爽精品玩人妻av,精品国产成人国产在线视,精品视频一区二区三区在线观看

最新更新最新專題

您的位置:首頁 > ppt下載 > PPT課件 > 課件PPT > 社會(huì)統(tǒng)計(jì)學(xué)ppt

社會(huì)統(tǒng)計(jì)學(xué)ppt下載

素材大。
3 MB
素材授權(quán):
免費(fèi)下載
素材格式:
.ppt
素材上傳:
lipeier
上傳時(shí)間:
2020-01-05
素材編號(hào):
249011
素材類別:
課件PPT

素材預(yù)覽

社會(huì)統(tǒng)計(jì)學(xué)ppt

這是社會(huì)統(tǒng)計(jì)學(xué)ppt,包括了緒論,單變量的描述統(tǒng)計(jì)分析,兩個(gè)類別變量關(guān)系的描述統(tǒng)計(jì),兩個(gè)尺度變量關(guān)系的描述統(tǒng)計(jì),類別變量與尺度變量關(guān)系的描述統(tǒng)計(jì),概率與隨機(jī)變量的概率分布,大數(shù)定律、中心極限定理與抽樣分布,參數(shù)估計(jì),假設(shè)檢驗(yàn)的基本原理,總體均值與方差的假設(shè)檢驗(yàn),兩個(gè)類別變量關(guān)系的假設(shè)檢驗(yàn),兩個(gè)尺度變量關(guān)系的假設(shè)檢驗(yàn),類別變量與尺度變量關(guān)系的假設(shè)檢驗(yàn),非參數(shù)檢驗(yàn),抽樣,時(shí)間序列等內(nèi)容,歡迎點(diǎn)擊下載。

社會(huì)統(tǒng)計(jì)學(xué)ppt是由紅軟PPT免費(fèi)下載網(wǎng)推薦的一款課件PPT類型的PowerPoint.

社會(huì)統(tǒng)計(jì)學(xué) Social Statistics 第一章 緒論 一、統(tǒng)計(jì)分析方法應(yīng)用水平是社會(huì)學(xué)研究科學(xué)性的重要標(biāo)志 保爾·拉法格在《憶馬克思》中談到,馬克思認(rèn)為:“一種科學(xué)只有在成功地運(yùn)用數(shù)學(xué)時(shí),才算達(dá)到了真正完善的地步。” 二、統(tǒng)計(jì)分析方法應(yīng)用的目的是要發(fā)現(xiàn)和描述社會(huì)現(xiàn)象的統(tǒng)計(jì)規(guī)律 (一)社會(huì)調(diào)查資料的特點(diǎn) 1、隨機(jī)性 客觀現(xiàn)象可分為確定性現(xiàn)象和非確定性現(xiàn)象(隨機(jī)現(xiàn)象) 2、統(tǒng)計(jì)規(guī)律性: 通過對(duì)大量個(gè)體特征的統(tǒng)計(jì)分析來描述和分析社會(huì)現(xiàn)象的統(tǒng)計(jì)規(guī)律。 (二)統(tǒng)計(jì)學(xué)是發(fā)現(xiàn)和彰顯統(tǒng)計(jì)規(guī)律的有效工具 三、統(tǒng)計(jì)學(xué)在社會(huì)學(xué)研究中的地位 社會(huì)調(diào)查從研究的范圍來分類可以分為全面調(diào)查與非全面調(diào)查,抽樣調(diào)查是非全面調(diào)查的重要方式。 一、總體、個(gè)體與樣本 (一)總體( population )與個(gè)體( case ) 總體是研究對(duì)象的全體。 個(gè)體也稱個(gè)案,是構(gòu)成總體的最小單位,是具體調(diào)查分析對(duì)象。 (二)樣本(Sample) 是從總體中抽出的用于實(shí)施調(diào)查研究的對(duì)象集合。 二、抽樣方法與統(tǒng)計(jì)分析方法的選擇 應(yīng)用隨機(jī)原則獲得的樣本稱為隨機(jī)樣本,否則是非隨機(jī)樣本。 社會(huì)統(tǒng)計(jì)學(xué)的內(nèi)容可分為兩大部分:描述統(tǒng)計(jì)與推論統(tǒng)計(jì)。 全面調(diào)查,只使用描述統(tǒng)計(jì)即可。 應(yīng)用推論統(tǒng)計(jì)的必要前提是樣本必須是隨機(jī)樣本。 一、變量的層次 按照變量的取值特征和統(tǒng)計(jì)分析時(shí)方法應(yīng)用的特征,變量的層次可以劃分為類別變量和尺度變量等兩大類。 (一)類別變量 1、無序類別變量( Nominal Variable ) 也稱為定類變量,是測(cè)量層次最低的變量。如職業(yè)、家庭類型、婚姻狀況、專業(yè)、人際關(guān)系類型、地區(qū)類別等等。 2、有序類別變量( Ordinal Variable ) 也稱為定序變量或序列變量。如職稱、職務(wù)級(jí)別、學(xué)生的年級(jí)等等。如用1、2、3、4、5、6、7分別表示文盲、小學(xué)、初中、高中、大專、大學(xué)、研究生。 (二)尺度變量(Scale Variable) 若測(cè)量工具有單位,則測(cè)量結(jié)果就不僅能夠比較大小,而且能夠比較出大多少或小多少。此種測(cè)量就是尺度測(cè)量,得到的變量就是尺度變量。尺度變量根據(jù)測(cè)量工具是否具有絕對(duì)零分為定距變量和定比變量。 1、定距變量 無絕對(duì)零,若存在零,則這個(gè)零是個(gè)相對(duì)零。如使用攝氏溫度計(jì)測(cè)量的溫度便是定距變量。 2、定比變量 定比測(cè)量是最高層次的測(cè)量,它不僅有相等的單位可以比較被測(cè)事物間的數(shù)量差異。而且有了絕對(duì)0,這樣就可以對(duì)被測(cè)事物間的倍數(shù)進(jìn)行比較。在社會(huì)學(xué)研究中,常用的有年齡、收入、住房面積等等屬于定比變量。 (三)不同層次變量的功能及轉(zhuǎn)換 由于對(duì)某一事物進(jìn)行測(cè)量時(shí)可以使用不同層次的測(cè)量工具,因此對(duì)同一事物進(jìn)行測(cè)量可能出現(xiàn)多種測(cè)量結(jié)果。 設(shè)計(jì)問卷時(shí),要盡可能多地設(shè)計(jì)測(cè)量層次高的變量。 二、變量層次與統(tǒng)計(jì)分析方法的選擇 (一)不同層次單變量統(tǒng)計(jì)分析方法的選擇 對(duì)于類別變量,可以使用頻次分布表、條形圖、圓形圖、線形圖等來描述變量的分布狀態(tài);可以用眾數(shù)和異眾比率描述其集中趨勢(shì)和離散趨勢(shì)。對(duì)于有序類別變量,還可以用中位數(shù)和四分位差或全距描述其集中趨勢(shì)和離散趨勢(shì)。對(duì)于尺度變量,可以使用頻次分布表、直方圖、線形圖等來描述變量的分布狀態(tài),用算術(shù)平均數(shù)和方差或標(biāo)準(zhǔn)差描述變量的集中趨勢(shì)和離散趨勢(shì)。 (二)不同層次兩個(gè)變量關(guān)系的統(tǒng)計(jì)分析方法的選擇 分析兩個(gè)變量間的關(guān)系:明確兩個(gè)變量是否有關(guān)系。如果有關(guān)系,相關(guān)的強(qiáng)度如何?相關(guān)的方向怎樣等等。 兩個(gè)變量的測(cè)量層次不同,應(yīng)用的統(tǒng)計(jì)分析方法也不同。 1-1 結(jié)合社會(huì)學(xué)研究的過程談?wù)劷y(tǒng)計(jì)學(xué)在其中所起的作用是什么? 1-2 社會(huì)調(diào)查資料具有哪些特點(diǎn)? 1-3 解釋總體、個(gè)體、樣本這幾個(gè)概念。 1-4 變量可以分為哪些類型? 1-5 類別變量與尺度變量的區(qū)別是什么? 1-6 簡(jiǎn)要陳述不同層次變量的功能。 1-7 舉例說明統(tǒng)計(jì)學(xué)在社會(huì)學(xué)研究中的應(yīng)用。 第二章 單變量的描述統(tǒng)計(jì)分析 單變量的描述統(tǒng)計(jì)就是用統(tǒng)計(jì)表、統(tǒng)計(jì)圖和統(tǒng)計(jì)特征值將變量的狀態(tài)、水平和分布特征表現(xiàn)出來的方法。 一、變量及其分布 (一)變量的特征 1、變量的含義: 研究對(duì)象的每個(gè)個(gè)體都具有很多屬性和特征。比如每個(gè)人都有身高、體重、年齡、學(xué)歷等特征。這些在不同個(gè)體上具有不同表現(xiàn)的特征就稱為變量。統(tǒng)計(jì)學(xué)中的變量在個(gè)體上是相對(duì)穩(wěn)定的,在不同個(gè)體上表現(xiàn)出變化。這類變量也稱為隨機(jī)變量。 2、變量取值的兩個(gè)特征 完備性。完備性是指變量的取值必須涵蓋全部的個(gè)案。 互斥性。互斥性是指變量的取值之間不能互相包容。 一、變量及其分布 (二)變量的分布 變量分布指?jìng)(gè)體在變量取值上的分布。對(duì)一組觀察值,一般用頻次分布、頻率分布和累積頻率分布三種方法描述變量分布。 1、頻次分布:變量取值與取值上擁有的個(gè)體數(shù)的集合稱為頻次分布。若變量有m個(gè)取值,則該變量的頻次分布可表示為: 一、變量及其分布 (二)變量的分布 2、頻率分布:變量取值與取值上擁有的個(gè)體數(shù)的頻率的集合稱為頻率分布。將頻率分布的頻率乘以100%,即是百分比。頻率分布可以表示為: 一、變量及其分布 (二)變量的分布 3、累計(jì)頻率分布:將上述頻率分布中的頻率按變量的取值排列順序逐項(xiàng)累加就形成累積頻率分布。分布可以表示為: 一、變量及其分布 (二)變量的分布 關(guān)于頻次分布、頻率分布和累計(jì)頻率分布的總結(jié) 可以清楚地表現(xiàn)數(shù)據(jù)的分布特征和統(tǒng)計(jì)規(guī)律,但只適用于類別變量。例如文化程度、職業(yè)、職稱等。 對(duì)取值很多的尺度變量,通常將變量的取值劃分成段,如年齡段、收入段,再累計(jì)該段中的人數(shù),來表示變量的分布。 尺度變量取值的數(shù)據(jù)有兩種: 離散性數(shù)據(jù),如年齡。通常取整數(shù),在相鄰的兩個(gè)數(shù)之間不存在其它的數(shù)據(jù)。 連續(xù)性數(shù)據(jù),如身高。如果測(cè)量的單位可以達(dá)到無窮小的話,理論上,任何兩個(gè)數(shù)之間都有無窮多個(gè)數(shù)。尺度變量的分布在統(tǒng)計(jì)表中予以詳細(xì)說明。 二、統(tǒng)計(jì)表 表現(xiàn)數(shù)據(jù)分布的最常用方法是統(tǒng)計(jì)表。將數(shù)據(jù)按照一定的順序排列在由橫行、縱列交叉結(jié)合而成的表格上。 (一)統(tǒng)計(jì)表的結(jié)構(gòu) 統(tǒng)計(jì)表可分為橫表與豎表,應(yīng)用較多的是豎表(教材表2-1)。 (二)描述類別變量分布特征的統(tǒng)計(jì)表——簡(jiǎn)單表 簡(jiǎn)單表:主詞按變量的取值一一列出,適用于表現(xiàn)類別變量的分布。主詞是類別變量的取值,賓詞是各個(gè)取值出現(xiàn)的頻次、頻率或百分比及累計(jì)頻率或累計(jì)百分比等。 (教材表2-2)。 二、統(tǒng)計(jì)表 (三)描述尺度變量分布特征的統(tǒng)計(jì)表——分組表 1、分組表的特點(diǎn):尺度變量取值很多,可以采用分組表來表現(xiàn)尺度變量的分布特征。分組表的主詞是將變量的取值按一定的標(biāo)準(zhǔn)分組或分段的統(tǒng)計(jì)表。主詞中每個(gè)組的最大值稱為組上限,最小值稱為組下限 。(教材表2-3) 二、統(tǒng)計(jì)表 (三)描述尺度變量分布特征的統(tǒng)計(jì)表——分組表 1、分組表的制作步驟: (1)確定全距。全距就是變量觀察值的最大值與最小值之差。 (2)確定組距與組數(shù)。一般是2、3、5、10或它們的倍數(shù)。 (3)確定各組的上下限。最低組的下限要小于最小的觀察值,最高組的上限要大于最大的觀察值。連續(xù)型數(shù)據(jù)的一組的下限與下一組的上限為同一值,習(xí)慣上以組的上限為實(shí),下限為虛。(即“下組限不包括在內(nèi)”的原則) (4)登記各組中個(gè)案的頻次,計(jì)算頻率。將個(gè)案按照變量取值大小劃分到各組中,按需要統(tǒng)計(jì)出頻次、頻率及累計(jì)頻率等,并將統(tǒng)計(jì)出的數(shù)據(jù)置于相應(yīng)單元格內(nèi),繪制成分組表。 二、統(tǒng)計(jì)表 (三)描述尺度變量分布特征的統(tǒng)計(jì)表——分組表 1、分組表的制作步驟:確定全距;確定組距與組數(shù);確定各組的上下限。;登記各組中個(gè)案的頻次,計(jì)算頻率。 二、統(tǒng)計(jì)圖 統(tǒng)計(jì)圖就是用圖的形式來表示變量的分布特征。 比統(tǒng)計(jì)表更直觀、生動(dòng)、易記憶,缺點(diǎn)是不如統(tǒng)計(jì)表精確。 變量的測(cè)量層次不同,使用的圖形也不盡相同。 不同類型的圖形表示數(shù)據(jù)大小的方式不同。 用圖形表現(xiàn)數(shù)據(jù)的分布特征時(shí)有一定的規(guī)范和要求。每個(gè)圖的左下方都要有圖的編號(hào),圖的正下方要有圖的名稱,用以簡(jiǎn)明扼要地說明圖的內(nèi)容。如有其它的說明可以在圖的下面寫出圖注。如果圖中有多種繪圖元素,可以用圖例的形式予以說明。 二、統(tǒng)計(jì)圖 (一)描述類別變量分布特征的統(tǒng)計(jì)圖 1、簡(jiǎn)單條形圖: 條形的長(zhǎng)短或高低來表示數(shù)據(jù)大小。以類別變量的取值為橫軸的分類標(biāo)志,以縱軸表示頻次或頻率。 (教材圖2-1) 二、統(tǒng)計(jì)圖 (一)描述類別變量分布特征的統(tǒng)計(jì)圖 2、圓形圖:也稱餅圖。一般用于描述類別變量中各類別所占的比例。是以一個(gè)圓為整體,以每一部分所占的比例來分割圓心角,圓心角所對(duì)應(yīng)的扇形即表示每一部分所占的比例。 二、統(tǒng)計(jì)圖 (一)描述類別變量分布特征的統(tǒng)計(jì)圖 3、線形圖:線形圖是在坐標(biāo)系內(nèi)用折線或連續(xù)曲線表示事物的分布或變化的圖。 二、統(tǒng)計(jì)圖 (二)描述尺度變量分布特征的統(tǒng)計(jì)圖 1、直方圖: 描述尺度變量分布,用條形長(zhǎng)短或高低來表現(xiàn)數(shù)據(jù)大小。 與簡(jiǎn)單條形圖不同的是,條的寬度表示分組的組距,條與條之間不分離。 直方圖以尺度變量為橫軸,以分組的組限為橫軸的數(shù)據(jù)標(biāo)志,以縱軸表示頻次或頻率。 分組表的數(shù)據(jù)就可以用直方圖來表示。 用表2-4的頻率分布數(shù)據(jù)制作的直方圖如圖2-4所示。 簡(jiǎn)單條形圖 用于描述類別變量的分布 直方圖 用于描述尺度變量的分布 二、統(tǒng)計(jì)圖 (二)描述尺度變量分布特征的統(tǒng)計(jì)圖 2、累積頻率直方圖:以尺度變量為橫軸,以分組的組限為橫軸的數(shù)據(jù)標(biāo)志,以縱軸表示累積頻率,制作的直方圖就是累積頻率直方圖。用表2-4的累積頻率分布數(shù)據(jù)制作的累積頻率直方圖如圖2-6所示。 二、統(tǒng)計(jì)圖 (二)描述尺度變量分布特征的統(tǒng)計(jì)圖 3、線形圖:將直方圖或累計(jì)頻率直方圖每條頂部的中點(diǎn)用直線連接即構(gòu)成描述尺度變量分布的線形圖。 (二)描述尺度變量分布特征的統(tǒng)計(jì)圖 4、點(diǎn)狀分布圖:直方圖雖能較好表現(xiàn)尺度變量的分布特征。但它通過分組將尺度變量轉(zhuǎn)化成了順序變量,組內(nèi)數(shù)據(jù)值無法表現(xiàn)。若數(shù)據(jù)量足夠大,可用點(diǎn)狀分布圖來詳細(xì)地表現(xiàn)變量的分布特征。點(diǎn)狀分布圖以尺度變量為橫軸,用點(diǎn)的累積表現(xiàn)變量取值上的個(gè)體數(shù)。 用圖和表的形式雖然能夠很好地表現(xiàn)變量的分布狀況,但是不夠簡(jiǎn)潔,尤其是將不同的總體或樣本進(jìn)行比較時(shí),使用表或圖難以得出清晰的結(jié)論。 很多情況下,我們不需要對(duì)所有的數(shù)據(jù)都有詳盡的了解。在對(duì)不同總體進(jìn)行比較時(shí),也不可能一一地使用每一個(gè)數(shù)據(jù),這就需要對(duì)變量的全部取值進(jìn)行概括,找出一個(gè)典型的統(tǒng)計(jì)特征值來代表全體數(shù)據(jù)。 集中趨勢(shì)(和離散趨勢(shì))就是概括地說明變量的狀態(tài)或水平的統(tǒng)計(jì)特征值。由于測(cè)量層次不同,變量取值的數(shù)據(jù)特征不同,用于概括變量狀態(tài)的集中趨勢(shì)也不同。 常用的集中趨勢(shì)統(tǒng)計(jì)量:眾數(shù);中位數(shù);算數(shù)平均數(shù)。 常用的離散趨勢(shì)統(tǒng)計(jì)量:異眾比率;極差(全距);四分位差;方差與標(biāo)準(zhǔn)差。 一、眾數(shù)M0 眾數(shù)(mode)根據(jù)頻次來確定的集中趨勢(shì)量值。在一個(gè)變量的取值中,出現(xiàn)頻次最多的變量值就是眾數(shù)。 表2-1中,“初中”是我國(guó)家庭戶主文化程度的眾數(shù)。 一、眾數(shù)M0 關(guān)于眾數(shù)的幾點(diǎn)注意事項(xiàng) (1)眾數(shù)適用于任何層次的變量,只要是知道了頻次分布就可以找到眾數(shù)。但主要用于概括和描述類別變量。 (2)對(duì)于分組的尺度變量,出現(xiàn)頻次最高的組稱為眾數(shù)組,可以用眾數(shù)組的組中值(組上限和組下限的平均值 )近似地代替眾數(shù)。分組數(shù)據(jù)的眾數(shù)可以精確計(jì)算 (可進(jìn)一步參見李金昌、蘇為華,《統(tǒng)計(jì)學(xué)》,機(jī)械工業(yè)出版社,2007年2月出版,72頁)。但計(jì)算出來的眾數(shù)只是理論眾數(shù),并非實(shí)際上取值最多的數(shù)據(jù)。) (3)眾數(shù)較適用于單峰分布的情況。多峰分布的眾數(shù)可能不唯一,所以通常不使用眾數(shù)來概括變量分布的狀態(tài)。 二、中位數(shù)Md 中位數(shù)(median)是位于數(shù)列中點(diǎn)的數(shù)值,它恰好把全部數(shù)據(jù)分為兩半,比它大的數(shù)據(jù)個(gè)數(shù)與比它小的數(shù)據(jù)個(gè)數(shù)正好相等。 因?yàn)榇_定中位數(shù)需要比較數(shù)據(jù)的大小,因此定序以上的變量才可以使用。 但如果一個(gè)序列變量的取值很少,也不適合用中位數(shù)作為集中趨勢(shì)來概括全部數(shù)據(jù)。 實(shí)際上,中位數(shù)適用于取值很多的序列變量和尺度變量。 二、中位數(shù)Md (一)未分組數(shù)據(jù)中位數(shù)的計(jì)算 對(duì)于原始的數(shù)據(jù),只要將數(shù)據(jù)按大小順序排成數(shù)列即可以找到中位數(shù)。 二、中位數(shù)Md (二)分組數(shù)據(jù)中位數(shù)的計(jì)算 在分組數(shù)據(jù)中,因?yàn)闆]有了數(shù)據(jù)的原始值,無法直接尋找中位數(shù),需要先找到中位數(shù)組,第N/2 個(gè)數(shù)據(jù)所在的組為中位數(shù)組。確定中位數(shù)組以后利用式(2-2)計(jì)算中位數(shù): 分組數(shù)據(jù)的中位數(shù)計(jì)算舉例 三、算數(shù)平均數(shù) 算術(shù)平均值簡(jiǎn)稱平均值,是全部數(shù)據(jù)的平均水平。算術(shù)平均值主要適用于尺度變量。 (一)未分組數(shù)據(jù)算數(shù)平均值的計(jì)算 1、根據(jù)原始數(shù)據(jù)計(jì)算 對(duì)于變量的一組觀察值,可以用原始數(shù)據(jù)來直接計(jì)算算數(shù)平均值。計(jì)算公式為: 三、算數(shù)平均數(shù) (一)未分組數(shù)據(jù)算數(shù)平均值的計(jì)算 1、根據(jù)原始數(shù)據(jù)計(jì)算 三、算數(shù)平均數(shù) (一)未分組數(shù)據(jù)算數(shù)平均值的計(jì)算 2、根據(jù)頻次數(shù)據(jù)計(jì)算 三、算數(shù)平均數(shù) (二)分組數(shù)據(jù)的算數(shù)平均數(shù)計(jì)算 如果數(shù)據(jù)存在于分組表中,則以組中值來代替原始值計(jì)算分組數(shù)據(jù)的平均值。設(shè)數(shù)據(jù)被分為k組,每組的組中值( 組上限和組下限的平均值)為bi ,每組的頻次為ni 。則分組數(shù)據(jù)的平均值的計(jì)算公式為: 四、眾數(shù)、中位數(shù)和平均值的比較 (二)分組數(shù)據(jù)的算數(shù)平均數(shù)計(jì)算 僅描述觀察值的集中趨勢(shì)遠(yuǎn)遠(yuǎn)不夠,還需要找到一些表示數(shù)據(jù)分散程度的統(tǒng)計(jì)特征值。 主要原因有二: 原因1:變量的取值范圍不同,集中趨勢(shì)的代表性不同。 例如: 中國(guó)職工年平均工資, 1978年為615元,2009年則是29229元。 1978年職工年工資的分布是在216元到3600元之間。 2009年職工年工資的分布是在6900元到數(shù)萬元之間。 因此,有理由認(rèn)為: 1978年的615元對(duì)當(dāng)年職工工資總體的代表性高于2009年的29229元。 僅描述觀察值的集中趨勢(shì)遠(yuǎn)遠(yuǎn)不夠,主要原因有二: 原因1:變量的取值范圍不同,集中趨勢(shì)的代表性不同。 原因2:變量取值范圍即便相同,但變量分布特征不同時(shí),集中趨勢(shì)的代表性也不同。 例如:兩個(gè)班級(jí)的數(shù)學(xué)成績(jī)均值均為82.64分。變量值的分布范圍均為從60分到100分(取值分布見教材圖20-10)。 一、異眾比率 (一)含義:非眾數(shù)在數(shù)據(jù)總數(shù)N中所占的比例。 二、極差(全距) (一)含義:極差是變量取值的范圍。極差一般用R(Range)來表示。 R=最大值—最小值 三、四分位差 (一)含義:對(duì)于定序以上變量,將數(shù)據(jù)按大小排成數(shù)列以后,從下向上數(shù)第25%的數(shù)據(jù)所在位置的值稱為下四分位數(shù),用Q25表示。從下向上數(shù)第75%的數(shù)據(jù)所在位置的值稱為上四分位數(shù),用Q75表示。上下四分位數(shù)之差即為四分位差,一般用Q(quartiles)來表示。 Q = Q75 - Q25 式(2-7) 三、四分位差 (三)未分組數(shù)據(jù)四分位差的計(jì)算: 計(jì)算四分位差要先計(jì)算上下四分位數(shù),為此,需要先確定上下兩個(gè)四分位數(shù)的位置,找到兩個(gè)分位值后相減即得四分位差。根據(jù)四分位數(shù)的定義可得: 【例2-6】一組數(shù)據(jù)是某單位49名職工的住房面積。計(jì)算住房面積分布的四分位差。 某單位職工的住房面積(單位:平方米) 33、42、42、48、48、52、55、58、62、65、65、65、66、66、66、66、68、68、68、68、68、70、70、70、72、72、72、72、75、75、75、76、76、78、85、87、90、92、95、98、103、109、110、112、118、125、130、178、179 解: n=49 Q25 的位置=n/4=49/4=12.25,第12.25個(gè)數(shù)據(jù)兩側(cè)的數(shù)據(jù)是65和66。因此,下四分位數(shù)為: Q25 =65+0.25(66-65)=65.25 同理,Q75 的位置=3n/4=3*49/4=36.75 ,第36.75個(gè)數(shù)據(jù)兩側(cè)的數(shù)據(jù)是87和90。因此,上四分位數(shù)為:Q75=87+0.75(90-87)=89.25 因此,四分位差為: Q=Q75-Q25 =89.25-65.25=25 即:員工住房使用面積中間50%的數(shù)據(jù)的離散范圍為25平方米。 四、方差與標(biāo)準(zhǔn)差 極差和四分位差能較好地表明數(shù)據(jù)離散情況,但只給出了數(shù)據(jù)的分布范圍,只利用了數(shù)據(jù)的部分信息。極差和四分位差相等的兩組數(shù)據(jù)其分布情況可能差異很大。對(duì)于尺度變量概括其離散程度最好的特征值是方差和標(biāo)準(zhǔn)差。 (一)平均差 1、離差:變量的一個(gè)觀察值與變量平均值之間的差。 四、方差與標(biāo)準(zhǔn)差 (二)方差、標(biāo)準(zhǔn)差 方差和標(biāo)準(zhǔn)差是用平方的方法消除了離差中的絕對(duì)值后形成的統(tǒng)計(jì)特征值。方差是離差平方的平均值,標(biāo)準(zhǔn)差是方差的平方根。 四、方差與標(biāo)準(zhǔn)差 (二)方差、標(biāo)準(zhǔn)差 1、用原始數(shù)據(jù)計(jì)算方差、標(biāo)準(zhǔn)差 直接使用式(2-13)和(2-14)。 【例2-8】 五名學(xué)生數(shù)學(xué)成績(jī)分別為72、81、86、69、57,計(jì)算這五名學(xué)生數(shù)學(xué)成績(jī)分布的方差和標(biāo)準(zhǔn)差。 四、方差與標(biāo)準(zhǔn)差 (二)方差、標(biāo)準(zhǔn)差 2、用頻次分布數(shù)據(jù)計(jì)算方差和標(biāo)準(zhǔn)差 設(shè)變量有k個(gè)取值,每個(gè)取值出現(xiàn)的頻次為ni,則利用頻次分布數(shù)據(jù)計(jì)算方差和標(biāo)準(zhǔn)差的公式為: 四、方差與標(biāo)準(zhǔn)差 (二)方差、標(biāo)準(zhǔn)差 3、用分組數(shù)據(jù)計(jì)算方差和標(biāo)準(zhǔn)差 用每一組的組中值來代替該組的變量值計(jì)算方差和標(biāo)準(zhǔn)差,用分組數(shù)據(jù)計(jì)算方差和標(biāo)準(zhǔn)差的公式為: 參見教材習(xí)題2-1到2-8。 第三章 兩個(gè)類別變量關(guān)系的描述統(tǒng)計(jì) 社會(huì)學(xué)研究中不僅要對(duì)單個(gè)變量的分布進(jìn)行描述,更多的是要分析變量之間的關(guān)系。比如,分析性別與體育愛好的關(guān)系、職業(yè)與政治參與的關(guān)系、文化程度與生育子女?dāng)?shù)量的關(guān)系、收入與住房面積的關(guān)系等等。 對(duì)測(cè)量層次不同的變量之間的關(guān)系,其分析方法也不同。 分析兩個(gè)類別變量的關(guān)系,如性別與職業(yè)的關(guān)系、性別與文化程度的關(guān)系、文化程度與生活滿意度之間的關(guān)系等等,可采用三種方法: 交叉列表:從兩個(gè)變量的交叉分布來分析兩者關(guān)系。 分類圖:直觀地表現(xiàn)變量間的關(guān)系。 相關(guān)系數(shù):精確地描述變量之間關(guān)系的強(qiáng)度。 一、兩個(gè)類別變量相關(guān)的概念 如果有兩個(gè)類別變量,在一個(gè)變量取不同類別時(shí),另一個(gè)變量的分布有顯著差異。則認(rèn)為兩個(gè)類別變量相關(guān)。如果一個(gè)變量取不同類別時(shí),另一個(gè)變量的分布沒有顯著差異,就認(rèn)為這兩個(gè)變量不相關(guān)。 兩個(gè)類別變量之間的關(guān)系要通過兩個(gè)變量的交叉分布來描述。這種分析方法稱為交叉列表分析,構(gòu)成的表格稱為交叉表或列聯(lián)表。兩個(gè)類別變量之間的相關(guān)也稱為列聯(lián)相關(guān)。 二、列聯(lián)表的結(jié)構(gòu) 列聯(lián)表也是統(tǒng)計(jì)表的一種,它與簡(jiǎn)單表和分組表不同的是,在一個(gè)表中表現(xiàn)了兩個(gè)不同變量的分布,因此也被稱為復(fù)合表。 表的主詞和表頭分別是兩個(gè)變量的取值。表身中單元格的數(shù)據(jù)是兩個(gè)變量交叉后的頻次或頻率分布。 三、列聯(lián)表的種類 設(shè) x與y是兩個(gè)類別變量, x分為x1, x2…xr共r 類,y分為y1, y2…yc共c 類,數(shù)據(jù)總個(gè)數(shù)為n 。 根據(jù)列聯(lián)表中單元格數(shù)據(jù)的不同,列聯(lián)表可分為頻次分布的列聯(lián)表和頻率分布的列聯(lián)表。 三、列聯(lián)表的種類 (一)頻次分布的列聯(lián)表 三、列聯(lián)表的種類 (一)頻率分布的列聯(lián)表 四、列聯(lián)表中的分布 (一)聯(lián)合分布:即列聯(lián)表中間部分的數(shù)據(jù) nij或 pij,它們都是由兩個(gè)變量共同決定的。 (二)邊緣分布:列聯(lián)表中最下面一行nj或 pj是變量y的分布,最右面一列ni或pi是變量x的分布。 (三)條件分布: 如果將一個(gè)變量取固定值,另一個(gè)變量的分布就是條件分布。 使用條件分布的目的是要看當(dāng)一個(gè)變量取不同類別時(shí)另一個(gè)變量的分布是否有差異。這種差異通過頻次分布難以表現(xiàn),所以條件分布大都是采用頻率分布。 用單元格的頻次除以對(duì)應(yīng)列的總頻次,即nij/nj構(gòu)成的分布稱為關(guān)于x的條件分布,也就是當(dāng)y取固定值時(shí)x的分布。 同理, nij/ni*構(gòu)成的分布稱為關(guān)于y條件分布。 五、列聯(lián)表中變量的相互獨(dú)立性 在列聯(lián)表中,可以通過比較條件分布來研究類別變量之間的關(guān)系。當(dāng)一個(gè)變量取不同類別時(shí),另一個(gè)變量的分布有差異,即說明兩個(gè)變量是相關(guān)的。 從頻率分布看,兩個(gè)變量相互獨(dú)立的表現(xiàn)形式是條件分布等于邊緣分布。(推導(dǎo)見教材式3-1到3-4) 一、分類條形圖 以一個(gè)變量的取值作為橫軸的標(biāo)記,用另一個(gè)變量的取值來分類。以不同標(biāo)志點(diǎn)上分類變量的頻次或頻率作為條的長(zhǎng)度繪制條形圖。 如果在每個(gè)標(biāo)志點(diǎn)上分類變量各個(gè)條長(zhǎng)基本相等,則說明兩個(gè)變量基本不相關(guān)。 二、分類圓形圖 描述變量各取值上的個(gè)案數(shù)在總數(shù)中所占的比例。 多個(gè)圓形可以分開畫,也可以從大到小疊在一起。 如果在不同的圓形中各個(gè)扇形所占的比例基本相同,就可以認(rèn)為兩個(gè)變量不相關(guān)。 三、多線圖 在坐標(biāo)系內(nèi)繪制分類變量取不同值時(shí),另一個(gè)變量分布的多條折線。 如果這些折線基本重合,或者相差不大,則認(rèn)為兩個(gè)變量不相關(guān)。 圖表法只能粗略說明兩個(gè)變量間是否相關(guān),為精確度量變量之間關(guān)系的強(qiáng)度和方向,統(tǒng)計(jì)學(xué)家根據(jù)不同測(cè)量層次的變量建構(gòu)了一系列的統(tǒng)計(jì)指標(biāo),這就是相關(guān)系數(shù)。 兩個(gè)無序類別變量之間的關(guān)系可以用列聯(lián)相關(guān)系數(shù)來描述。在多年的統(tǒng)計(jì)實(shí)踐過程中,統(tǒng)計(jì)學(xué)家建構(gòu)了多個(gè)列聯(lián)相關(guān)系數(shù)。概括起來,基于兩種方法,一是基于消減誤差比例的方法來建構(gòu),二是基于卡方值來建構(gòu)。后者將在卡方檢驗(yàn)中予以介紹,本節(jié)只介紹基于消減誤差比例的方法建構(gòu)的列聯(lián)相關(guān)系數(shù)。 列聯(lián)相關(guān)系數(shù)是描述兩個(gè)類別變量關(guān)系的特征值。由于有更好的特征值來描述兩個(gè)有序類別變量之間的關(guān)系強(qiáng)度。因此,列聯(lián)相關(guān)系數(shù)主要用于描述兩個(gè)無序類別變量,或是一個(gè)無序類別變量與一個(gè)有序類別變量之間的關(guān)系。 一、消減誤差比例的統(tǒng)計(jì)思想 (一)引例 比如有4名學(xué)生,某次考試成績(jī)的平均分是80分。如果猜測(cè)每名學(xué)生的考分,唯一可以參考的信息就是平均成績(jī)。只能猜測(cè)每人都得80分。實(shí)際上,這4名學(xué)生的成績(jī)是90、85、75、70。猜測(cè)所產(chǎn)生的總誤差是: 一、消減誤差比例的統(tǒng)計(jì)思想 (一)引例 知道性別與考試分?jǐn)?shù)之間的關(guān)系后,預(yù)測(cè)減少的誤差比例是: 一、消減誤差比例的統(tǒng)計(jì)思想 (二)消減誤差比例的一般思想 在沒有任何可參考的信息下猜測(cè)一個(gè)事物時(shí)會(huì)有很大的盲目性,而借助一個(gè)與被猜測(cè)的事物有關(guān)的事物來進(jìn)行猜測(cè),就會(huì)減少盲目性,提高猜測(cè)的準(zhǔn)確性。 如果兩個(gè)變量相關(guān),借助一個(gè)變量去猜測(cè)另一個(gè)變量時(shí)會(huì)消減掉猜測(cè)誤差。消減掉的誤差大,說明兩個(gè)變量之間的密切程度高。消減掉的誤差小,說明兩個(gè)變量之間的密切程度低。 這樣,消減掉誤差的大小就可以成為測(cè)量?jī)蓚(gè)變量之間關(guān)系密切程度的指標(biāo)。 一、消減誤差比例的統(tǒng)計(jì)思想 (三)消減誤差比例的計(jì)算公式 設(shè)有兩個(gè)變量x和y,觀察的個(gè)案數(shù)為n。 直接猜測(cè)每個(gè)個(gè)體在y變量上的取值,是一種盲目猜測(cè),必然產(chǎn)生誤差。猜測(cè)n個(gè)個(gè)案所產(chǎn)生的總誤差為E1。 如果每個(gè)個(gè)體在x變量上的取值是已知的,可以借助個(gè)體在x變量上的取值來猜測(cè)其在y變量上的取值,此時(shí)所產(chǎn)生的總誤差為E2 。消減誤差比例(Percent reduce error)為: 二、 λ系數(shù) λ系數(shù)就是基于消減誤差比例的思想建構(gòu)的列聯(lián)相關(guān)系數(shù)。利用PRE原理計(jì)算相關(guān)系數(shù)的關(guān)鍵是如何確定 E1和E2 。 (一)引例 在某城市社區(qū)隨機(jī)抽取了60歲以上的老年人,男、女各100人。他們是否愿意去老年公寓養(yǎng)老的態(tài)度分布如表3-10所示。從表3-10中可以看出老年人是否愿意去老年公寓養(yǎng)老的態(tài)度與性別是相關(guān)的。要計(jì)算這兩個(gè)變量的相關(guān)系數(shù)要先定義E1和E2。 二、 λ系數(shù) (一)引例 二、 λ系數(shù) (二)λ系數(shù)的計(jì)算公式 假設(shè)只知道類別變量x的分布,即y的邊緣分布已知。要猜測(cè)每個(gè)個(gè)案y的取值,唯一可參考的就是變量y的分布。此時(shí)用眾數(shù)來猜測(cè)所有個(gè)案要比用其它值來猜測(cè)產(chǎn)生的誤差小。 設(shè)y變量眾數(shù)的頻次為max(n*j) ,猜測(cè)誤差E1為: E1 = n - max(n*j) (3-6) 假設(shè)已知道x與y有關(guān),就可以根據(jù) x取不同值時(shí)y分布的眾數(shù)來猜測(cè)每個(gè)個(gè)案的 y。即根據(jù)條件分布的眾數(shù)來猜測(cè)y。 設(shè)每一行的眾數(shù)分別為max(n1j) 、 max(n2j) … max(nrj),r=1,…c,猜測(cè)誤差E2為: 二、 λ系數(shù) (二)λ系數(shù)的計(jì)算公式 E1 = n - max(n*j 二、 λ系數(shù) (三)λ系數(shù)的幾個(gè)注意事項(xiàng) 1、λ系數(shù)的取值范圍是0到1。 2、λ系數(shù)具有不對(duì)稱性,借助y來猜測(cè)x時(shí),定義的E1、E2 是不同的,此時(shí)公式為: 二、 λ系數(shù) (三)λ系數(shù)的幾個(gè)注意事項(xiàng) 3、如果兩個(gè)變量之間具有明確意義上的因果關(guān)系,習(xí)慣上將 設(shè)為自變量,將 設(shè)為因變量。當(dāng)兩個(gè)變量之間的因果關(guān)系不太明確的情況下可以計(jì)算λy 和λx 的加權(quán)平均數(shù)來作為兩個(gè)變量的列聯(lián)相關(guān)系數(shù)。計(jì)算方法如下: 二、 λ系數(shù) (四)λ系數(shù)的算例: 【例3-2】計(jì)算表3-1中殘疾人的文化程度與性別的 λ系數(shù)。 三、 Goodman-Kruskal Tau(古德曼-克魯斯卡爾 )系數(shù) λ系數(shù)的E1、E2 的定義簡(jiǎn)潔、明確,計(jì)算簡(jiǎn)單,有較多的應(yīng)用。其缺點(diǎn)是只使用了各行或各列的眾數(shù),沒有充分利用數(shù)據(jù)的信息。 系數(shù)也是基于消減誤差比例的思想建構(gòu)的列聯(lián)相關(guān)系數(shù),但是對(duì)于E1、E2的定義與λ系數(shù)有所不同。 (一)引例 以表3-10中不同性別老年人對(duì)去公寓養(yǎng)老的態(tài)度為例,說明 系數(shù)計(jì)算中 E1、E2 的定義方法。 三、 Goodman-Kruskal Tau(古德曼-克魯斯卡爾 )系數(shù) (二) 系數(shù)的計(jì)算公式 三、 Goodman-Kruskal Tau(古德曼-克魯斯卡爾 )系數(shù) (三) 系數(shù)的算例 【例3-4】計(jì)算表3-1中殘疾人文化程度與性別的 系數(shù)。 一、等級(jí)相關(guān)的概念 (一)含義: 等級(jí)相關(guān)指的是兩個(gè)有序類別變量之間的相關(guān)。如果有兩個(gè)有序類別變量,在一個(gè)變量取不同等級(jí)時(shí),另一個(gè)變量的分布有較大差異,則認(rèn)為兩個(gè)有序類別變量存在等級(jí)相關(guān)。 (二)適用條件: 用于刻畫兩個(gè)有序類別變量的關(guān)系。兩個(gè)有序類別變量之間的關(guān)系,盡管也可以用分類條形圖、分類圓形圖和多線圖進(jìn)行描述,但變量間的關(guān)系強(qiáng)度則需要用等級(jí)相關(guān)系數(shù)來描述。 由于有序類別變量的取值具有了比較大小的意義,變量的變化具有了方向性。因此相關(guān)系數(shù)也具有了方向性。如果兩個(gè)變量的變化方向一致則說明兩個(gè)變量是正相關(guān),如果兩個(gè)變量的變化方向相反則說明兩個(gè)變量是負(fù)相關(guān)。等級(jí)相關(guān)系數(shù)的正負(fù)號(hào)表明的就是相關(guān)的方向。 二、Spearman(斯皮爾曼)等級(jí)相關(guān)系數(shù) (一)建構(gòu)斯皮爾曼等級(jí)相關(guān)系數(shù)的統(tǒng)計(jì)思想 根據(jù)個(gè)案在兩個(gè)變量上的等級(jí)差值的大小來測(cè)量相關(guān)度。 將兩個(gè)變量的兩組數(shù)據(jù)分別排序以后,每個(gè)個(gè)案在兩個(gè)變量上分別獲得了一個(gè)等級(jí)。 如果兩個(gè)變量有比較強(qiáng)的正相關(guān),個(gè)案的兩個(gè)等級(jí)差就會(huì)比較小,所有個(gè)案的兩個(gè)等級(jí)差值的平方和也會(huì)比較小。反之,如果兩個(gè)變量有比較強(qiáng)的負(fù)相關(guān),個(gè)案的兩個(gè)等級(jí)差就會(huì)比較大,所有個(gè)案的兩個(gè)等級(jí)差值的平方和也會(huì)比較大。 因此,個(gè)案的兩個(gè)等級(jí)差值的平方和可以用來測(cè)量?jī)蓚(gè)變量的等級(jí)相關(guān)。 (二)斯皮爾曼等級(jí)相關(guān)系數(shù)的計(jì)算 1、無相同等級(jí)時(shí)的斯皮爾曼等級(jí)相關(guān)系數(shù)的計(jì)算 設(shè)變量x與y均為有序類別變量,且不含有相同等級(jí)。也就是說在任何一個(gè)變量上不存在兩個(gè)個(gè)案取值相同的情況,每個(gè)個(gè)案占有一個(gè)等級(jí)。斯皮爾曼等級(jí)相關(guān)系數(shù)的計(jì)算公式為: 1、無相同等級(jí)時(shí)的斯皮爾曼等級(jí)相關(guān)系數(shù)的計(jì)算 【例3-5】表3-12是14名學(xué)生的數(shù)學(xué)成績(jī)與物理成績(jī)。計(jì)算學(xué)生的數(shù)學(xué)成績(jī)與物理成績(jī)的斯皮爾曼等級(jí)相關(guān)系數(shù)。 二、Spearman(斯皮爾曼)等級(jí)相關(guān)系數(shù) (二)斯皮爾曼等級(jí)相關(guān)系數(shù)的計(jì)算 2、有相同等級(jí)時(shí)的斯皮爾曼等級(jí)相關(guān)系數(shù)的計(jì)算 如果在一個(gè)變量中兩個(gè)個(gè)案的取值相等,就會(huì)出現(xiàn)相同等級(jí)。在統(tǒng)計(jì)學(xué)中,相同等級(jí)也被稱為“結(jié)(Tie)”。 對(duì)于結(jié),一般采用具有相同等級(jí)的個(gè)案所應(yīng)占有的平均等級(jí)作為它們的共同等級(jí),以保證個(gè)案數(shù)與等級(jí)數(shù)基本一致。 由于斯皮爾曼等級(jí)相關(guān)系數(shù)要求沒有相同等級(jí),因此當(dāng)變量的取值不是很多,但個(gè)案數(shù)很多時(shí),這個(gè)要求是難以滿足的。 當(dāng)相同等級(jí)不太多時(shí),也可以計(jì)算斯皮爾曼等級(jí)相關(guān)系數(shù)。(太多則應(yīng)用Gamma等級(jí)相關(guān)系數(shù)) 【例3-6】 表3-13也是14名學(xué)生的數(shù)學(xué)成績(jī)與物理成績(jī),但其中含有相同等級(jí)。計(jì)算學(xué)生的數(shù)學(xué)成績(jī)與物理成績(jī)的斯皮爾曼等級(jí)相關(guān)系數(shù)。(注意表中結(jié)的處理) 三、Gamma等級(jí)相關(guān)系數(shù) 數(shù)據(jù)中存在大量的相同等級(jí)時(shí),可以用Gamma等級(jí)相關(guān)系數(shù)來描述兩個(gè)有序類別變量之間的相關(guān)程度。 Gamma等級(jí)相關(guān)系數(shù)是用同序?qū)εc異序?qū)Φ臄?shù)量差來測(cè)量?jī)蓚(gè)變量相關(guān)程度的。 (一)同序?qū)εc異序?qū)? 三、Gamma等級(jí)相關(guān)系數(shù) (一)同序?qū)εc異序?qū)? 三、Gamma等級(jí)相關(guān)系數(shù) (一)同序?qū)εc異序?qū)? 三、Gamma等級(jí)相關(guān)系數(shù) (二)Gamma等級(jí)相關(guān)系數(shù)的計(jì)算 1、公式:如果同序?qū)Χ喈愋驅(qū)ι,則表明兩個(gè)變量之間有正相關(guān);如果異序?qū)Χ嗤驅(qū)ι,則表明兩個(gè)變量之間有負(fù)相關(guān)。 四、Kendall’s Tau(肯德爾τ)系數(shù) Gamma等級(jí)相關(guān)系數(shù)只考慮同序?qū)εc異序?qū),沒考慮同分對(duì)。這在同分對(duì)非常多的情況下會(huì)使計(jì)算出的相關(guān)系數(shù)偏大。統(tǒng)計(jì)學(xué)家肯德爾對(duì)此進(jìn)行了修正,提出一系列等級(jí)相關(guān)的計(jì)算公式。此處僅介紹Kendall’s Tau-c( ) 五、Somer’s d 系數(shù) Somer 也考慮了同分對(duì),給了dyx和dxy相關(guān)系數(shù),并將其均值作為兩個(gè)變量的等級(jí)相關(guān)系數(shù)。 參見教材習(xí)題3-1至3-5。 第四章 兩個(gè)尺度變量關(guān)系的描述統(tǒng)計(jì) 社會(huì)調(diào)查中涉及到的尺度變量有兩個(gè)特點(diǎn),一是數(shù)據(jù)分布的全距大,二是變量的取值多。 如果制作列聯(lián)表會(huì)產(chǎn)生分布極其分散的巨型表格,無法表現(xiàn)出變量之間的關(guān)系特征。因此,尺度變量之間的關(guān)系不適宜用列聯(lián)表來描述。 一般來說,尺度變量之間的相關(guān)既可以用散點(diǎn)圖來形象地描述,也可以用相關(guān)系數(shù)來概括地描述。 如果變量之間存在因果關(guān)系,還可以用回歸方程來描述因變量隨自變量變化的狀況。 一、相關(guān)的概念 兩個(gè)尺度變量之間的相關(guān)關(guān)系,指的是兩個(gè)變量在變化過程中數(shù)量上的依存關(guān)系。 當(dāng)一個(gè)變量變化時(shí)另一個(gè)變量也會(huì)出現(xiàn)相應(yīng)的變化。這兩個(gè)變量之間就存在相關(guān)關(guān)系。 如果一個(gè)變量變大時(shí)另一個(gè)變量也隨之變大,或是一個(gè)變量變小時(shí)另一個(gè)變量也隨之變小,這兩個(gè)變量之間是正相關(guān)。 反之,當(dāng)一個(gè)變量變大時(shí)另一個(gè)變量隨之變小,或是一個(gè)變量變小時(shí)另一個(gè)變量隨之變大,這兩個(gè)變量之間存在負(fù)相關(guān)。 如果兩個(gè)變量的變化不存在上述的依存性,則認(rèn)為兩個(gè)變量無相關(guān)。 二、相關(guān)散點(diǎn)圖 (一)含義: 散點(diǎn)圖可以形象地描述兩個(gè)尺度變量的相關(guān)狀況和相關(guān)強(qiáng)度。設(shè)有兩個(gè)尺度變量x和y。以x為橫坐標(biāo),以y為縱坐標(biāo),根據(jù)任意個(gè)案x和y的取值,可以在坐標(biāo)系里確定一個(gè)點(diǎn)。眾多個(gè)案在坐標(biāo)系中呈現(xiàn)一種點(diǎn)狀分布,這樣的圖形就是散點(diǎn)圖。 (二)作用: 散點(diǎn)的分布狀態(tài)可以表明變量之間的相關(guān)性。 (三)例子 二、相關(guān)散點(diǎn)圖 三、Pearson(皮爾遜)相關(guān)系數(shù) 用散點(diǎn)圖來描述兩個(gè)尺度變量之間的相關(guān)雖然形象,但不精確。精確描述變量之間相關(guān)強(qiáng)度的特征值是皮爾遜相關(guān)系數(shù)。 (一)Pearson(皮爾遜)相關(guān)系數(shù)建構(gòu)的統(tǒng)計(jì)思想 設(shè)有兩個(gè)尺度變量x和y,散點(diǎn)圖見圖4-5。以x和y的均值為基礎(chǔ)的橫線,將圖劃分為四個(gè)區(qū)域。 三、Pearson(皮爾遜)相關(guān)系數(shù) (一)Pearson(皮爾遜)相關(guān)系數(shù)建構(gòu)的統(tǒng)計(jì)思想 (二)Pearson(皮爾遜)相關(guān)系數(shù)的計(jì)算 【例4-1】表4-1是10名學(xué)生的數(shù)學(xué)成績(jī)與物理成績(jī),計(jì)算這兩科成績(jī)的皮爾遜相關(guān)系數(shù)。 (二)Pearson(皮爾遜)相關(guān)系數(shù)的計(jì)算 【例4-2】表 4-2的數(shù)據(jù)是11個(gè)家庭的月收入x(千元)與住房面積y(平方米)。計(jì)算兩個(gè)變量的皮爾遜相關(guān)系數(shù)。 三、Pearson(皮爾遜)相關(guān)系數(shù) (一)Pearson(皮爾遜)相關(guān)系數(shù)建構(gòu)的統(tǒng)計(jì)思想 相關(guān)分析的結(jié)果只能說明兩個(gè)變量是否有關(guān)系,以及關(guān)系大小事多少。在此基礎(chǔ)上,可以借助回歸分析方法,進(jìn)一步分析變量間的因果關(guān)系。 一、回歸分析的統(tǒng)計(jì)思想 設(shè)有兩個(gè)變量x與y,x為自變量,y為因變量。他們之間的關(guān)系可以分為確定性的關(guān)系與非確定性的關(guān)系。 確定性關(guān)系即一一對(duì)應(yīng)關(guān)系。 非確定性的關(guān)系則是一種數(shù)量上的依存關(guān)系。表現(xiàn)為兩個(gè)變量相關(guān),但并不一一對(duì)應(yīng)。例如身高與體重的關(guān)系,身高越高體重越重的規(guī)律,指的是身高為的所有人的平均體重要低于身高為的所有人的平均體重。 非確定性的關(guān)系也可以采用函數(shù)的方法來描述,但估計(jì)時(shí)有誤差。如果能明確誤差大小,就可以用確定性的方法來研究非確定性的變量關(guān)系,這就是回歸分析的基本出發(fā)點(diǎn)。 回歸分析是對(duì)變量的一組觀察值擬合一個(gè)函數(shù),將非確定性關(guān)系轉(zhuǎn)化為確定性關(guān)系。由于變量間關(guān)系特征不同,擬合函數(shù)也不同。 二、線性回歸 (一)線性回歸方程的建立 回歸分析最簡(jiǎn)單的方法是對(duì)一組觀察值擬合一條直線。該方法叫線性回歸分析,也稱為線性回歸分析。擬合直線叫回歸直線,也稱回歸方程;貧w方程中自變量的系數(shù)能夠說明當(dāng)自變量變化一個(gè)單位時(shí)因變量隨之發(fā)生了何種變化。如圖4-6中的直線即是對(duì)12個(gè)個(gè)案的觀察值擬合的回歸直線。 二、線性回歸 (一)線性回歸方程的建立 線性回歸方程的一般表達(dá)式為: (一)線性回歸方程的建立 【例4-3】 對(duì)【例4-2】,求解以住房面積為因變量,家庭月收入為自變量的回歸方程。 參見教材習(xí)題4-1至4-5。 第五章 類別變量與尺度變量關(guān)系的描述統(tǒng)計(jì) 在社會(huì)學(xué)研究中經(jīng)常要分析類別變量與尺度變量之間的關(guān)系。如收入與學(xué)歷是否相關(guān),初婚年齡與地區(qū)是否相關(guān)等等。 如果類別變量與尺度變量之間的關(guān)系是因果關(guān)系,在這樣的分析中,類別變量是自變量,尺度變量是因變量。 也把自變量稱為影響因素變量,自變量的不同取值稱為影響因素的不同水平。 這種變量間的關(guān)系也可用統(tǒng)計(jì)表、統(tǒng)計(jì)圖和統(tǒng)計(jì)特征值描述。 一、平均值比較分析的統(tǒng)計(jì)思想 類別變量與尺度變量間的差異在于類別變量取值較少,而尺度變量則有很多取值,有些尺度變量的取值范圍還很大。 類別變量與尺度變量之間關(guān)系的分析方法是,比較在自變量取不同水平時(shí),因變量的平均值是否有差異。 如果當(dāng)自變量取不同值時(shí),因變量的平均值有較大差異,則認(rèn)為自變量與因變量有相關(guān)。反之,則無關(guān)。 設(shè)x為類別變量,有 共個(gè)m取值。y為尺度變量。 先按照類別變量將數(shù)據(jù)分為m類,然后計(jì)算每個(gè)類別y的平均值,可得 對(duì)這些平均值進(jìn)行比較,如果差異很大,則認(rèn)為x和y相關(guān)。如果這些平均值都相等,或者僅有微小差異,則認(rèn)為不相關(guān)。 【例5-1】 某班級(jí)進(jìn)行一次外語水平考試,不同性別的學(xué)生得分如表5-1所示。問這個(gè)班學(xué)生的外語成績(jī)與性別是否相關(guān)? 二、統(tǒng)計(jì)表、條形圖與線形圖 (一)統(tǒng)計(jì)表 類別變量與尺度變量之間的關(guān)系可以用統(tǒng)計(jì)表進(jìn)行描述。 (二)條形圖與線形圖 1、條形圖 類別變量與尺度變量間的關(guān)系也可用統(tǒng)計(jì)圖鮮明地表現(xiàn)出來。用類別變量的每個(gè)取值代表一個(gè)條,用條的高度代表屬于該類別的所有個(gè)案在所研究的尺度變量上的平均值。 (二)條形圖與線形圖 2、線形圖 將圖(5-1)中條形頂端的中點(diǎn)用折線相連,就可以繪出兩個(gè)變量關(guān)系的線形圖。如圖(5-2)所示。 一、相關(guān)比率建構(gòu)的統(tǒng)計(jì)思想 對(duì)于不同類別的平均值進(jìn)行比較,只能粗略地說明類別變量與尺度變量之間是否有相關(guān)。要想精確地說明兩個(gè)變量的相關(guān)程度還要用相關(guān)系數(shù)來描述。 類別變量與尺度變量之間的相關(guān)系數(shù)被稱為相關(guān)比率,用eta來表示。相關(guān)比率也是基于消減誤差比率的思想建構(gòu)的。 假設(shè)已知變量y的平均值,要猜測(cè)每個(gè)個(gè)體y變量的值,只能將每個(gè)個(gè)體的值都猜測(cè)為平均值。這時(shí)產(chǎn)生的總誤差平方和為: 一、相關(guān)比率建構(gòu)的統(tǒng)計(jì)思想 如果知道y與另一個(gè)類別變量x相關(guān),且x有m個(gè)取值,每個(gè)類別的個(gè)案數(shù)分別為 在的每個(gè)類別上的均值分別為 這時(shí)再猜測(cè)每個(gè)個(gè)體y變量的值時(shí)要看它屬于x的哪個(gè)類別,并用這個(gè)類別的y的均值 來猜測(cè)它,此時(shí)的總誤差平方和為: 二、相關(guān)比率的計(jì)算 【例5-2】在某城市隨機(jī)抽取45位居民。其文化程度與住房面積的分布如表5-3所示。計(jì)算文化程度與住房面積的相關(guān)比率。 二、相關(guān)比率的計(jì)算 【例5-2】在某城市隨機(jī)抽取45位居民。其文化程度與住房面積的分布如表5-3所示。計(jì)算文化程度與住房面積的相關(guān)比率。 解:先求不同文化程度的居民的平均住房面積,再求所有居民的平均住房面積,最后代入相關(guān)比率的公式即得。 二、相關(guān)比率的計(jì)算 【例5-2】在某城市隨機(jī)抽取45位居民。其文化程度與住房面積的分布如表5-3所示。計(jì)算文化程度與住房面積的相關(guān)比率。 解:先求不同文化程度的居民的平均住房面積,再求所有居民的平均住房面積,最后代入相關(guān)比率的公式即得。 參見教材習(xí)題5-1至5-4。yCF紅軟基地

統(tǒng)計(jì)學(xué)曾五一ppt:這是統(tǒng)計(jì)學(xué)曾五一ppt,包括了什么是統(tǒng)計(jì),統(tǒng)計(jì)學(xué)的種類及其性質(zhì),統(tǒng)計(jì)學(xué)的基本概念,無處不在的統(tǒng)計(jì),精確到小數(shù)點(diǎn)的愛情--統(tǒng)計(jì)學(xué)博士的求婚信等內(nèi)容,歡迎點(diǎn)擊下載。

統(tǒng)計(jì)學(xué)假設(shè)檢驗(yàn)ppt:這是統(tǒng)計(jì)學(xué)假設(shè)檢驗(yàn)ppt,包括了假設(shè)檢驗(yàn)的一般問題,一個(gè)正態(tài)總體的參數(shù)檢驗(yàn),兩個(gè)正態(tài)總體的參數(shù)檢驗(yàn),假設(shè)檢驗(yàn)中的其他問題等內(nèi)容,歡迎點(diǎn)擊下載。

國(guó)民經(jīng)濟(jì)統(tǒng)計(jì)學(xué)ppt:這是國(guó)民經(jīng)濟(jì)統(tǒng)計(jì)學(xué)ppt,包括了國(guó)民經(jīng)濟(jì)分類的基本方法,產(chǎn)業(yè)部門分類與機(jī)構(gòu)部門分類(重點(diǎn)),經(jīng)濟(jì)流量分類與資產(chǎn)負(fù)債分類(重點(diǎn)),國(guó)民經(jīng)濟(jì)核算的基本方法,本章要點(diǎn)等內(nèi)容,歡迎點(diǎn)擊下載。

PPT分類Classification

Copyright:2009-2024 紅軟網(wǎng) rsdown.cn 聯(lián)系郵箱:rsdown@163.com

湘ICP備2024053236號(hào)-1