-
- 素材大小:
- 1.42 MB
- 素材授權(quán):
- 免費(fèi)下載
- 素材格式:
- .ppt
- 素材上傳:
- ppt
- 上傳時(shí)間:
- 2018-03-13
- 素材編號(hào):
- 118387
- 素材類(lèi)別:
- 學(xué)校PPT
-
素材預(yù)覽
這是一個(gè)關(guān)于統(tǒng)計(jì)學(xué)數(shù)據(jù)整理與展示PPT,主要介紹數(shù)據(jù)的預(yù)處理、品質(zhì)數(shù)據(jù)的整理與顯示、數(shù)值型數(shù)據(jù)的整理與顯示、合理使用圖表。第3章 數(shù)據(jù)的圖表展示 3.1 數(shù)據(jù)的預(yù)處理 3.2 品質(zhì)數(shù)據(jù)的整理與顯示 3.3 數(shù)值型數(shù)據(jù)的整理與顯示 3.4 合理使用圖表數(shù)據(jù)的預(yù)處理數(shù)據(jù)審核數(shù)據(jù)審核—原始數(shù)據(jù) (raw data) 完整性審核準(zhǔn)確性審核二手?jǐn)?shù)據(jù)(second hand data) 適用性審核時(shí)效性審核:盡可能使用最新的數(shù)據(jù)有必要做進(jìn)一步的加工整理數(shù)據(jù)篩選(data filter) 找出符合條件的數(shù)據(jù) 例3-1 數(shù)據(jù)排序 升序和降序數(shù)據(jù)透視表(pivot table) 按需要匯總 例3-2 品質(zhì)數(shù)據(jù)的整理與顯示分類(lèi)數(shù)據(jù)頻數(shù)和頻數(shù)分布(frequency distribution)條形圖(bar Chart)、柱形圖(column chart)、對(duì)比條形圖帕累托圖(pareto chart) 餅圖 (pie Chart) 環(huán)形圖 (doughnut Chart) 分類(lèi)數(shù)據(jù)的整理 (可計(jì)算的統(tǒng)計(jì)量) 頻數(shù)(frequency) :落在各類(lèi)別中的數(shù)據(jù)個(gè)數(shù)比例(proportion) :某一類(lèi)別數(shù)據(jù)個(gè)數(shù)占全部數(shù)據(jù)個(gè)數(shù)的比值百分比(percentage) :將對(duì)比的基數(shù)作為100而計(jì)算的比值比率(ratio) :不同類(lèi)別數(shù)值個(gè)數(shù)的比值順序數(shù)據(jù)的整理(可計(jì)算的統(tǒng)計(jì)量) 1. 累積頻數(shù)(cumulative frequencies):各類(lèi)別頻數(shù)的逐級(jí)累加,歡迎點(diǎn)擊下載統(tǒng)計(jì)學(xué)數(shù)據(jù)整理與展示PPT哦。
統(tǒng)計(jì)學(xué)數(shù)據(jù)整理與展示PPT是由紅軟PPT免費(fèi)下載網(wǎng)推薦的一款學(xué)校PPT類(lèi)型的PowerPoint.
第3章 數(shù)據(jù)的圖表展示 3.1 數(shù)據(jù)的預(yù)處理 3.2 品質(zhì)數(shù)據(jù)的整理與顯示 3.3 數(shù)值型數(shù)據(jù)的整理與顯示 3.4 合理使用圖表數(shù)據(jù)的預(yù)處理數(shù)據(jù)審核數(shù)據(jù)審核—原始數(shù)據(jù) (raw data) 完整性審核準(zhǔn)確性審核二手?jǐn)?shù)據(jù)(second hand data) 適用性審核時(shí)效性審核:盡可能使用最新的數(shù)據(jù)有必要做進(jìn)一步的加工整理數(shù)據(jù)篩選(data filter) 找出符合條件的數(shù)據(jù) 例3-1 數(shù)據(jù)排序 升序和降序數(shù)據(jù)透視表(pivot table) 按需要匯總 例3-2 品質(zhì)數(shù)據(jù)的整理與顯示分類(lèi)數(shù)據(jù)頻數(shù)和頻數(shù)分布(frequency distribution)條形圖(bar Chart)、柱形圖(column chart)、對(duì)比條形圖帕累托圖(pareto chart) 餅圖 (pie Chart) 環(huán)形圖 (doughnut Chart) 分類(lèi)數(shù)據(jù)的整理 (可計(jì)算的統(tǒng)計(jì)量) 頻數(shù)(frequency) :落在各類(lèi)別中的數(shù)據(jù)個(gè)數(shù)比例(proportion) :某一類(lèi)別數(shù)據(jù)個(gè)數(shù)占全部數(shù)據(jù)個(gè)數(shù)的比值百分比(percentage) :將對(duì)比的基數(shù)作為100而計(jì)算的比值比率(ratio) :不同類(lèi)別數(shù)值個(gè)數(shù)的比值順序數(shù)據(jù)的整理(可計(jì)算的統(tǒng)計(jì)量) 1. 累積頻數(shù)(cumulative frequencies):各類(lèi)別頻數(shù)的逐級(jí)累加 2. 累積頻率(cumulative percentages):各類(lèi)別頻率(百分比)的逐級(jí)累加數(shù)值型數(shù)據(jù)的整理:分組組數(shù)應(yīng)以能顯示數(shù)據(jù)分布特征和規(guī)律為目的。實(shí)際中,組數(shù)一般為5K 15 組距是一個(gè)組上、下限之差,根據(jù)數(shù)據(jù)的最大值和最小值及組數(shù)確定。即 組距=( 最大值-最小值)÷ 組數(shù)統(tǒng)計(jì)頻數(shù)可整理出頻數(shù)分布表 頻數(shù)分布表的編制 (例題分析) 等距分組表 (上下組限重疊) 等距分組表 (使用開(kāi)口組) 分組 Step 1: Decide on the number of classes. 確定組數(shù) A useful recipe to determine the number of classes (k) is the “2 to the k rule.” such that 2k > n. There were 80 vehicles sold. So n = 80. If we try k = 6, which means we would use 6 classes, then 26 = 64, somewhat less than 80. Hence, 6 is not enough classes. If we let k = 7, then 27 = 128, which is greater than 80. So the recommended number of classes is 7. Step 2: Determine the class interval or width. 確定組距 The formula is: i (H-L)/k where i is the class interval, H is the highest observed value, L is the lowest observed value, and k is the number of classes. If ($35,925 - $15,546)/7 = $2,911 Round up to some convenient number, such as a multiple of 10 or 100. Use a class width of $3,000 分組 Step 3: Set the individual class limits 確定各組組限 Put each observation into only one category, namely avoiding overlapping or unclear class limits. Put approximately equal amounts of the excess in each of the two tails. Select convenient class limits. A guideline is to make the lower limit of the first class a multiple of the class interval. Step 4: Tally the vehicle selling prices into the classes. 數(shù)據(jù)歸入各組數(shù)值型數(shù)據(jù)的顯示數(shù)值型數(shù)據(jù)的圖示分組數(shù)據(jù):直方圖 (histogram) 未分組數(shù)據(jù)莖葉圖(stem-and-leaf display) 箱線圖 (box plot) 時(shí)間序列數(shù)據(jù)—線圖(line plot) 兩個(gè)變量間的關(guān)系—二維散點(diǎn)圖(2D Scatterplots) 三個(gè)變量間的關(guān)系—氣泡圖(bubble chart) 多變量數(shù)據(jù)—雷達(dá)圖 (radar chart) 分組數(shù)據(jù)—直方圖 (histogram) 用矩形的面積表示頻率分布橫軸表示數(shù)據(jù)分組,縱軸表示頻率/組距,各組與相應(yīng)的頻率就形成了一個(gè)矩形,即直方圖分組數(shù)據(jù)—直方圖 (直方圖與條形圖的區(qū)別) 條形圖是用條形的長(zhǎng)度(橫置時(shí))表示各類(lèi)別頻數(shù)的多少,其寬度(表示類(lèi)別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開(kāi)排列條形圖主要用于展示分類(lèi)數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)未分組數(shù)據(jù)—莖葉圖 (stem-and-leaf display) 用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹(shù)莖,低位數(shù)字作樹(shù)葉樹(shù)葉上只保留最后一位數(shù)字 5. 莖葉圖類(lèi)似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒(méi)有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)未分組數(shù)據(jù)—莖葉圖 (例題分析) 未分組數(shù)據(jù)—箱線圖 (box plot) 用于顯示未分組的原始數(shù)據(jù)的分布由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成繪制方法首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU) 連接兩個(gè)四分位數(shù)畫(huà)出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖 (箱線圖的構(gòu)成) 未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖(例題分析) 未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖 (例題分析) 未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖 (例題分析—Median/Quart./Range) 未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖 (例題分析—Median/Quart./Range) 股票分析中的K線圖與箱線圖類(lèi)似K線圖最早是日本德川幕府時(shí)代大阪的米商用來(lái)記錄當(dāng)時(shí)一天、一周或一月中米價(jià)漲跌行情的圖示法,后被引入股市。K線圖有直觀、立體感強(qiáng)、攜帶信息量大的特點(diǎn),是各類(lèi)傳播媒介、電腦實(shí)時(shí)分析系統(tǒng)應(yīng)用較多的技術(shù)分析手段。以日K線為例:是根據(jù)股價(jià)(指數(shù))一天的走勢(shì)中形成的四個(gè)價(jià)位即:開(kāi)盤(pán)價(jià),收盤(pán)價(jià),最高價(jià),最低價(jià)繪制而成的。收盤(pán)價(jià)高于開(kāi)盤(pán)價(jià)時(shí),則開(kāi)盤(pán)價(jià)在下收盤(pán)價(jià)在上,二者之間的長(zhǎng)方柱用紅色或空心繪出,稱(chēng)之為陽(yáng)線;其上影線的最高點(diǎn)為最高價(jià),下影線的最低點(diǎn)為最低價(jià)。收盤(pán)價(jià)低于開(kāi)盤(pán)價(jià)時(shí),則開(kāi)盤(pán)價(jià)在上收盤(pán)價(jià)在下,二者之間的長(zhǎng)方柱用綠色或?qū)嵭睦L出,稱(chēng)之為陰線,其上影線的最高點(diǎn)為最高價(jià),下影線的最低點(diǎn)為最低價(jià)。 08..11.27-09.3.26日K線圖時(shí)間序列數(shù)據(jù)—線圖 (line plot) 表示時(shí)間序列數(shù)據(jù)趨勢(shì)的圖形一般時(shí)間為橫軸,數(shù)據(jù)為縱軸圖形的長(zhǎng)寬比例大致為10 : 7 一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開(kāi)始,以便于比較。數(shù)據(jù)與“0”之間的間距過(guò)大時(shí),可以采取折斷的符號(hào)將縱軸折斷時(shí)間序列數(shù)據(jù)—線圖 (例題分析) 時(shí)間序列數(shù)據(jù)—線圖 (例題分析) 兩個(gè)變量間的關(guān)系—二維散點(diǎn)圖 (2D Scatterplots) 展示兩個(gè)變量之間的關(guān)系用橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi,yi)在坐標(biāo)系中用一個(gè)點(diǎn)表示,n組數(shù)據(jù)在坐標(biāo)系中形成的n個(gè)點(diǎn)稱(chēng)為散點(diǎn),由坐標(biāo)及其散點(diǎn)形成的二維數(shù)據(jù)圖兩個(gè)變量間的關(guān)系—二維散點(diǎn)圖 (2D Scatterplots) 三個(gè)變量間的關(guān)系—氣泡圖 (bubble chart) 顯示三個(gè)變量之間的關(guān)系 圖中數(shù)據(jù)點(diǎn)的大小依賴(lài)于第三個(gè)變量多變量數(shù)據(jù)—雷達(dá)圖 (radar chart) 也稱(chēng)為蜘蛛圖(spider chart) 顯示多個(gè)變量的圖示方法在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時(shí)十分有用假定各變量的取值具有相同的正負(fù)號(hào),總的絕對(duì)值與圖形所圍成的區(qū)域成正比可用于研究多個(gè)樣本之間的相似程度多變量數(shù)據(jù)—雷達(dá)圖 (雷達(dá)圖的制作) 設(shè)有n組樣本S1,S2,… , Sn,每個(gè)樣本測(cè)得P個(gè)變量X1,X2 ,… , XP,要繪制這P個(gè)變量的雷達(dá)圖,其具體做法是多變量數(shù)據(jù)—雷達(dá)圖 (例題分析) 多變量數(shù)據(jù)—雷達(dá)圖 (例題分析) 2010年1月20日至1月25日中國(guó)及周邊版圖地震情況版圖周邊共計(jì)有901條地震記錄,其中大于ML5級(jí)的一共兩次: 2010-01-24 10:36:13.8 35.45 110.70 15 Ms4.8 天然地震 山西河津 2010-01-21 10:02:02.8 13.70 125.85 33 Ms5.1 天然地震 菲律賓群島地區(qū)其他統(tǒng)計(jì)圖舉例:火箭對(duì)熱火比賽(20100116)中,火箭球員的助攻網(wǎng)絡(luò)關(guān)系 社會(huì)網(wǎng)絡(luò)關(guān)系 假如:我是教練組成員,我提議(單從本場(chǎng)比賽結(jié)果看): Brooks、Battier、Ariza、Andersen 在火箭進(jìn)攻體系中位置比較重要,輪轉(zhuǎn)的時(shí)候盡量保證其中的兩人或三人同時(shí)在場(chǎng)。 Budinger 屬于絕好的替補(bǔ)球員,但似乎不適合同 Battier、Hayes 同時(shí)在場(chǎng)。 圖并沒(méi)有說(shuō)謊,是說(shuō)謊者在畫(huà)圖。 Benjamin Disraeli 鑒別圖表優(yōu)劣的準(zhǔn)則一張好的圖表應(yīng)包括以下基本特征顯示數(shù)據(jù)讓讀者把注意力集中在圖表的內(nèi)容上,而不是制作圖表的程序上避免歪曲強(qiáng)調(diào)數(shù)據(jù)之間的比較服務(wù)于一個(gè)明確的目的有對(duì)圖表的統(tǒng)計(jì)描述和文字說(shuō)明 5種鑒別圖表優(yōu)劣的準(zhǔn)則:一張好的圖表應(yīng)當(dāng)精心設(shè)計(jì)、有助于洞察問(wèn)題的實(shí)質(zhì)使復(fù)雜的觀點(diǎn)得到簡(jiǎn)明、確切、高效的闡述能在最短的時(shí)間內(nèi)以最少的筆墨給讀者提供最大量的信息是多維的表述數(shù)據(jù)的真實(shí)情況不恰當(dāng)?shù)慕y(tǒng)計(jì)圖形舉例:縱橫比例不恰當(dāng)?shù)慕y(tǒng)計(jì)圖形舉例:三維效果不恰當(dāng)?shù)慕y(tǒng)計(jì)圖形舉例:圖形類(lèi)型不恰當(dāng)?shù)慕y(tǒng)計(jì)圖形舉例:壓縮縱軸不恰當(dāng)?shù)慕y(tǒng)計(jì)圖形舉例:縱軸無(wú)零點(diǎn)統(tǒng)計(jì)表的設(shè)計(jì)合理安排統(tǒng)計(jì)表的結(jié)構(gòu)總標(biāo)題內(nèi)容應(yīng)滿足3W 要求數(shù)據(jù)計(jì)量單位相同時(shí),可放在表的右上角標(biāo)明,不同時(shí)應(yīng)放在每個(gè)變量后或單列出一列標(biāo)明表中的上下兩條橫線一般用粗線,其他線用細(xì)線通常情況下,統(tǒng)計(jì)表的左右兩邊不封口表中的數(shù)據(jù)一般是右對(duì)齊,有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對(duì)齊,而且小數(shù)點(diǎn)的位數(shù)應(yīng)統(tǒng)一對(duì)于沒(méi)有數(shù)字的表格單元,一般用“—”表示必要時(shí)可在表的下方加上注釋統(tǒng)計(jì)表的結(jié)構(gòu)作業(yè) P66-72 練習(xí)題二3.1——3.15 還有哪些統(tǒng)計(jì)圖?查查看?列舉幾個(gè)。
社會(huì)統(tǒng)計(jì)學(xué)ppt:這是社會(huì)統(tǒng)計(jì)學(xué)ppt,包括了緒論,單變量的描述統(tǒng)計(jì)分析,兩個(gè)類(lèi)別變量關(guān)系的描述統(tǒng)計(jì),兩個(gè)尺度變量關(guān)系的描述統(tǒng)計(jì),類(lèi)別變量與尺度變量關(guān)系的描述統(tǒng)計(jì),概率與隨機(jī)變量的概率分布,大數(shù)定律、中心極限定理與抽樣分布,參數(shù)估計(jì),假設(shè)檢驗(yàn)的基本原理,總體均值與方差的假設(shè)檢驗(yàn),兩個(gè)類(lèi)別變量關(guān)系的假設(shè)檢驗(yàn),兩個(gè)尺度變量關(guān)系的假設(shè)檢驗(yàn),類(lèi)別變量與尺度變量關(guān)系的假設(shè)檢驗(yàn),非參數(shù)檢驗(yàn),抽樣,時(shí)間序列等內(nèi)容,歡迎點(diǎn)擊下載。
統(tǒng)計(jì)學(xué)曾五一ppt:這是統(tǒng)計(jì)學(xué)曾五一ppt,包括了什么是統(tǒng)計(jì),統(tǒng)計(jì)學(xué)的種類(lèi)及其性質(zhì),統(tǒng)計(jì)學(xué)的基本概念,無(wú)處不在的統(tǒng)計(jì),精確到小數(shù)點(diǎn)的愛(ài)情--統(tǒng)計(jì)學(xué)博士的求婚信等內(nèi)容,歡迎點(diǎn)擊下載。
統(tǒng)計(jì)學(xué)假設(shè)檢驗(yàn)ppt:這是統(tǒng)計(jì)學(xué)假設(shè)檢驗(yàn)ppt,包括了假設(shè)檢驗(yàn)的一般問(wèn)題,一個(gè)正態(tài)總體的參數(shù)檢驗(yàn),兩個(gè)正態(tài)總體的參數(shù)檢驗(yàn),假設(shè)檢驗(yàn)中的其他問(wèn)題等內(nèi)容,歡迎點(diǎn)擊下載。