標準差(Standard Deviation),在概率統計中最常使用作為

文章推薦指數: 80 %
投票人數:10人

所有數減去其平均值的平方和,所得結果除以該組數之個數(或個數減一,即變異數),再把所得值開根號,所得之數就是這組資料的標準差。

深藍區域是距平均值小于一個標準差之 ... 標準差標準差(StandardDeviation),在概率統計中最常使用作為統計分布程度(statisticaldispersion)上的測量。

標準差定義為方差的算術平方根,反映組內個體間的離散程度。

測量到分布程度的結果,原則上具有兩種性質:一個總量的標準差或一個隨機變數的標準差,及一個子集合樣品數的標準差之間,有所差別。

其公式如下所列。

標準差的觀念是由卡爾·皮爾遜(KarlPearson)引入到統計中。

中文名稱標準差外文名稱StandardDeviation也稱均方差用作統計學基本概念標準差(StandardDeviation),也稱均方差(meansquareerror),是各資料偏離平均數的距離的平均數,它是離均差平方和平均後的方根,用σ表示。

標準差是方差的算術平方根。

標準差能反映一個資料集的離散程度。

平均數相同的,標準差未必相同。

標準差可以反映平均數不能反映出的東西(比如穩定度等)。

主要特點標準計算公式假設有一組數值(皆為實數),其平均值為:此組數值的標準差為:樣本標準差在真實世界中,除非在某些特殊情況下,找到一個整體的真實的標準差是不現實的。

大多數情況下,整體標準差是通過隨機抽取一定量的樣本並計算樣本標準差估計的。

從一大組數值當中取出一樣本數值組合,常定義其樣本標準差:樣本方差s是對整體方差σ的無偏估計。

s中分母為n-1是因為的自由度為n -1,這是由于存在約束條件。

這裏示範如何計算一組數的標準差。

例如一群兒童年齡的數值為{5,6,8,9}:第一步,計算平均值(A1+A2+……+An)/n在這裏,5,6,8,9的平均值為(5+6+8+9)/4=7第二步,計算標準差標準差σ=√(5-7)*(5-7)+(6-7)*(6-7)+(8-7)*(8-7)+(9-7)*(9-7)=√10基本術語測量到分布程度的結果,原則上具有兩種性質:為非負數值,與測量資料具有相同單位。

一個總量的標準差或一個隨機變數的標準差,及一個子集合樣品數的標準差之間,有所差別。

標準計算公式假設有一組數值X1,X2,X3,......Xn(皆為實數),其平均值為μ。

平均值標準差也被稱為標準偏差,或者實驗標準差。

簡單來說,標準差是一組資料平均值分散程度的一種度量。

一個較大的標準差,代表大部分數值和其平均值之間差異較大;一個較小的標準差,代表這些數值較接近平均值。

例如,兩組數的集合{0,5,9,14}和{5,6,8,9}其平均值都是7,但第二個集合具有較小的標準差。

標準差可以當作不確定性的一種測量。

例如在物理科學中,做重復性測量時,測量數值集合的標準差代表這些測量的精確度。

當要決定測量值是否符合預測值,測量值的標準差佔有決定性重要角色:如果測量平均值與預測值相差太遠(同時與標準差數值做比較),則認為測量值與預測值互相矛盾。

這很容易理解,因為如果測量值都落在一定數值範圍之外,可以合理推論預測值是否正確。

標準差套用于投資上,可作為量度回報穩定性的指標。

標準差數值越大,代表回報遠離過去平均數值,回報較不穩定故風險越高。

相反,標準差數值越細,代表回報較為穩定,風險亦較小。

例如,A、B兩組各有6位學生參加同一次語文測驗,A組的分數為95、85、75、65、55、45,B組的分數為73、72、71、69、68、67。

這兩組的平均數都是70,但A組的標準差為17.078分,B組的標準差為2.16分(此資料是在R統計軟體中運行獲得),說明A組學生之間的差距要比B組學生之間的差距大得多。

如是整體,標準差公式根號內除以n  如是樣本,標準差公式根號內除以(n-1)  因為我們大量接觸的是樣本,所以普遍使用根號內除以(n-1)公式意義  所有數減去其平均值的平方和,所得結果除以該組數之個數(或個數減一,即變異數),再把所得值開根號,所得之數就是這組資料的標準差。

深藍區域是距平均值小于一個標準差之內的數值範圍。

在常態分配中,此範圍所佔比率為全部數值之68%。

根據常態分配,兩個標準差之內(深藍,藍)的比率合起來為95%。

根據常態分配,三個標準差之內(深藍,藍,淺藍)的比率合起來為99%。

離散度標準差是反應一組資料離散程度最常用的一種量化形式,是表示精確度的重要指標。

說起標準差首先得搞清楚它出現的目的。

我們使用方法去檢測它,但檢測方法總是有誤差的,所以檢測值並不是其真實值。

檢測值與真實值之間的差距就是評價檢測方法最有決定性的指標。

但是真實值是多少,不得而知。

因此怎樣量化檢測方法的準確性就成了難題。

這也是臨床工作質控的目的:保證每批實驗結果的準確可靠。

雖然樣本的真實值是不可能知道的,但是每個樣本總是會有一個真實值的,不管它究竟是多少。

可以想象,一個好的檢測方法,其檢測值應該很緊密的分散在真實值周圍。

如果不緊密,與真實值的距離就會大,準確性當然也就不好了,不可能想象離散度大的方法,會測出準確的結果。

因此,離散度是評價方法的好壞的最重要也是最基本的指標。

一組資料怎樣去評價和量化它的離散度呢?人們使用了很多種方法:極差最直接也是最簡單的方法,即最大值-最小值(也就是極差)來評價一組資料的離散度。

這一方法在日常生活中最為常見,比如比賽中去掉最高最低分就是極差的具體套用。

離均差的平方和由于誤差的不可控性,因此隻由兩個資料來評判一組資料是不科學的。

所以人們在要求更高的領域不使用極差來評判。

其實,離散度就是資料偏離平均值的程度。

因此將資料與均值之差(我們叫它離均差)加起來就能反映出一個準確的離散程度。

和越大離散度也就越大。

但是由于偶然誤差是成常態分配的,離均差有正有負,對于大樣本離均差的代數和為零的。

為了避免正負問題,在數學有上有兩種方法:一種是取絕對值,也就是常說的離均差絕對值之和。

而為了避免符號問題,數學上最常用的是另一種方法--平方,這樣就都成了非負數。

因此,離均差的平方和成了評價離散度一個指標。

方差(S2)由于離均差的平方和與樣本個數有關,隻能反應相同樣本的離散度,而實際工作中做比較很難做到相同的樣本,因此為了消除樣本個數的影響,增加可比性,將標準差求平均值,這就是我們所說的方差成了評價離散度的較好指標。

樣本量越大越能反映真實的情況,而算數均值卻完全忽略了這個問題,對此統計學上早有考慮,在統計學中樣本的均差多是除以自由度(n-1),它的意思是樣本能自由選擇的程度。

當選到隻剩一個時,它不可能再有自由了,所以自由度是n-1。

標準差(SD)由于方差是資料的平方,與檢測值本身相差太大,人們難以直觀的衡量,所以常用方差開根號換算回來這就是我們要說的標準差。

在統計學中樣本的均差多是除以自由度(n-1),它是意思是樣本能自由選擇的程度。

當選到隻剩一個時,它不可能再有自由了,所以自由度是n-1。

變異系數(CV)標準差能很客觀準確的反映一組資料的離散程度,但是對于不同的檢目,或同一項目不同的樣本,標準差就缺乏可比性了,因此對于方法學評價來說又引入了變異系數CV。

一組資料的平均值及標準差常常同時做為參考的依據。

在直覺上,如果數值的中心以平均值來考慮,則標準差為統計分布之一“自然”的測量。

定義公式:其中N應為n-1,即自由度1、方差s^2=[(x1-x)^2+(x2-x)^2+......(xn-x)^2]/(n)(x為平均數)2、標準差=方差的算術平方根errorbar。

在實驗中單次測量總是難免會產生誤差,為此我們經常測量多次,然後用測量值的平均值表示測量的量,並用誤差條來表征資料的分布,其中誤差條的高度為±標準誤。

這裏即標準差standarddeviation和標準誤standarderror的計算公式分別為外匯術語標準差指統計上用于衡量一組數值中某一數值與其平均值差異程度的指標。

標準差被用來評估價格可能的變化或波動程度。

標準差越大,價格波動的範圍就越廣,股票等金融工具表現的波動就越大。

在excel中調用函式“STDEV“估算樣本的標準偏差。

標準偏差反映相對于平均值(mean)的離散程度。

樣本標準差在真實世界中,除非在某些特殊情況下,不然找到一個整體的真實的標準差是不現實的。

大多數情況下,整體標準差是通過隨機抽取一定量的樣本並計算樣本標準差估計的。

其他資料解釋從幾何學的角度出發,標準差可以理解為一個從n維空間的一個點到一條直線的距離的函式。

舉一個簡單的例子,一組資料中有3個值,X1,X2,X3。

它們可以在3維空間中確定一個點P=(X1,X2,X3)。

想像一條通過原點的直線。

如果這組資料中的3個值都相等,則點P就是直線L上的一個點,P到L的距離為0,所以標準差也為0。

若這3個值不都相等,過點P作垂線PR垂直于L,PR交L于點R,則R的坐標為這3個值的平均數:運用一些代數知識,不難發現點P與點R之間的距離(也就是點P到直線L的距離)是。

在n維空間中,這個規律同樣適用,把3換成n就可以了。

標準差與標準誤的區別標準差與標準誤都是心理統計學的內容,兩者不但在字面上比較相近,而且兩者都是表示距離某一個標準值或中間值的離散程度,即都表示變異程度,但是兩者是有著較大的區別的。

首先要從統計抽樣的方面說起。

現實生活或者調查研究中,我們常常無法對某類欲進行調查的目標群體的所有成員都加以施測,而隻能夠在所有成員(即樣本)中抽取一些成員出來進行調查,然後利用統計原理和方法對所得資料進行分析,分析出來的資料結果就是樣本的結果,然後用樣本結果推斷整體的情況。

一個整體可以抽取出多個樣本,所抽取的樣本越多,其樣本均值就越接近整體資料的平均值。

表示的就是樣本資料的離散程度。

標準差就是樣本平均數方差的開平方,標準差通常是相對于樣本資料的平均值而定的,通常用M±SD來表示,表示樣本某個資料觀察值相距平均值有多遠。

從這裏可以看到,標準差受到極值的影響。

標準差越小,表明資料越聚集;標準差越大,表明資料越離散。

標準差的大小因測驗而定,如果一個測驗是學術測驗,標準差大,表示學生分數的離散程度大,更能夠測量出學生的學業水準;如果一個測驗測量的是某種心理品質,標準差小,表明所編寫的題目是同質的,這時候的標準差小的更好。

標準差與常態分配有密切聯系:在常態分配中,1個標準差等于常態分配下曲線的68.26%的面積,1.96個標準差等于95%的面積。

這在測驗分數等值上有重要作用。

標準誤查表示的是抽樣的誤差。

因為從一個整體中可以抽取出無數多種樣本,每一個樣本的資料都是對整體的資料的估計。

標準誤代表的就是當前的樣本對整體資料的估計,標準誤代表的就是樣本均數與整體均數的相對誤差。

標準誤是由樣本的標準差除以樣本容量的開平方來計算的。

從這裏可以看到,標準誤更大的是受到樣本容量的影響。

樣本容量越大,標準誤越小,那麽抽樣誤差就越小,就表明所抽取的樣本能夠較好地代表整體。

Excel函式Excel中有STDEV、STDEVP;STDEVA,STDEVPA四個函式,分別表示樣本標準差、整體標準差;包含邏輯值運算的樣本標準差、包含邏輯值運算的整體標準差(excel用的是“標準偏差”字樣)。

在計算方法上的差異是:樣本標準差=(樣本方差/(資料個數-1))^2;整體標準差=(整體方差/(資料個數))^2。

函式的excel分解:(1)stdev()函式可以分解為(假設樣本資料為A1:E10這樣一個矩陣):stdev(A1:E10)=sqrt(DEVSQ(A1:E10)/(COUNT(A1:E10)-1))(2)stdevp()函式可以分解為(假設整體資料為A1:E10這樣一個矩陣):stdev(A1:E10)=sqrt(DEVSQ(A1:E10)/(COUNT(A1:E10)))同樣的道理stdeva()與stdevpa()也有同樣的分解方法。

套用實例選基金在投資基金上,一般人比較重視的是業績,但往往買進了近期業績表現最佳的基金之後,基金表現反而不如預期,這是因為所選基金波動度太大,沒有穩定的表現。

衡量基金波動程度的工具就是標準差(StandardDeviation)。

標準差是指基金可能的變動程度。

標準差越大,基金未來凈值可能變動的程度就越大,穩定度就越小,風險就越高。

比方說,一年期標準差是30%的基金,表示這類基金的凈值在一年內可能上漲30%,但也可能下跌30%。

因此,如果有兩隻收益率相同的基金,投資人應該選擇標準差較小的基金(承受較小的風險得到相同的收益),如果有兩隻相同標準差的基金,則應該選擇收益較高的基金(承受相同的風險,但是收益更高)。

建議投資人同時將收益和風險計入,以此來判斷基金。

例如,A基金二年期的收益率為36%,標準差為18%;B基金二年期收益率為24%,標準差為8%,從資料上看,A基金的收益高于B基金,但同時風險也大于B基金。

A基金的"每單位風險收益率"為2(0.36/0.18),而B基金為3(0.24/0.08)。

因此,原先僅僅以收益評價是A基金較優,但是經過標準差即風險因素調整後,B基金反而更為優異。

另外,標準差也可以用來判斷基金屬性。

據晨星統計,今年以來股票基金的平均標準差為5.14,積配型基金的平均標準差為5.04;保守配置型基金的平均標準差為4.86;普通債券基金平均標準差為2.91;貨幣基金平均標準差則為0.19;由此可見,越是積極型的基金,標準差越大;而如果投資人持有的基金標準差高于平均值,則表示風險較高,投資人不妨在觀賞奧運比賽的同時,也檢視一下手中的基金。

股市分析中股票價格的波動是股票市場風險的表現,因此股票市場風險分析就是對股票市場價格波動進行分析。

波動性代表了未來價格取值的不確定性,這種不確定性一般用方差或標準差來刻畫(Markowitz,1952)。

下表是中國和美國部分時段的股票統計指標,其中中國證券市場的資料由“錢龍”軟體下載,美國證券市場的資料取自ECI的“WorldStockExchangeDataDisk”。

表2股票統計指標年份業績表現波動率上證綜指標準普爾指數上證綜指標準普爾指數1996110.9316.460.2376O.05731997-0.1331.01O.1188O.083619988.9426.67O.0565O.0676199917.2419.53O.15120.0433200043.86-10.140.0970.04212001-15.34-13.04O.0902O.07322002-20.82-23.37O.0582O.1091通過計算可以得到:上證綜指業績期望值≈(110.93-0.13+8.94+17.24+43.86-15.34-20.82)/7=20.67上證波動率期望值≈0.1156標準普爾業績期望值≈6.7214標準普爾波動率期望值≈0.0680而標準差的計算公式則根據公式(2)計算:上證綜指的業績標準差上證波動率標準差≈0.0632標準普爾指數業績標準差≈21.71標準普爾波動率標準差≈0.02365因為標準差是絕對值,不能通過標準差對中美直接進行對比,而變異系數可以直接比較。

計算可得:上證業績變異系數≈45.2457/20.67≈2.1889上證波動率變異系數≈0.0632/0.1156≈0.5467標準普爾業績變異系數≈21.71/6.7214≈3.2299標準普爾波動率變異系數≈0.02365/0.0680≈0.3478通過比較可以看出上證波動率變異系數要大于標準普爾波動率變異系數,說明長期來講中國股市穩定性相對較差,還是一個不太成熟的股票市場。

標準差在確定企業最優資本結構中的套用資本結構指的是企業各種資金來源的比例關系,是企業籌資活動的結果。

最優資本結構是指能使企業資本成本最低且企業價值最大的資本結構;產權比率,即借入資本與自有資本的構成比例,是反映企業資本結構的重要變數。

企業的資產由債務性資金和權益性資金組成,但其風險等級和收益率各不相同。

根據投資組合理論,投資的多樣化可以分散掉一定的風險,因此資金提供者需要決定投資于債務性資金和權益性資金的比例。

以便在權衡風險和收益的情況下保證其利益的最大化。

理論探索而外部資金提供者利益的最大化也就是企業價值的最大化,這一投資比例對于企業融資而言也就是企業的最優資本結構比例。

假定某企業的資金通過發行債券和股票兩種方式獲得,並且都屬于風險性資產。

σ其中債券的收益率為rD,風險通過標準差σD來衡量;股票的收益率為rE,風險為σE;股票和債券的相關系數為pDE,協方差為COV(rD,rE);債券所佔的比重為wD,股票所佔比重為WE(WD+WE=1)。

根據投資組合理論,企業外部投資者對該企業投資所獲的期望收益率為E(rp)=WDE(rD)+wEE(rE),方差為1、企業債務性資金和權益性資金完全正相關,即相關系數pDE為1。

企業外部投資者獲得的期望收益率為E(rp)=wDE(rD)+wEE(rE),風險標準差為σ=wDσD+wEσE,也就是組合的標準差等于各個部分標準差的加權平均值,通過投資組合不可能分散掉投資風險。

根據投資組合理論,投資組合的不同比例對于投資者而言是無差異的。

2、企業債務性資金和權益性資金完全負相關,即其相關系數為-1。

投資者獲得的報酬率的期望值及其方差分別為。

根據投資組合理論,隻有當投資比例大于σE/(σD+σE)時其投資組合才是有效的。

對于企業籌資而言,也即企業的權益性資金的比例大幹σE/(σD+σE),企業的籌資比例才是有效的,而且當組合比例為σE/(σD+σE)時,企業的籌資組合風險為零。

3、企業債務性資金和權益性資金的相關系數大于-1小于1。

理論上,一個企業的兩種籌資方式之間的相關程度較高,一方面兩種籌資方式都承擔系統風險,另一方面它們也承擔相同的公司風險。

因此從實踐來看,企業的不同籌資方式間的相關程度不可能是完全的正相關和負相關。

對于一個企業而言,債務性資金對企業有固定的要求權,權益性資金對企業隻有剩餘要求權,因此債務性資金的波動不可能像權益性資金的波動那麽大。

同時企業的風險會同時影響企業的債務性資金和權益性資金,因此企業的債務性資金和權益性資金的相關系數不可能為負數。

企業不同的籌資方式間的相關系數一般在0-1之間。

那麽究竟在什麽比例下企業的價值才會達到最大呢?根據投資組合理論,當E(r1)>E(r2),且時,才能出現r1,優于r2。

可見,決定企業資本結構的直接因素主要是不同籌資方式的收益率和風險以及它們之間的相關系數。

  相關詞條標準差公式極差標準誤標準差系數常態分配平均值離散程度標準偏差中位數抽樣誤差偏度離差樣本均值平均數stdev期望值標準分整體均方根rmse相對標準偏差可信區間方差分析自由度極差公式四分位差下行風險殘差偏態分布無偏估計標準分常模夏普比率相關搜尋標準差公式標準差系數整體標準差剩餘標準差六個標準差重復性標準差其它詞條c4畢卡索世界周刊兩周樂扣樂扣你是我兄弟侏儒症凌陽國際發明展塑化劑大螃蟹奇幻精靈事件簿文化大革命斑禿方程望仙獨樂樂不如眾樂樂美妙天堂重生當首富繼承人革命高美濕地風景區標準差@華人百科標準差



請為這篇文章評分?