當前位置:首頁 » 分析預測 » 股票組合回歸分析x取什麼
擴展閱讀
武漢市長是誰 2025-06-30 15:47:38

股票組合回歸分析x取什麼

發布時間: 2021-08-18 18:19:08

⑴ 我也想根據EXCEL所做的回歸方程求出X1 X2 X3 X4的最優組合,望指導!

Excel繪制標准曲線全圖片教程 (老是不會,老是要去找,所以發上來備份,哈哈)Excel繪制標准曲線全圖片教程coolautumn 隨著計算機的日益普及,越來越多的檢驗工作者希望能從一些煩瑣的工作中解脫出來,如:繪制標准曲線、繪制質控圖、計算檢測值等等。當然藉助檢驗科辦公系統理論上是最方便的,但很多單位是沒有檢驗科辦公系統的。其實藉助Microsoft的Excel電子表格工具對檢驗工作也會帶來很大的便利。 Excel是Microsoft offices系統的重要組成,它是界於WORD字處理軟體與ACCESS資料庫軟體之間的電子表格工具,功能十分強大,特別適合於日常工作使用。使用得好,完全比目前所有的檢驗科辦公系統優秀。 現就先介紹一下如何使用Excel繪制標准曲線。 首先,將數據整理好輸入Excel,並選取完成的數據區,並點擊圖表向導,如下圖所示。 點擊圖表向導後會運行圖表向導如下圖,先在圖表類型中選「XY散點圖」,並選了圖表類型的「散點圖」(第一個沒有連線的)。 點擊「下一步」,出現如下圖界面。如是輸入是如本例橫向列表的就不用更改,如果是縱向列表就改選「列」。 如果發現圖不理想,就要仔細察看是否數據區選擇有問題,如果有誤,可以點擊「系列」來更改,如下圖。 如果是X值錯了就點擊它文本框右邊的小圖標,結果如下圖: 出現上圖後,如圖在表上選取正確的數據區域。然後點擊「下一步」出現圖表選項界面,如下圖,上應調整選項,以滿足自己想要的效果。 點擊「下一步」,現在一張帶標准值的完整散點圖就已經完成,如下圖。 完成了散點圖,現在需要根據數據進行回歸分析,計算回歸方程,繪制出標准曲線。其實這很簡單,先點擊圖上的標准值點,然後按右鍵,點擊「添加趨勢線」。如下圖。 由於本例是線性關系,在類型中選「線性」如下圖 點擊「確定」,標准曲線就回歸並畫好了。 標准曲線是畫好了,可是我們怎麼知道回歸後的方程是什麼樣呢?這了簡單,點擊趨勢線(也就是我們說的標准曲線)然後按右鍵,選趨勢線格式,如下圖:在顯示公式和顯示R平方值(直線相關系數)前點一下,勾上。再點確定。好了,現在公式和相關系數都出來了。如圖:呵R的平方達0.996,線性相當好。 可是有時候有的項目是成指數增加的,散點圖如下圖, 從上圖看並不值關,除了最大的一個點外其餘的幾乎都成了直線。這不難理解,對於10000000而言,10與10000都差不了多少。因此我們平時常使用半對數坐標紙畫圖。對於Excel也可以,先點中Y坐標軸,再按右鍵,選「坐標軸格式」如下圖 將左下方的對數刻度選中,確定。完整的一個半對數標准曲線就做好了。 利用Excel製作標准曲線簡單吧?如果認真調整參數可以得到不同的效果,大家多研究一下

⑵ 某一股票與市場組合的協方差是什麼意思

方差描述了一組數列的波動情況,如果一個數列都是1種數,如1,1,1,1,1,1 那麼它的方差為0
期望其實就是一組數的平均值
協方差是建立在方差分析和回歸分析基礎之上的一種統計分析方法
兩個不同參數之間的方差就是協方差
相關系數r
相關系數是變數之間相關程度的指標。樣本相關系數用r表示,總體相關系數用ρ表示,相關系數的取值范圍為[-1,1]。|r|值越大,誤差Q越小,變數之間的線性相關程度越高;|r|值越接近0,Q越大,變數之間的線性相關程度越低。
相關系數 又稱皮(爾生)氏積矩相關系數,說明兩個現象之間相關關系密切程度的統計分析指標。
相關系數用希臘字母γ表示,γ值的范圍在-1和+1之間。
γ>0為正相關,γ<0為負相關。γ=0表示不相關;
γ的絕對值越大,相關程度越高。
兩個現象之間的相關程度,一般劃分為四級:
如兩者呈正相關,r呈正值,r=1時為完全正相關;如兩者呈負相關則r呈負值,而r=-1時為完全負相關。完全正相關或負相關時,所有圖點都在直線回歸線上;點子的分布在直線回歸線上下越離散,r的絕對值越小。當例數相等時,相關系數的絕對值越接近1,相關越密切;越接近於0,相關越不密切。當r=0時,說明X和Y兩個變數之間無直線關系。通常|r|大於0.75時,認為兩個變數有很強的線性相關性。
相關系數的計算公式為:
其中xi為自變數的標志值;i=1,2,…n;■為自變數的平均值,
為因變數數列的標志值;■為因變數數列的平均值。
為自變數數列的項數。對於單變數分組表的資料,相關系數的計算公式為:
其中fi為權數,即自變數每組的次數。在使用具有統計功能的電子計算機時,可以用一種簡捷的方法計算相關系數,其公式為:
使用這種計算方法時,當計算機在輸入x、y數據之後,可以直接得出n、■、∑xi、∑yi、∑■、∑xiy1、γ等數值,不
必再列計算表。
參考資料:網路

⑶ excel回歸分析的結果各項都代表著什麼

Multiple R:相關系數R,值在-1與1之間,越接近-1,代表越高的負相關,反之,代表越高的正相關關系。

R Square:測定系數,也叫擬合優度。是相關系數R的平方,同時也等於回歸分析SS/(回歸分析SS+殘差SS),這個值在0~1之間,越大代表回歸模型與實際數據的擬合程度越高。

Adjusted R Square:校正的測定系數,對兩個具有不同個數的自變數的回歸方程進行比較時,考慮方程所包含的自變數個數的影響。

標准誤差:等於表2中殘差SS / 殘差df 的平方根。與測定系數一樣都能描述回歸模型與實際數據的擬合程度,它代表的是實際值與回歸線的距離。

觀測值:有多少組自變數的意思。

excel回歸分析的使用方法:

1、首先在excel表格中輸入需要進行回歸分析的數據。

⑷ 對於回歸模型的幾個主要假定里。。第四條看不懂。。什麼叫對於所有x都。。是說無論取什麼范圍的x,誤差

這條是說無論x取什麼值,ε的方差都是不變的,即滿足同方差假定。在回歸中,x不是隨機變數,ε是隨機變數,同時根據經典假定,ε~N(0,σ^2)

⑸ 回歸分析表怎麼看懂

我給你解讀一份stata的回歸表格吧,應該有標准表格的所有內容了,因為你沒有給範例,……不過我們考試基本就是考stata或者eview的輸出表格,它們是類似的。

X變數:教育年限

Y變數:兒女數目

各個系數的含義:

左上列:

Model SS是指計量上的SSE,是y估計值減去y均值平方後加總,表示的是模型的差異

Model df是模型的自由度,一般就是指解釋變數X的個數,這里只有一個

Resial SS 和df 分別是殘差平方和以及殘差自由度 N-K-1(此處K=1)=17565

Total SS 和 df分別是y的差異(y減去y均值平方後加總)以及其自由度N-1=17566

MS都是對應的SS除以df,表示單位的差異

右上列:

Number of obs是觀測值的數目N,這里意味著有17567個觀測值

F是F估計值,它是對回歸中所有系數的聯合檢驗(H0:X1=X2=…=0),這里因為只有一個X,所以恰好是t的平方。這里F值很大,因此回歸十分顯著。

Prob>F是指5%單邊F檢驗對應的P值,P=0意味著很容易否定H0假設,回歸顯著。

R-squared是SSE/SST的值,它的意義是全部的差異有多少能被模型解釋,這里R-squared有0.0855,說明模型的解釋度還是可以的。

Adj R-squared是調整的R-squared,它等於1-(n-1)SSR/(n-k-1)SST,它的目的是為了剔除當加入更多X解釋變數時,R-squared的必然上升趨勢,從而在多元回歸中更好的看出模型的解釋力,但是本回歸是一元的,這個值沒有太大意義。

Root MSE是RMS的開方,是單位殘差平方和的一種表現形式。

下列:

Coef分別出示了X變數schooling的系數和常數項的值,其含義是,如果一個人沒有受過教育,我們預測會平均生育3個子女,當其他因素不變時,一個人每多受一年教育,我們預測其將會少生0.096個孩子。X變數的coef並不大,因此其實際(也叫經濟)顯著性並不太高。

Std.err則是估計系數和常數項的標准差。一般我們認為,標准差越小,估計值越集中、精確。

t是t估計值,它用於檢驗統計顯著性,t值較大,因此回歸是顯著的。

P>abs(t)項是5%雙邊t檢驗對應的P值,P=0意味著很容易否定H0假設,統計顯著。

95%conf interval項是95%的置信區間,它是x變數的系數(或常數項)分別加減1.96*SE,這是說,有95%的可能性,系數的真值落在這個區域。

⑹ 為什麼相關或回歸分析時 x和y取log

取對數作用主要有:

  1. 縮小數據的絕對數值,方便計算。例如,每個數據項的值都很大,許多這樣的值進行計算可能對超過常用數據類型的取值范圍,這時取對數,就把數值縮小了,例如TF-IDF計算時,由於在大規模語料庫中,很多詞的頻率是非常大的數字。

2. 取對數後,可以將乘法計算轉換稱加法計算。


3. 某些情況下,在數據的整個值域中的在不同區間的差異帶來的影響不同。例如,中文分詞的mmseg演算法,計算語素自由度時候就取了對數,這是因為,如果某兩個字的頻率分別都是500,頻率和為1000,另外兩個字的頻率分別為200和800,如果單純比較頻率和都是相等的,但是取對數後,log500=2.69897, log200=2.30103, log800=2.90308 這時候前者為2log500=5.39794, 後者為log200+log800=5.20411,這時前者的和更大,取前者。因為前面兩個詞頻率都是500,可見都比較常見。後面有個詞頻是200,說明不太常見,所以選擇前者。


從log函數的圖像可以看到,自變數x的值越小,函數值y的變化越快,還是前面的例子,同樣是相差了300,但log500-log200>log800-log500,因為前面一對的比後面一對更小。


也就是說,對數值小的部分差異的敏感程度比數值大的部分的差異敏感程度更高。這也是符合生活常識的,例如對於價格,買個家電,如果價格相差幾百元能夠很大程度影響你決策,但是你買汽車時相差幾百元你會忽略不計了。

4. 取對數之後不會改變數據的性質和相關關系,但壓縮了變數的尺度,例如800/200=4, 但log800/log200=1.2616,數據更加平穩,也消弱了模型的共線性、異方差性等。


5. 所得到的數據易消除異方差問題。


6. 在經濟學中,常取自然對數再做回歸,這時回歸方程為 lnY=a lnX+b ,兩邊同時對X求導,1/Y*(DY/DX)=a*1/X, b=(DY/DX)*(X/Y)=(DY*X)/(DX*Y)=(DY/Y)/(DX/X) 這正好是彈性的定義。

⑺ 對股票進行回歸分析通常自變數和因變數選什麼好

因變數通常是回報,比如行業超額回報、或者經無風險利率調整的回報。自變數,根據APT,有k個factor。所以你認為的是影響因素的變數都可以加入。常用的有市場回報(CAPM模型)、會計信息(sloan模型)、上期回報(Engle模型)和宏觀變數(國債長短端利差、通脹等)。但是要重點看看t檢驗和adj R square,會對不相關的變數進行懲罰