① 為什麼運用因子分析的方法做投資價值的研究
行業的市場表現受到宏觀經濟、行業經營周期、行業基本面以及市場本身等因素的影響,行業多因子模型就是通過對這些因素進行量化描述,分析其與行業市場表現的相關性,提取若干具有顯著影響的因子構建行業投資價值的分析評估體系。
經濟增長、商業周期、通貨膨脹、預期收益率等宏觀行業因素對各個行業產生不同的影響。周期性行業對於經濟增長、貨幣信貸的敏感性強於消費型行業;成長型行業對於市場預期收益率的敏感性高於收入或價值性行業;可選消費行業對於通貨膨脹的敏感度高於必需消費行業。宏觀行業指標數據的統計口徑往往在表徵基本面運行狀態上考慮得更多,而對於投資來說這些數據需要進行處理,排除干擾分離出更為有用的信息,或者將數據組合起來進行觀察。比如,貨幣供應量M2和M1的剪刀差反映了貨幣的活化程度;PPI和原材料購進價格之間的剪刀差反映了製造業盈利空間的變化;原材料庫存和產成品庫存之間的剪刀差又反映了庫存周期缺口等等。國際上著名的宏觀因素模型BIRR模型中的宏觀指標都經過符合邏輯的處理與調整,用公司債與政府債的息差反映市場的風險偏好,用長期政府債與短期國債的息差反映投資者預期收益率。
受宏觀經濟周期和產業周期的影響,行業的發展態勢不僅反映在成長速度、盈利能力、運營能力、收益質量等基本面指標上,還反映在分析師對行業成份公司的預期和市場估值層面,並最終體現在市場價格上。需要通過對行業的財務指標、市場預期、估值水平等因素的綜合分析,尋找行業的投資機會。通常情況下,預期增長快的行業處於行業景氣向上的周期中;毛利率高的行業占據著產業鏈中的優勢地位,具有較高的議價能力;周轉率較高的行業具有較高的資源使用效率。這也反映了公司經營最關鍵的因素,即量、價和速度。在過去的幾年裡,白酒行業從營收增長到毛利率,再到凈資產收益率的平均水平都高於多數其他行業,二級市場股價表現持續超越大盤。行業的基本面因素情況決定了行業中長期的市場表現,行業的估值水平則是影響行業短期表現的重要影響因素。由於行業收益的高低以及彈性特徵不同,各行業的平均估值水平和波動幅度有著固有的差異,降低行業間固有差異的干擾後,有助於幫助投資者把握短期行業的市場表現。
投資者經常說「強者恆強」和「皮球從高處落下總要彈幾下」,分別對應的是量化投資領域中的動量和反轉兩種不同股價運行模式。在行業層面,看似矛盾的動量與反轉效應普遍存在,並對應著不同的市場運行邏輯:宏觀及行業周期是行業基本面變化的主要推動因素,因此行業的市場表現具有較強的持續性;在行業投資中也經常遇見先期跌幅較大的行業未來一段時間有相當的漲幅。這種動量和反轉效應還夾雜著整個宏觀經濟冷暖導致的股市整體表現,將將市場整體波動從行業層面剝離,行業之間的動量和反轉效應更為明顯。
行業多因子模型的關鍵在於因子的選擇,不僅需要有普適的邏輯關系,還要有對指標的含義進行深度解讀,更要使用合適的數學方法進行規整,才能從繁雜的影響因素里發現市場的規律,分析行業投資價值,制定更為客觀可靠的投資決策。
② 因素分析就是因子分析嗎
因子分析與因子分析法主成分分析通過線性組合將原變數綜合成幾個主成分,用較少的綜合指標來代替原來較多的指標(變數)。在多變數分析中,某些變數間往往存在相關性。是什麼原因使變數間有關聯呢?是否存在不能直接觀測到的、但影響可觀測變數變化的公共因子?因子分析法(Factor Analysis)就是尋找這些公共因子的模型分析方法,它是在主成分的基礎上構築若干意義較為明確的公因子,以它們為框架分解原變數,以此考察原變數間的聯系與區別。 例如,隨著年齡的增長,兒童的身高、體重會隨著變化,具有一定的相關性,身高和體重之間為何會有相關性呢?因為存在著一個同時支配或影響著身高與體重的生長因子。那麼,我們能否通過對多個變數的相關系數矩陣的研究,找出同時影響或支配所有變數的共性因子呢?因子分析就是從大量的數據中「由表及裡」、「去粗取精」,尋找影響或支配變數的多變數統計方法。可以說,因子分析是主成分分析的推廣,也是一種把多個變數化為少數幾個綜合變數的多變數分析方法,其目的是用有限個不可觀測的隱變數來解釋原始變數之間的相關關系。因子分析主要用於:1、減少分析變數個數;2、通過對變數間相關關系探測,將原始變數進行分類。即將相關性高的變數分為一組,用共性因子代替該組變數。 1. 因子分析模型 因子分析法是從研究變數內部相關的依賴關系出發,把一些具有錯綜復雜關系的變數歸結為少數幾個綜合因子的一種多變數統計分析方法。它的基本思想是將觀測變數進行分類,將相關性較高,即聯系比較緊密的分在同一類中,而不同類變數之間的相關性則較低,那麼每一類變數實際上就代表了一個基本結構,即公共因子。對於所研究的問題就是試圖用最少個數的不可測的所謂公共因子的線性函數與特殊因子之和來描述原來觀測的每一分量。因子分析模型描述如下: ⑴X = (x1,x2,…,xp)¢是可觀測隨機向量,均值向量E(X)=0,協方差陣Cov(X)=∑,且協方差陣∑與相關矩陣R相等(只要將變數標准化即可實現)。 ⑵F = (F1,F2,…,Fm)¢ (m<p)是不可測的向量,其均值向量E(F)=0,協方差矩陣Cov(F) =I,即向量的各分量是相互獨立的。 ⑶e = (e1,e2,…,ep)¢與F相互獨立,且E(e)=0, e的協方差陣∑是對角陣,即各分量e之間是相互獨立的,則模型: x1 = a11F1+ a12F2 +…+a1mFm + e1 x2 = a21F1+a22F2 +…+a2mFm + e2 ……… xp = ap1F1+ ap2F2 +…+apmFm + ep 稱為因子分析模型,由於該模型是針對變數進行的,各因子又是正交的,所以也稱為R型正交因子模型。其矩陣形式為:x =AF + e . 其中: x=,A=,F=,e= 這里, ⑴m £ p; ⑵Cov(F,e)=0,即F和e是不相關的; ⑶D(F) = Im ,即F1,F2,…,Fm不相關且方差均為1; D(e)=,即e1,e2,…,ep不相關,且方差不同。我們把F稱為X的公共因子或潛因子,矩陣A稱為因子載荷矩陣,e 稱為X的特殊因子。 A = (aij),aij為因子載荷。數學上可以證明,因子載荷aij就是第i變數與第j因子的相關系數,反映了第i變數在第j因子上的重要性。
③ 因子分析的基本步驟
因子分析是指研究從變數群中提取共性因子的統計技術。最早由英國心理學家C.E.斯皮爾曼提出。他發現學生的各科成績之間存在著一定的相關性,一科成績好的學生,往往其他各科成績也比較好,從而推想是否存在某些潛在的共性因子,或稱某些一般智力條件影響著學生的學習成績。因子分析可在許多變數中找出隱藏的具有代表性的因子。將相同本質的變數歸入一個因子,可減少變數的數目,還可檢驗變數間關系的假設。因子分析的前提條件
由於因子分析的主要任務之一是對原有變數進行濃縮,即將原有變數中的信息重疊部分提取和綜合成因子,進而最終實現減少變數個數的目的。因此它要求原有變數之間應存在較強的相關關系。否則,如果原有變數相互獨立,相關程度很低,不存在信息重疊,它們不可能有共同因子,那麼也就無法將其綜合和濃縮,也就無需進行因子分析。本步驟正是希望通過各種方法分析原有變數是否存在相關關系,是否適合進行因子分析。SPSS提供了四個統計量可幫助判斷觀測數據是否適合作因子分析:
(1)計算相關系數矩陣Correlation Matrix
在進行提取因子等分析步驟之前,應對相關矩陣進行檢驗,如果相關矩陣中的大部分相關系數小於0.3,則不適合作因子分析;當原始變數個數較多時,所輸出的相關系數矩陣特別大,觀察起來不是很方便,所以一般不會採用此方法或即使採用了此方法,也不方便在結果匯報中給出原始分析報表。
(2)計算反映象相關矩陣Anti-image correlation matrix
反映象矩陣重要包括負的協方差和負的偏相關系數。偏相關系數是在控制了其他變數對兩變數影響的條件下計算出來的凈相關系數。如果原有變數之間確實存在較強的相互重疊以及傳遞影響,也就是說,如果原有變數中確實能夠提取出公共因子,那麼在控制了這些影響後的偏相關系數必然很小。觀察反映象相關矩陣,如果反映象相關矩陣中除主對角元素外,其他大多數元素的絕對值均小,對角線上元素的值越接近1,則說明這些變數的相關性較強,適合進行因子分析。與方法(1)中最後所述理由相同,一般少採用此方法
(3)巴特利特球度檢驗Bartlett test of sphericity
Bartlett球體檢驗的目的是檢驗相關矩陣是否是單位矩陣(identity matrix),如果是單位矩陣,則認為因子模型不合適。Bartlett球體檢驗的虛無假設為相關矩陣是單位陣,如果不能拒絕該假設的話,就表明數據不適合用於因子分析。一般說來,顯著水平值越小(<0.05)表明原始變數之間越可能存在有意義的關系,如果顯著性水平很大(如0.10以上)可能表明數據不適宜於因子分析。
(4)KMO(Kaiser-Meyer-OklinMeasure of Smapling Adequacy)
KMO是Kaiser-Meyer-Olkin的取樣適當性量數。KMO測度的值越高(接近1.0時),表明變數間的共同因子越多,研究數據適合用因子分析。通常按以下標准解釋該指標值的大小:KMO值達到0.9以上為非常好,0.8~0.9為好,0.7~0.8為一般,0.6~0.7為差,0.5~0.6為很差。如果KMO測度的值低於0.5時,表明樣本偏小,需要擴大樣本。
④ 因子分析概念
在各個領域的科學研究中,往往需要對反映事物的多個變數進行大量的觀測並收集大量數據,以便分析尋找規律。多變數大樣本無疑會為科學研究提供豐富的信息,但也在一定程度上增加了數據採集的工作量,更重要的是在大多數情況下,許多變數之間可能存在的相關性增加了問題分析的復雜性,同時對分析帶來不便。如果分別分析每個指標,分析又可能是孤立的,而不是綜合的。盲目減少指標會損失很多信息,產生錯誤的結論。因此需要找到一個合理的方法,在減少分析指標的同時,盡量減少原指標包含信息的損失,對所收集的資料作全面的分析。由於各變數間存在一定的相關關系,因此用較少的指標分別綜合存在於各變數中的各類信息,這少數幾個綜合指標彼此不相關,即所代表的信息是不重疊的,通常稱為因子,因子分析法因此得名。因此,因子分析是將多個實測變數轉換為少數幾個不相關的綜合指標的多元統計分析方法(於志鈞等,1984;趙旭東,1992;陸明德,1991)。
因子分析方法由Spearman在19世紀初研究心理學問題時提出,1957年由Krumbein引入地質學,後來Imbrie對因子分析在地質學中的應用和發展做了大量工作。
因子分析可以從以下幾個方面為地質研究提供幫助:①壓縮原始數據。因子分析為眾多復雜的地質數據精簡提供了一種數學演算法,它能在數量上大大精簡原始數據但又不損失數據中包含的成因信息,這樣就有利於地質人員進行綜合分析。②指示成因推理方向。因子分析能夠把龐雜紛亂的原始數據按成因上的聯系進行歸納、整理、精煉和分類,理出幾條客觀的成因線索,為地質人員提供邏輯推理方向,啟發思考相應的成因結論。③分解疊加的地質過程。現實中觀測到的地質現象往往是多種成因過程疊加的產物,因子分析提供了一個分解疊加過程而識別每個單一地質過程的手段。
鑒於上述原因,因子分析在地學領域的應用十分廣泛,已有效地應用於沉積盆地蝕源區的研究、沉積物的粒度分析、沉積相研究、地層分析、古環境與古生態的研究、石油及天然氣成因研究、油田水化學研究、有機地球化學研究及石油、天然氣化探資料分析等各個方面(曾濺輝等,2002;張俊,2005;陳科貴等,2006)。
⑤ spss因子分析在證券市場個股分析中的應用實例
spss因子分析用於證券市場個股分析中,因為因子分析法是從研究變數內部相關的依賴關系出發,把一些具有錯綜復雜關系的變數歸結為少數幾個綜合因子的一種多變數統計分析方法。它的基本思想是將觀測變數進行分類,將相關性較高,即聯系比較緊密的分在同一類中,而不同類變數之間的相關性則較低,那麼每一類變數實際上就代表了一個基本結構,即公共因子。對於所研究的問題就是試圖用最少個數的不可測的所謂公共因子的線性函數與特殊因子之和來描述原來觀測的每一分量。
康美葯業投資分析
一、上市公司基本面情況:
600518康美葯業,最新財務主要指標(08-09-30)每股收益(元)0.2390,每股凈資產(元)3.5470,凈資產收益率(%) 6.74,總股本(億股)7.6440 ,實際流通A股(億股)7.6440,每股資本公積1.843,主營收入(萬元)130369.89,同比增 40.04% ,每股未分利潤0.606 ,凈利潤(萬元)18264.62,同比增 83.04%;
二、該股票的投資亮點:
1.2007年公司完成了阿莫西林分散片、利巴韋林片等多個再注冊產品的研究開發和上報工作,部分仿製葯品取得了《葯物臨床試驗批件》;同時公司積極開發中葯系列產品,完成了"代用茶"、"植物飲料"的備案號注冊以及西洋參膠囊/飲料科技開發立項工作;"紅景天"、"毒熱平"兩個中葯新葯品種已基本完成臨床前研究工作。
2.2008年,隨著國家衛生事業改革進一步深化,新農合、城鎮職工基本醫療保險、城鎮非從業居民基本醫療保險的進一步推廣,整個醫葯市場容量將增大。人們在醫療尤其是在葯品上的消費量和消費金額將迅速上升,這將對醫葯行業快速發展帶來有利的影響。
3. 2007年公司中葯飲片二期擴產項目順利建成並試產運營,該項目是公司在傳統中醫葯領域推廣應用新技術,實現中葯飲片規模化、標准化和產業化生產的一個重大成果。項目的投產緩解了產能緊張壓力,保障了市場供給,進一步穩固了公司在國內中葯飲片生產龍頭企業的地位。
4.公司通過增資擴股募集資金投資中葯物流配送中心項目,該項目是發揮公司中葯產業的生產經營優勢,整合當地中葯材專業市場資源,為延伸公司產業鏈條而實施的一個重點項目。
三、專業投資機構意見:
公司主營業務中葯飲片繼續拉動公司業績高速增長,2008 年三季度凈利潤增長83%,公司將全面布局全國性中葯飲片產業鏈,行業整頓期利用並購穩健擴張,公司正在創建中葯飲片行業的高質量標准體系,將發展為現代國內中葯飲片龍頭,預計公司未來三年復合增長率為40%,2008-2010 年EPS 為0.35,0.48,和0.80給予"增持"的投資評級。
四、綜合分析判斷結論:
從以上的信息可見康美葯業作為國家中葯制葯的龍頭企業,其股票是具有投資價值的,所以該股票後市看好,完全是可以長期投資的。
⑥ 因子分析方法
因子分析是一種多變數化簡技術,目的是分解原始變數,從中歸納出潛在的「類別」,相關性較強的指標歸為一類,不同類間變數的相關性較低,每一類變數代表了一個「共同因子」,即一種內在結構,因子分析就是要尋找該結構。其分析方法有很多種,最常用的有兩種:一是主成分分析方法;另外一種是一般因子分析法。通常所說的因子分析指的就是一般因子分析法,它通過原始變數的方差去構造因子,一般情況下,因子的數量總是要少於變數的數量。所以對於一般因子分析而言,如何正確解釋因子將會比主成分分析更困難。
因子分析一般可以分成四步:
考察變數之間的相關性,判斷是否要進行因子分析;
進行分析,按一定的標准確定提取的因子數目,一般要求特徵值大於1;
考察因子的可解釋性,並在必要時進行因子旋轉,以尋求最佳解釋方式;
計算出因子得分等中間指標,供進一步分析使用。
利用因子分析,可以把搜集到的比較雜亂的原始數據進行壓縮,找出最重要的因子,並對其按照成因歸類、整理,從中找出幾條主線,幫助分析充滿度的主要控制因素。
本研究中共統計岩性圈閉354個,參與統計分析和計算的圈閉有249個。由於其中的落空圈閉無法參與因子分析及充滿度預測模型的建立,因此實際參與分析和預測的岩性油氣藏為222個。初步地質分析後,選取平均孔隙度,%;平均滲透率,10-3μm2;排烴強度,104t/km2;與排烴中心的平面距離,km;與排烴中心的垂直距離,m;地層壓力系數;砂體厚度,m;砂體面積,km2;有機質豐度,%;圍岩厚度,m;平均埋深,m;共11個地質參數進行因子分析。
本研究按不同的成藏體系進行,建立其充滿度預測模型並進行回代驗證。同一成藏體系內的岩性油氣藏的生、儲、蓋、圈、運、保等成藏條件相互影響、相互制約,關系密切,將同一成藏體系中的岩性油氣藏又分別劃分為構造-岩性、透鏡體油氣藏進行預測。