A. 多屬性決策模型和層次分析法的區別
中國一直是一個居民儲蓄率居高不下的國家,由於中國經濟的持續高速發展以及房地產行業的畸形增長,買房對很多人來說越來越困難。其實,不僅僅是房地產,我們身邊很多商品的價格都在漲,經濟高速增長附帶著高通貨膨脹率逐漸改變了人們傳統的儲蓄觀念,個人理財業務越來越受到更多人的重視。 目前的個人理財主要集中在商業銀行理財業務及理財產品的創新等方面。而學者們的研究也主要基於各大商業銀行理財產品的背景下,針對收入較高的社會群體,研究商業銀行理財產品如何適應不同風險偏好投資者的需求以及如何創造出更具有吸引力的投資理財產品。對於每一個投資者而言,怎樣的銀行存款、股票、債券和基金等的組合投資比例才能使投資者獲得最大的投資收益同時也符合投資者的風險偏好也是投資者非常在意的問題。將所有資金存入銀行,投資者就必須面對通貨膨脹率高於存款利息率的風險;將所有資金投入股票市場,投資者又將面對巨大損失的可能;將資金都投入到債券市場,也將要面對債券市場的流動性風險。不同的投資者擁有不同的投資需求,不同的收益預期,不同的風險偏好,如何為個性化需求投資者選擇不同理財產品的投資比例,便是本文主要研究的問題。 層次分析法(AHP)是一種基於各屬性指標值的評價來進行決策,因其廣闊的適用性和豐富的決策方法,使其在各個領域都能獲得巨大的應用。現代經濟環境,無論是項目建設決策還是經濟方案決策,人們面臨著越來越多的不確定性信息,沒有準確的統計數值,以往許多的決策方法將難以適用,個人理財組合選擇也同樣如此。層次分析法(AHP)則很好地解決了這些問題,通過對數值和非數值屬性指標的重要性評價,根據不同的情況使用不同的決策因子計算獲得不同屬性權重結果或者最優選擇。 本文的創新點是將層次分析法運用到個人理財最優組合選擇中,從投資者個人的角度創新性的提出了將影響投資者決策選擇的收益率指標、風險水平指標、收入水平指標、財富水平指標和受高等教育指標結合在一起,建立起一個同時考慮投資者預期收益率、風險偏好、收入水平、財富水平和受高等教育程度的指標體系,以獲得最適合投資者的投資組合選擇。同時,本文對比了其他投資決策方法:期望值、標准差法、資本資產定價模型、決策樹法、正太概率分布法和馬爾科夫決策方法。期望值、標准差法是標準的數值型決策方法,只能對數值型屬性決策做出選擇。決策樹法、正太概率分布法和馬爾科夫決策法都必須知道屬性的概率分布。資本資產定價模型是以往使用最多最普遍的個人理財方案選擇的方法,但是資本資產定價模型只能通過設定預期收益率來獲得最低風險的投資,或者設定最高風險接受水平來獲得最高收益率的投資產品組合。該方法在理論上具有一定的研究價值,但在實際操作過程中,人們往往難以估計適合自己的預期收益率,人們總是覺得收益率越高越好,風險越低越好,如何在收益和風險之間找到平橫,不能通過收益率和風險的比值來簡單概括。 每一種方法都有一定的適用范圍,層次分析法也一樣,本文在研究過程中發現,當所有的屬性都有具體的數值或概率值表示時,使用期望值、標准方差法或者決策樹法將會得到更精確的解釋。另一方面,當個人理財指標體系越完整時,層次分析法計算的結果就越准確,相反,如果當個人指標體系加入錯誤的屬性項,運用該方法得到的結果就可能存在偏差。因此,一個完整的具有代表性的指標體系將是我們不斷追求的方向和今後研究的目標。 本文全文分為六章,第一章為緒論,介紹了全文的研究背景,研究內容和研究方法。第二章通過文獻綜述法對國內外不同決策方法研究現狀以及我國個人理財現狀進行了詳細的闡述。第三章主要介紹了層次分析法的使用決策過程和方法。第四章研究了個人理財的影響因素,提出了集合收益率、風險水平、收入水平、財富水平和受高等教育水平指數的個人理財影響因素指標體系。為層次分析法下的理財分析做鋪墊。第五章是本文的重點,通過分析兩種屬性下的投資組合選擇、三種屬性下的投資組合選擇以及兩種和三種屬性投資組合選擇的對比分析,然後提出使用五種指標構建的指標體系進行投資理財組合決策。並通過對比其他研究方法,分析得出各種方法的優缺點以及不同方法在不同情況下的應用價值。第六章為總結和展望,對本文的研究內容進行一個總結性描述,同時提出了本文在研究過程中的不足以及今後的研究方向。
B. 在股市投資中,什麼能稱得上是量化投資
量化交易是利用數學、統計、計算機的模型和方法來指導在金融市場的交易,可以自動下單業可以半自動下單,這個不是核心,核心在於是不是系統化交易(systematic trading)。
比如主觀交易會看K線交易,量化交易業會,但區別在於量化交易可以在歷史數據上回測各種交易規則,找到表現好的,然後才用來交易。這或許會有過度擬合的風險,但也有一些方法克服。
本人認為"量化交易系統、指標體系交易系統"均為"技術分析系統"的子集,"量化交易系統"與“指標體系系統"等價,即技術分析的概念更廣,因波浪理論屬於技術分析,但難說它屬於量化交易,因有些事情的"量化"有很高難度,量化交易強調必須精準量化,必須能用指標體系表示,必須能精確的歷史數據回測。
C. 機器學習有哪些演算法
1. 線性回歸
在統計學和機器學習領域,線性回歸可能是最廣為人知也最易理解的演算法之一。
2. Logistic 回歸
Logistic 回歸是機器學習從統計學領域借鑒過來的另一種技術。它是二分類問題的首選方法。
3. 線性判別分析
Logistic 回歸是一種傳統的分類演算法,它的使用場景僅限於二分類問題。如果你有兩個以上的類,那麼線性判別分析演算法(LDA)是首選的線性分類技術。
4.分類和回歸樹
決策樹是一類重要的機器學習預測建模演算法。
5. 樸素貝葉斯
樸素貝葉斯是一種簡單而強大的預測建模演算法。
6. K 最近鄰演算法
K 最近鄰(KNN)演算法是非常簡單而有效的。KNN 的模型表示就是整個訓練數據集。
7. 學習向量量化
KNN 演算法的一個缺點是,你需要處理整個訓練數據集。
8. 支持向量機
支持向量機(SVM)可能是目前最流行、被討論地最多的機器學習演算法之一。
9. 袋裝法和隨機森林
隨機森林是最流行也最強大的機器學習演算法之一,它是一種集成機器學習演算法。
想要學習了解更多機器學習的知識,推薦CDA數據分析師課程。CDA(Certified Data Analyst),即「CDA 數據分析師」,是在數字經濟大背景和人工智慧時代趨勢下,面向全行業的專業權威國際資格認證,旨在提升全民數字技能,助力企業數字化轉型,推動行業數字化發展。點擊預約免費試聽課。
D. 我要對股票市場做決策樹的模型,可是不會數據預處理,誰可以幫幫我啊,時間緊急啊
數據預處理可以通過很多股票軟體進行數據生成,然後通過EXCEL軟體進行處理,不過很耗時間
E. 為什麼手動實現決策樹效率比調包低很多
1.每個演算法模塊按照「原理講解→分析數據→自己動手實現→特徵與調參」的順序,「原理加實踐,頂天立地」。
2.拒絕簡單的「調包」——增加3次「機器學習的角度看數學」和3次「Python數據清洗和特徵提取」,提升學習深度、降低學習坡度。
3.增加網路爬蟲的原理和編寫,從獲取數據開始,重視將實踐問題轉換成實際模型的能力,分享工作中的實際案例或Kaggle案例:廣告銷量分析、環境數據異常檢測和分析、數字圖像手寫體識別、Titanic乘客存活率預測、用戶-電影推薦、真實新聞組數據主題分析、中文分詞、股票數據特徵分析等。
F. 求問什麼是數據挖掘
數據挖掘相關的10個問題 NO.1 Data Mining 和統計分析有什麼不同? 硬要去區分Data Mining和Statistics的差異其實是沒有太大意義的。一般將之定義為Data Mining技術的CART、CHAID或模糊計算等等理論方法,也都是由統計學者根據統計理論所發展衍生,換另一個角度看,Data Mining有相當大的比重是由高等統計學中的多變數分析所支撐。但是為什麼Data Mining的出現會引發各領域的廣泛注意呢?主要原因在相較於傳統統計分析而言,Data Mining有下列幾項特性: 1.處理大量實際數據更強勢,且無須太專業的統計背景去使用Data Mining的工具; 2.數據分析趨勢為從大型資料庫抓取所需數據並使用專屬計算機分析軟體,Data Mining的工具更符合企業需求; 3. 純就理論的基礎點來看,Data Mining和統計分析有應用上的差別,畢竟Data Mining目的是方便企業終端用戶使用而非給統計學家檢測用的。 NO.2 Data Warehousing 和 Data Mining 的關系為何? 若將Data Warehousing(數據倉庫)比喻作礦坑,Data Mining就是深入礦坑采礦的工作。畢竟Data Mining不是一種無中生有的魔術,也不是點石成金的煉金術,若沒有夠豐富完整的數據,是很難期待Data Mining能挖掘出什麼有意義的信息的。 要將龐大的數據轉換成為有用的信息,必須先有效率地收集信息。隨著科技的進步,功能完善的資料庫系統就成了最好的收集數據的工具。數據倉庫,簡單地說,就是搜集來自其它系統的有用數據,存放在一整合的儲存區內。所以其實就是一個經過處理整合,且容量特別大的關系型資料庫,用以儲存決策支持系統(Design Support System)所需的數據,供決策支持或數據分析使用。從信息技術的角度來看,數據倉庫的目標是在組織中,在正確的時間,將正確的數據交給正確的人。 許多人對於Data Warehousing和Data Mining時常混淆,不知如何分辨。其實,數據倉庫是資料庫技術的一個新主題,利用計算機系統幫助我們操作、計算和思考,讓作業方式改變,決策方式也跟著改變。 數據倉庫本身是一個非常大的資料庫,它儲存著由組織作業資料庫中整合而來的數據,特別是指事務處理系統OLTP(On-Line Transactional Processing)所得來的數據。將這些整合過的數據置放於數據昂哭中,而公司的決策者則利用這些數據作決策;但是,這個轉換及整合數據的過程,是建立一個數據倉庫最大的挑戰。因為將作業中的數據轉換成有用的的策略性信息是整個數據倉庫的重點。綜上所述,數據倉庫應該具有這些數據:整合性數據(integrated data)、詳細和匯總性的數據(detailed and summarized data)、歷史數據、解釋數據的數據。從數據倉庫挖掘出對決策有用的信息與知識,是建立數據倉庫與使用Data Mining的最大目的,兩者的本質與過程是兩回事。換句話說,數據倉庫應先行建立完成,Data mining才能有效率的進行,因為數據倉庫本身所含數據是干凈(不會有錯誤的數據參雜其中)、完備,且經過整合的。因此兩者關系或許可解讀為Data Mining是從巨大數據倉庫中找出有用信息的一種過程與技術。 NO.3 OLAP 能不能代替 Data Mining? 所謂OLAP(Online Analytical Process)意指由資料庫所連結出來的在線分析處理程序。有些人會說:「我已經有OLAP的工具了,所以我不需要Data Mining。」事實上兩者間是截然不同的,主要差異在於Data Mining用在產生假設,OLAP則用於查證假設。簡單來說,OLAP是由使用者所主導,使用者先有一些假設,然後利用OLAP來查證假設是否成立;而Data Mining則是用來幫助使用者產生假設。所以在使用OLAP或其它Query的工具時,使用者是自己在做探索(Exploration),但Data Mining是用工具在幫助做探索。 舉個例子來看,一市場分析師在為超市規劃貨品架櫃擺設時,可能會先假設嬰兒尿布和嬰兒奶粉會是常被一起購買的產品,接著便可利用OLAP的工具去驗證此假設是否為真,又成立的證據有多明顯;但Data Mining則不然,執行Data Mining的人將龐大的結帳數據整理後,並不需要假設或期待可能的結果,透過Mining技術可找出存在於數據中的潛在規則,於是我們可能得到例如尿布和啤酒常被同時購買的意料外之發現,這是OLAP所做不到的。 Data Mining常能挖掘出超越歸納范圍的關系,但OLAP僅能利用人工查詢及可視化的報表來確認某些關系,是以Data Mining此種自動找出甚至不會被懷疑過的數據模型與關系的特性,事實上已超越了我們經驗、教育、想像力的限制,OLAP可以和Data Mining互補,但這項特性是Data Mining無法被OLAP取代的。 NO.4 完整的Data Mining 包含哪些步驟? 以下提供一個Data Mining的進行步驟以為參考: 1. 理解業務與理解數據; 2. 獲取相關技術與知識; 3. 整合與查詢數據; 4. 去除錯誤或不一致及不完整的數據; 5. 由數據選取樣本先行試驗; 6. 建立數據模型 7. 實際Data Mining的分析工作; 8. 測試與檢驗; 9. 找出假設並提出解釋; 10. 持續應用於企業流程中。 由上述步驟可看出,Data Mining牽涉了大量的准備工作與規劃過程,事實上許多專家皆認為整套Data Mining的進行有80﹪的時間精力是花費在數據前置作業階段,其中包含數據的凈化與格式轉換甚或表格的連結。由此可知Data Mining只是信息挖掘過程中的一個步驟而已,在進行此步驟前還有許多的工作要先完成。 NO.5 Data Mining 運用了哪些理論與技術? Data Mining是近年來資料庫應用技術中相當熱門的議題,看似神奇、聽來時髦,實際上卻也不是什麼新東西,因其所用之諸如預測模型、數據分割,連結分析(Link Analysis)、偏差偵測(Deviation Detection)等,美國早在二次世界大戰前就已應用運用在人口普查及軍事等方面。 隨著信息科技超乎想像的進展,許多新的計算機分析工具問世,例如關系型資料庫、模糊計算理論、基因演算法則以及類神經網路等,使得從數據中發掘寶藏成為一種系統性且可實行的程序。 一般而言,Data Mining的理論技術可分為傳統技術與改良技術兩支。 傳統技術以統計分析為代表,統計學內所含序列統計、概率論、回歸分析、類別數據分析等都屬於傳統數據挖掘技術,尤其 Data Mining 對象多為變數繁多且樣本數龐大的數據,是以高等統計學里所含括之多變數分析中用來精簡變數的因素分析(Factor Analysis)、用來分類的判別分析(Discriminant Analysis),以及用來區隔群體的分群分析(Cluster Analysis)等,在Data Mining過程中特別常用。 在改良技術方面,應用較普遍的有決策樹理論(Decision Trees)、類神經網路(Neural Network)以及規則歸納法(Rules Inction)等。決策樹是一種用樹枝狀展現數據受各變數的影響情形之預測模型,根據對目標變數產生之效應的不同而建構分類的規則,一般多運用在對客戶數據的分析上,例如針對有回函與未回含的郵寄對象找出影響其分類結果的變數組合,常用分類方法為CART(Classification and Regression Trees)及CHAID(Chi-Square Automatic Interaction Detector)兩種。 類神經網路是一種模擬人腦思考結構的數據分析模式,由輸入之變數與數值中自我學習並根據學習經驗所得之知識不斷調整參數以期建構數據的型樣(patterns)。類神經網路為非線性的設計,與傳統回歸分析相比,好處是在進行分析時無須限定模式,特別當數據變數間存有交互效應時可自動偵測出;缺點則在於其分析過程為一黑盒子,故常無法以可讀之模型格式展現,每階段的加權與轉換亦不明確,是故類神經網路多利用於數據屬於高度非線性且帶有相當程度的變數交感效應時。 規則歸納法是知識發掘的領域中最常用的格式,這是一種由一連串的「如果…/則…(If / Then)」之邏輯規則對數據進行細分的技術,在實際運用時如何界定規則為有效是最大的問題,通常需先將數據中發生數太少的項目先剔除,以避免產生無意義的邏輯規則。 NO.6 Data Mining包含哪些主要功能? Data Mining實際應用功能可分為三大類六分項來說明:Classification和Clustering屬於分類區隔類;Regression和Time-series屬於推算預測類;Association和Sequence則屬於序列規則類。 Classification是根據一些變數的數值做計算,再依照結果作分類。(計算的結果最後會被分類為幾個少數的離散數值,例如將一組數據分為 "可能會響應" 或是 "可能不會響應" 兩類)。Classification常被用來處理如前所述之郵寄對象篩選的問題。我們會用一些根據歷史經驗已經分類好的數據來研究它們的特徵,然後再根據這些特徵對其他未經分類或是新的數據做預測。這些我們用來尋找特徵的已分類數據可能是來自我們的現有的客戶數據,或是將一個完整資料庫做部份取樣,再經由實際的運作來測試;譬如利用一個大型郵寄對象資料庫的部份取樣來建立一個Classification Model,再利用這個Model來對資料庫的其它數據或是新的數據作分類預測。 Clustering用在將數據分群,其目的在於將群間的差異找出來,同時也將群內成員的相似性找出來。Clustering與Classification不同的是,在分析前並不知道會以何種方式或根據來分類。所以必須要配合專業領域知識來解讀這些分群的意義。 Regression是使用一系列的現有數值來預測一個連續數值的可能值。若將范圍擴大亦可利用Logistic Regression來預測類別變數,特別在廣泛運用現代分析技術如類神經網路或決策樹理論等分析工具,推估預測的模式已不在止於傳統線性的局限,在預測的功能上大大增加了選擇工具的彈性與應用范圍的廣度。 Time-Series Forecasting與Regression功能類似,只是它是用現有的數值來預測未來的數值。兩者最大差異在於Time-Series所分析的數值都與時間有關。Time-Series Forecasting的工具可以處理有關時間的一些特性,譬如時間的周期性、階層性、季節性以及其它的一些特別因素(如過去與未來的關連性)。 Association是要找出在某一事件或是數據中會同時出現的東西。舉例而言,如果A是某一事件的一種選擇,則B也出現在該事件中的機率有多少。(例如:如果顧客買了火腿和柳橙汁,那麼這個顧客同時也會買牛奶的機率是85%。) Sequence Discovery與Association關系很密切,所不同的是Sequence Discovery中事件的相關是以時間因素來作區隔(例如:如果A股票在某一天上漲12%,而且當天股市加權指數下降,則B股票在兩天之內上漲的機率是 68%)。 NO.7 Data Mining在各領域的應用情形為何? Data Mining在各領域的應用非常廣泛,只要該產業擁有具分析價值與需求的數據倉儲或資料庫,皆可利用Mining工具進行有目的的挖掘分析。一般較常見的應用案例多發生在零售業、直效行銷界、製造業、財務金融保險、通訊業以及醫療服務等。 於銷售數據中發掘顧客的消費習性,並可藉由交易紀錄找出顧客偏好的產品組合,其它包括找出流失顧客的特徵與推出新產品的時機點等等都是零售業常見的實例;直效行銷強調的分眾概念與資料庫行銷方式在導入Data Mining的技術後,使直效行銷的發展性更為強大,例如利用Data Mining分析顧客群之消費行為與交易紀錄,結合基本數據,並依其對品牌價值等級的高低來區隔顧客,進而達到差異化行銷的目的;製造業對Data Mining的需求多運用在品質控管方面,由製造過程中找出影響產品品質最重要的因素,以期提高作業流程的效率。 近來電話公司、信用卡公司、保險公司以及股票交易商對於詐欺行為的偵測(Fraud Detection)都很有興趣,這些行業每年因為詐欺行為而造成的損失都非常可觀,Data Mining可以從一些信用不良的客戶數據中找出相似特徵並預測可能的詐欺交易,達到減少損失的目的。財務金融業可以利用 Data Mining來分析市場動向,並預測個別公司的營運以及股價走向。Data Mining的另一個獨特的用法是在醫療業,用來預測手術、用葯、診斷、或是流程式控制制的效率。 NO.8 Web Mining 和Data Mining有什麼不同? 如果將Web視為CRM的一個新的Channel,則Web Mining便可單純看做Data Mining應用在網路數據的泛稱。 該如何測量一個網站是否成功?哪些內容、優惠、廣告是人氣最旺的?主要訪客是哪些人?什麼原因吸引他們前來?如何從堆積如山之大量由網路所得數據中找出讓網站運作更有效率的操作因素?以上種種皆屬Web Mining 分析之范疇。Web Mining 不僅只限於一般較為人所知的log file分析,除了計算網頁瀏覽率以及訪客人次外,舉凡網路上的零售、財務服務、通訊服務、政府機關、醫療咨詢、遠距教學等等,只要由網路連結出的資料庫夠大夠完整,所有Off-Line可進行的分析,Web Mining都可以做,甚或更可整合Off-Line及On-Line的資料庫,實施更大規模的模型預測與推估,畢竟憑借網際網路的便利性與滲透力再配合網路行為的可追蹤性與高互動特質,一對一行銷的理念是最有機會在網路世界裡完全落實的。 整體而言,Web Mining具有以下特性:1. 數據收集容易且不引人注意,所謂凡走過必留下痕跡,當訪客進入網站後的一切瀏覽行為與歷程都是可以立即被紀錄的;2. 以互動式個人化服務為終極目標,除了因應不同訪客呈現專屬設計的網頁之外,不同的訪客也會有不同的服務;3. 可整合外部來源數據讓分析功能發揮地更深更廣,除了log file、cookies、會員填表數據、線上調查數據、線上交易數據等由網路直接取得的資源外,結合實體世界累積時間更久、范圍更廣的資源,將使分析的結果更准確也更深入。 利用Data Mining技術建立更深入的訪客數據剖析,並賴以架構精準的預測模式,以期呈現真正智能型個人化的網路服務,是Web Mining努力的方向。 NO.9 Data Mining 在 CRM 中扮演的角色為何? CRM(Customer Relationship Management)是近來引起熱烈討論與高度關切的議題,尤其在直效行銷的崛起與網路的快速發展帶動下,跟不上CRM的腳步如同跟不上時代。事實上CRM並不算新發明,奧美直效行銷推動十數年的CO(Customer Ownership)就是現在大家談的CRM—客戶關系管理。 Data Mining應用在CRM的主要方式可對應在Gap Analysis之三個部分: 針對Acquisition Gap,可利用Customer Profiling找出客戶的一些共同的特徵,希望能藉此深入了解客戶,藉由Cluster Analysis對客戶進行分群後再透過Pattern Analysis預測哪些人可能成為我們的客戶,以幫助行銷人員找到正確的行銷對象,進而降低成本,也提高行銷的成功率。 針對Sales Gap,可利用Basket Analysis幫助了解客戶的產品消費模式,找出哪些產品客戶最容易一起購買,或是利用Sequence Discovery預測客戶在買了某一樣產品之後,在多久之內會買另一樣產品等等。利用 Data Mining可以更有效的決定產品組合、產品推薦、進貨量或庫存量,甚或是在店裡要如何擺設貨品等,同時也可以用來評估促銷活動的成效。 針對Retention Gap,可以由原客戶後來卻轉成競爭對手的客戶群中,分析其特徵,再根據分析結果到現有客戶數據中找出可能轉向的客戶,然後設計一些方法預防客戶流失;更有系統的做法是藉由Neural Network根據客戶的消費行為與交易紀錄對客戶忠誠度進行Scoring的排序,如此則可區隔流失率的等級進而配合不同的策略。 CRM不是設一個(080)客服專線就算了,更不僅只是把一堆客戶基本數據輸入計算機就夠,完整的CRM運作機制在相關的硬軟體系統能健全的支持之前,有太多的數據准備工作與分析需要推動。
G. 求最小最大後悔值和決策樹問題各兩道!急!
1.結合實例說明什麼是最小最大後悔值法。
最小最大後悔值法也稱薩凡奇決策准則
最小最大後悔值法是指管理者在選擇了某方案後,如果將來發生的自然狀態表明其他方案的收益更大,那麼他(或她)會為自已的選擇而後悔。最小最大後悔值法就是使後悔值最小的方法。
最小最大後悔值法的運用
在股票市場上,最小最大後悔值法被稱為最小後悔法,是股票投資者力圖使後悔值降到最低限度的證券投資方法。
由於選取的購買方案往往與預測的企業經營狀況存在很大的差異,這樣就會出現實際收益大大低於目標收益的狀況而使投資者產生後悔。最小後悔法的目的就是要使投資者將這種後悔降低到最低程度。
利用最小後悔法買賣股票的操作程序:
1、列出投資者在各種狀態下的購買方案,並在每一購買方案中選出各自然狀態下的最大收益值。
2、求出各種自然狀態下各種方案的後悔值,其後悔值的公式是:「某方案後悔值」= 「某自然狀態下的最大收益值」-「該方案的收益值」,然後,將此方案的後悔值填入該方案欄中。
3、由此找出各方案在不同自然狀態下的最大後悔值。
4、在各方案的最大後悔值中找出最小的後悔值,最小後悔值所對應的方案即為最優方案。
2.舉例說明決策樹的作用。
決策樹是用二叉樹形圖來表示處理邏輯的一種工具。可以直觀、清晰地表達加工的邏輯要求。特別適合於判斷因素比較少、邏輯組合關系不復雜的情況。
決策樹提供了一種展示類似在什麼條件下會得到什麼值這類規則的方法。比如,在貸款申請中,要對申請的風險大小做出判斷,圖是為了解決這個問題而建立的一棵決策樹,從中我們可以看到決策樹的基本組成部分:決策節點、分支和葉子。
決策樹中最上面的節點稱為根節點,是整個決策樹的開始。本例中根節點是「收入>¥40,000」,對此問題的不同回答產生了「是」和「否」兩個分支。
決策樹的每個節點子節點的個數與決策樹在用的演算法有關。如CART演算法得到的決策樹每個節點有兩個分支,這種樹稱為二叉樹。允許節點含有多於兩個子節點的樹稱為多叉樹。
每個分支要麼是一個新的決策節點,要麼是樹的結尾,稱為葉子。在沿著決策樹從上到下遍歷的過程中,在每個節點都會遇到一個問題,對每個節點上問題的不同回答導致不同的分支,最後會到達一個葉子節點。這個過程就是利用決策樹進行分類的過程,利用幾個變數(每個變數對應一個問題)來判斷所屬的類別(最後每個葉子會對應一個類別)。
假如負責借貸的銀行官員利用上面這棵決策樹來決定支持哪些貸款和拒絕哪些貸款,那麼他就可以用貸款申請表來運行這棵決策樹,用決策樹來判斷風險的大小。「年收入>¥40,00」和「高負債」的用戶被認為是「高風險」,同時「收入<¥40,000」但「工作時間>5年」的申請,則被認為「低風險」而建議貸款給他/她。
數據挖掘中決策樹是一種經常要用到的技術,可以用於分析數據,同樣也可以用來作預測(就像上面的銀行官員用他來預測貸款風險)。常用的演算法有CHAID、 CART、 Quest 和C5.0。
建立決策樹的過程,即樹的生長過程是不斷的把數據進行切分的過程,每次切分對應一個問題,也對應著一個節點。對每個切分都要求分成的組之間的「差異」最大。
各種決策樹演算法之間的主要區別就是對這個「差異」衡量方式的區別。對具體衡量方式演算法的討論超出了本文的范圍,在此我們只需要把切分看成是把一組數據分成幾份,份與份之間盡量不同,而同一份內的數據盡量相同。這個切分的過程也可稱為數據的「純化」。看我們的例子,包含兩個類別--低風險和高風險。如果經過一次切分後得到的分組,每個分組中的數據都屬於同一個類別,顯然達到這樣效果的切分方法就是我們所追求的。
到現在為止我們所討論的例子都是非常簡單的,樹也容易理解,當然實際中應用的決策樹可能非常復雜。假定我們利用歷史數據建立了一個包含幾百個屬性、輸出的類有十幾種的決策樹,這樣的一棵樹對人來說可能太復雜了,但每一條從根結點到葉子節點的路徑所描述的含義仍然是可以理解的。決策樹的這種易理解性對數據挖掘的使用者來說是一個顯著的優點。
然而決策樹的這種明確性可能帶來誤導。比如,決策樹每個節點對應分割的定義都是非常明確毫不含糊的,但在實際生活中這種明確可能帶來麻煩(憑什麼說年收入¥40,001的人具有較小的信用風險而¥40,000的人就沒有)。
H. 考研金融學專業的研究方向都有哪些
一、金融經濟(含國際金融、金融理論)
具體研究馬克思、凱恩斯和斯密及當代著名經濟學家所闡述的金融學原理;研究虛擬經濟與實際經濟的關聯與影響;研究金融發展與經濟增長之間的關系,分析金融政策的期限結構和動態反饋機制,以及各國銀行制度與法規比較等。
熱度分析:截至2007年3月末,我國外債余額為3315.62億美元(不包括香港特區、澳門特區和台灣地區對外負債),比上年末增加85.74億美元,增長2.65%。許多新興的名詞如外匯儲備增速、開放資本項目管制、國有銀行股改、股票印花稅都涉及到重要的金融經濟理論問題。
就業方向:該方向就業范圍比較廣泛,與其他各個方向都有交叉的地方。畢業生主要去向是外向型投資銀行、證券公司、保險公司、基金管理公司和商業銀行等外資金融機構,以及中資金融機構的涉外部門、跨國公司投融資部門和政府經濟管理部門等相關工作。
二、投資學
投資學主要包括證券投資、國際投資、企業投資等幾個研究領域。
熱度分析:中國股市經歷牛市後,人們對投資學的興趣也隨之高漲,其實投資不僅僅是證券投資,其范圍極廣泛。國家發展、企業贏利、個人獲利,都離不開投資。
就業方向:一般來說,投資學專業的畢業生主要有以下幾個畢業去向:第一,到證券、信託投資公司和投資銀行從事證券投資;第二,到企業的投資部門從事企業投資工作;第三,到政府相關部門從事有關投資的政策制定和政策管理;第四,到高校、科研部門從事教學、科研工作。需要說明的是,應屆畢業生的第一份工作一般都是一線的操作員,因為沒有任何單位會讓一個沒有工作經驗的員工進入管理層,即使是基層管理崗位。
三、貨幣銀行學
主要研究的是跟銀行及國家貨幣政策相關的問題,這里的銀行包括中央銀行和商業銀行等等。
熱度分析:2006年以來,藉助人民幣匯率對美元升值效應,各家銀行紛紛推出本、外幣理財新產。之前就倍受關注的銀行業持續加溫,成為熱點。
就業方向:該專業方向主要在銀行系統、學校和科研單位從事金融業務和管理工作,多在金融教學、研究領域就業。隨著我國證券市場的不斷完善,進入工商企業和上市公司成為許多金融人才的就業方向。
四、保險學
保監會將保險專業的教學模式分為"西財模式"、"武大模式"和"南開模式",其對應的大學分別是西南財經大學、武漢大學和南開大學。而保險業的"黃埔軍校"則是位於湖南長沙的保險職業學院。
熱度分析:在我國,保險業被譽為2l世紀的朝陽產業。首先,我國巨大的人口基數以及人口的老齡化有利於保險業市場的擴張;其次,我國目前的保險深度及保險密度都很低,有很大的市場潛力;第三,人均收入水平的不斷提高,為保險業市場擴大規模提供良好的經濟基礎。保監會《中國保險業發展"十一五"規劃綱要(討論稿)》預計,未來5年我國保險業務收入年均增長15%左右。今年來許多險種受到關註:銀行保險、航意險、交強險、健康險、體育保險、房貸險、農業保險、高管責任險。
就業方向:許多人誤以為保險專業就業就是賣保險,實際上保險營銷只是保險業中一部分工作,其它工作諸如組訓、培訓講師、核賠核保人員和資金運作人員、精算人員。畢業生主要到保險公司、其他金融機構、社會保險部門及保險監管機構從事保險實務工作,也可到高等院校從事教學和研究工作。此外,還有中介企業、社會保障機構、政府監管機構、銀行和證券投資機構、大型企業風險管理部門等也需要該方向的畢業生。比較熱門的職業有保險代理人、保險核保、保險理賠、保險精算師(FIA)等等。
五、公司理財(公司金融)
又稱公司財務管理,公司理財等。一般來說,公司金融學會利用各種分析工具來管理公司的財務,例如使用貼現法(DCF)來為投資計劃總值作出評估,使用決策樹分析來了解投資及營運的彈性。
熱度分析:公司理財近年創下多個之最:貸款之最(E.On)、並購之最(Hospital Corporation of America)、證券化之最(Lloyds TSB Arkle)以及全球第一大IPO交易(中國工商銀行)。公司理財相比其他方向是歷史較短但發展很迅猛。
就業方向:該專業畢業生可選擇各類公司從事融資、投資工作;商業銀行、證券公司、基金管理公司等金融機構從事實務工作;也可以在金融監管機構、政府部門從事經濟管理工作,或進一步深造後從事教學科研工作。
I. 10、決策樹屬於( )。
風險型決策:在未來的決定因素,可能出現的結果不能作出充分肯定的情況下,根據各種可能結果的客觀概率作出的決策。決策者對此要承擔一定的風險。風險型問題具有決策者期望達到的明確標准,存在兩個以上的可供選擇方案和決策者無法控制的兩種以上的自然狀態,並且在不同自然狀態下不同方案的損益值可以計算出來,對於未來發生何種自然狀態,決策者雖然不能作出確定回答,但能大致估計出其發生的概率值。對這類決策問題,常用損益矩陣分析法和決策樹法求解;
程序化決策:就是可以根據既定的信息建立數學模型,把決策目標和約束條件統一起來,進行優化的一種決策。比如工廠選址、采購運輸等等決策。這種決策是可以運用籌學技術來完成的。在這種程序化決策中,決策所需要的信息都可以通過計量和統計調查得到,它的約束條件也是明確而具體的,並且都是能夠量化的。對於這種決策,運用計算機信息技術可以取得非常好的效果。通過建立數學模型,讓計算機代為運算,並找出最優的方案,都是在價值觀念之外做出的,至少價值觀念對這種決策的約束作用不是主導因素。
悲觀決策:採用悲觀決策准則,通常要放棄最大利益,但由於決策者是從每一方案最壞處著眼,因此風險較小。小中取大法又稱為最小風險法,是一種把風險降低到最小程度來獲取收益的股票投資方法。最小風險法是一種較為穩妥的股票投資決策方法,較適合保守型的股票投資者採用。
樂觀決策:
大中取大法又稱樂觀法、大中取大原則、樂觀決策法、冒險法、最大的最大收益法,採用這種方法的管理者對未來持樂觀的看法,認為未來會出現最好的自然狀態,因此不論採取哪種方案,都能獲取該方案的最大收益。
由於決策樹,是對事物進行定量和定性分析,採用各類事物產生的概率及風險進行評估,所以選A
J. 管理學-決策樹問題,求詳解
----------銷路好0.7 100萬
......1--|
. ----------銷路差0.3 -20萬
.
. ------------銷路好0.7 40萬
I--......2--|
. ------------銷路差0.3 30萬
.
. -----擴建4 95萬
. -----------Ⅱ---|
. | -----不擴建5 40萬
......3--|
|
|
---------------銷路差0.3 30萬
方案一:結點1的期望收益是(0.7*100-0.3*20)*10-300=340
方案二:結點2的期望收益是(0.7*40+0.3*30)*10-140=230
方案三:結點4的期望收益是95*7-200=465,大於結點5的期望收益40*7=280,所以銷路好時,擴建比不擴建好,結點3的期望收益是(0.7*40*3+0.7*465+0.3*30*10)-140=359.5
可以看出,三種方案中方案三最好
弄著一個決策樹真費勁,不如在word上好弄