股票價格機器學習_如何用Python和機器學習炒股賺錢

1. 機器學習在量化交易裡面有多大的用處

曾有朋友問過，國內現在量化領域機器學習應用的少，是否因為效果不如簡單的策略。其實，把機器學習應用在量化交易上始終面臨著兩難，卻並不是無解的兩難。很多時候並不是機器學習不work，而是真正懂如何用正確科學的統計思維使用Machine Learning的人才太少。
機器學習涉及到特徵選擇、特徵工程、模型選擇、數據預處理、結果的驗證和分析等一整套建模流程，廣義角度來說就不單單是模型選擇的問題。所以，如果認為「用支持向量機成功預測股票漲跌」這樣的研究，就是把機器學習應用於量化交易，這種狹義的認識無疑是買櫝還珠，對機器學習領域散落遍地的珍珠視而不見。如果把機器學習的崛起放在歷史進程中考量，無非就是趨勢的延續：現在，可通過系統的數據分析證實過去模糊不定的經驗，機器學習演算法將未曾被察覺的規律得以浮現紙面。
在我看來，未來的發展概有兩個方向：
1.針對量化交易的統計學習演算法被提出，使其適合於雜訊大，分布不穩定的金融數據分析；
2.對於機器學習的熱情回歸理性，從工具為導向回歸到問題為導向。
針對如何以問題為導向，在機器學習演算法中挑選合適的工具，分享一些思路。
1.多因子模型的因子權重計算
當我們在構建多因子模型且已經選定了一系列因子之後，要如何根據不同的市場情況調整各個因子的權重呢？在以往的研究中發現，與其它演算法相比較，隨機森林演算法對於存在非線性、噪音和自變數共線性的訓練集的分析結果更出色。所以，目前在多因子模型的權重上，採用當期收益率對上期因子進行隨機森林回歸分析，以確定下一期多因子模型的因子權重。
2.缺失值處理
處理缺失值在金融的量化分析中是個無可避免的問題。選取合理的缺失值處理方法，依賴於數據本身的特點、數據缺失的情況、其對應的經濟學意義，以及我們需要使用數據進行何種計算。在嘗試構建多因子模型時，我們選擇了兩種缺失值替換方法：（1）採用期望最大化演算法來用同一變數的已知數據對缺失值進行極大似然估計。（2）把模型中包含的所有因子作為特徵變數，並賦予其相同的權重，再採用機器學習中的K-近鄰演算法來尋找最相似的標的，保證缺失值替換後，不會強化一部分因子的影響力。
其實在量化領域，機器學習解決著線性模型天生的缺陷或弊端，所以還是有著很深的介入的。除去凸優化、降維(提取市場特徵)等領域的應用，目前「非動態性」和「非線性」是兩個重要的弊端。金融關系之間並非靜態，很多時候也不是線性的。統計學習的優勢此時就會體現出來，它們能夠迅速地適應市場，或者用一種更「准確的」方式來描述市場。
在國內，機器學習在量化內應用跟領域有很大的關系，跟頻率也有很大的關系。比如，CTA的運用可能就要多於股票，它處理數據的維度要遠小於股票，獲取市場的長度和動態又強於股票。股票市場的momentum要弱於期貨市場的momentum，它的趨勢與股票相比更明顯和低雜訊。這些特徵對於機器學習發揮作用都更加有利。
很可能國內一些交易執行演算法的設計上就借鑒了機器學習。我們可以通過學習訂單薄特徵，對下一期盤口變化做一些概率上的預測，經過一定樣本的訓練之後，可以顯著地提升演算法表現。
而我仍謹慎看好深度學習等機器學習方法的原因在於，在認識市場上，現行的大部分方法與這些方法並不在一個維度上，這個優勢讓它們與其他方法相比，捕捉到更多的收益。也就是說，一個新的認識市場的角度才能帶來alpha。

2. 機器學習可以預測股票走向，靠譜么

這種是不靠譜的，
因為機器的學習，
想要預測走向，
也是通過大數據來進行分析的。
這一個是根據以前的分析進行的，
所以說這一個是不靠譜的

3. 怎樣讓《機器學習》進行股票分析，提

學習程序語言，並專研人工智慧；
設計相應程序，並不斷優化升級；
同時了解與分析股票市場，設計師都不懂，機器怎麼學？
設計眾多分析公式與指標，比對最合理的參數；
谷歌也做過這樣的分析，結果是無效。

現在不行，不等於將來不行。有志者事竟成。

4. 有沒有大佬能利用機器學習預測30天後股票漲跌情況啊，我實現不出來，頭都大了

考慮兩個最簡單的模型，第一個是趨勢跟隨，也就是正在上漲的股票後面大概率還會延續上漲，正在下跌的股票後面大概率還會延續下跌。第二個是均值回歸，就是跌得多了，一定會漲；漲的過頭了，一定會跌。用這兩個作為輸出，實現預測。

5. 股票不能通過機器學習來預測，你知道是為什麼嗎

因為股票市場是非線性的，而且是變化多端的，所以是沒有辦法進行人為預測的。而機器一般都是被人設定好的程序，所以也沒有辦法對股票來進行預測。現在很多人都對理財比較感興趣，所以大家都會對自己的財產進行合理的分配有些人就會拿出自己一些財產來進行炒股。炒股是一門學問，所以並不是每一個人都能夠在故事當中獲得大量的收益的。

機器只能夠模擬過去的股票市場，讓大家在學習股票的時候對股票行情和市場有一個基本的了解。但是機器是沒有辦法預測未來的，所以想要通過機器來預測股市是根本不可能的事情。所以那些想要走捷徑，想通過機器預測股票行情的人還是腳踏實地的自己買一些相關的書籍和課程自己學習吧。

6. 人工智慧可以用來炒股嗎

說的神乎其神，人工智慧能用來炒股嗎？

人工智慧在圍棋、象棋、德撲等領域都已經取得了碾壓式勝利，這已經是一個不爭的事實。事實上AlphaGo這樣的AI已經可以用於任何需要理解復雜模式、進行長期計劃、並制定決策的領域。人們不禁想問，還有什麼是人工智慧不能克服的嗎？譬如說，變幻莫測的A股？

對於這個問題，持各種觀點的都不乏其人。探討它實可以分為兩個部分：1. 股市可以預測嗎？ 2、假如可以預測，用機器學習的方法去預測可以嗎？

先回答第一個問題：股市的漲跌可以預測嗎？

如果將股市的價格變化看做一個隨時間變化的序列，Price = Market (t), 我們往往會發現，不管是嘗試用N個模型(線性，非線性, 概率)來進行逼近，即使是建立了符合股價變化的這樣的模型，並且在有足夠多的訓練數據的情況下模擬出了股價，但是這些模型最多隻能在特定的區間能做一些並不十分精準的預測。

美國矽谷「感知力」技術公司讓人工智慧程序全程負責股票交易，與其他一些運用人工智慧的投資公司不同，該公司交易部門只有兩名員工負責監控機器，以確保出現不可控情形時可通過關機終止交易。據報道，「感知力」公司的人工智慧投資系統可以通過經驗學習實現「自主進化」。公司在全球擁有數千台同時運行的機器，其獨特演算法創造了數萬億被稱為「基因」的虛擬交易者。系統利用歷史數據模擬交易，目前可在幾分鍾內模擬1800天的交易量，經過測試，不好的「基因」被剔除，好的「基因」被保留。通過考驗的好「基因」被用於真正的交易。公司員工只需設定好時間、回報率、風險指數等交易指標，剩下的一切都交由機器負責。

公司首席投資官傑夫·霍爾曼透露，目前機器在沒有人為干預情況下掌握著大量股票，每天完成數以百計的交易，持倉期限為數日到幾周。公司說機器的表現已超越他們設定的內部指標，但沒有透露指標的具體內容。

隨著人工智慧技術的持續進步，人工智慧投資成為被學術界和資本看好的領域。英國布里斯托爾大學教授克里斯蒂亞尼尼說，股票投資是十大最有可能被人工智慧改變的行業之一。另一方面，也不是所有的投資商都信任機器，英國對沖基金曼氏金融首席科學家萊德福警告說，不應過度信任人工智慧投資，該領域還遠沒有成熟。雖然有各種各樣具有迷惑性的承諾，很多投資人的錢卻有去無回。

7. 如何用Python和機器學習炒股賺錢

相信很多人都想過讓人工智慧來幫你賺錢，但到底該如何做呢？瑞士日內瓦的一位金融數據顧問 Gaëtan Rickter 近日發表文章介紹了他利用 Python 和機器學習來幫助炒股的經驗，其最終成果的收益率跑贏了長期處於牛市的標准普爾 500 指數。雖然這篇文章並沒有將他的方法完全徹底公開，但已公開的內容或許能給我們帶來如何用人工智慧炒股的啟迪。

我終於跑贏了標准普爾 500 指數 10 個百分點！聽起來可能不是很多，但是當我們處理的是大量流動性很高的資本時，對沖基金的利潤就相當可觀。更激進的做法還能得到更高的回報。

這一切都始於我閱讀了 Gur Huberman 的一篇題為《Contagious Speculation and a Cure for Cancer: A Non-Event that Made Stock Prices Soar》的論文。該研究描述了一件發生在 1998 年的涉及到一家上市公司 EntreMed（當時股票代碼是 ENMD）的事件：

「星期天《紐約時報》上發表的一篇關於癌症治療新葯開發潛力的文章導致 EntreMed 的股價從周五收盤時的 12.063 飆升至 85，在周一收盤時接近 52。在接下來的三周，它的收盤價都在 30 以上。這股投資熱情也讓其它生物科技股得到了溢價。但是，這個癌症研究方面的可能突破在至少五個月前就已經被 Nature 期刊和各種流行的報紙報道過了，其中甚至包括《泰晤士報》！因此，僅僅是熱情的公眾關注就能引發股價的持續上漲，即便實際上並沒有出現真正的新信息。」

在研究者給出的許多有見地的觀察中，其中有一個總結很突出：

「（股價）運動可能會集中於有一些共同之處的股票上，但這些共同之處不一定要是經濟基礎。」

我就想，能不能基於通常所用的指標之外的其它指標來劃分股票。我開始在資料庫裡面挖掘，幾周之後我發現了一個，其包含了一個分數，描述了股票和元素周期表中的元素之間的「已知和隱藏關系」的強度。

我有計算基因組學的背景，這讓我想起了基因和它們的細胞信號網路之間的關系是如何地不為人所知。但是，當我們分析數據時，我們又會開始看到我們之前可能無法預測的新關系和相關性。

如果你使用機器學習，就可能在具有已知和隱藏關系的上市公司的寄生、共生和共情關系之上搶佔先機，這是很有趣而且可以盈利的。最後，一個人的盈利能力似乎完全關乎他在生成這些類別的數據時想出特徵標簽（即概念（concept））的強大組合的能力。

我在這類模型上的下一次迭代應該會包含一個用於自動生成特徵組合或獨特列表的單獨演算法。也許會基於近乎實時的事件，這可能會影響那些具有隻有配備了無監督學習演算法的人類才能預測的隱藏關系的股票組。

8. 股票風險預測時，如何才能知道預測結果是否正確

隨著機器學習和人工智慧的興起，預測：只需幾行代碼，就可以在初露頭角的數據愛好者處輕松訪問最新模型，且他們已經准備好隨時攻克可能遇到的一切任務。

但是一知半解是危險的，雖然機器學習的大部分可以歸因於統計和編程，但同樣重要的是領域知識，但它往往被忽略。這一點在投資領域最為明顯。

金融時間序列數據的信噪比一直都非常低，這種細微差別令人難以置信，從業人員花費了大量的精力來嘗試實現難以捉摸的目標，但只有少數成功。因此，需要對數據進行更深入的了解，並且找出其成功的共通之處。

很多項目都是從選擇一隻股票開始的，這只股票通常是蘋果(Apple)或亞馬遜(Amazon)等科技公司的股票，原因很簡單，這些公司眾所周知，並在消費者的日常生活中根深蒂固。

這是有問題的，因為選股不是一個任意的過程，它是投資決策過程的一部分，本身需要一個模型。

以蘋果為例，如果我們將其表現與更廣泛的標准普爾500指數(SP 500)進行對比，我們會發現蘋果的表現比該指數高出近60%。

乍一看，EWMA對標普500指數的預測非常准確，但如果我們仔細觀察市場下滑的時期，就會發現情況並非看上去那樣。

盡管藍線和橙線似乎緊密相連，但EWMA策略僅能融合過去的信息，即它只包含了過去的信息，無法應對日內波動的信息，因此往往導致它預測上漲，但實際是下跌，反之亦然。在此期間採取這種策略，其表現將遜於標普500指數。

結論

在開始一個股票預測項目之前，特別是在你打算投入實際資金的項目之前，先對這個主題做一些研究並了解數據是有好處的。

如果結果好得令人難以置信。由於參與者的數量越來越多，而且參與者的水平也越來越高，市場在價格發現方面極其有效，尤其是在股票方面。

盡管這可能不會排除潛在機會的可能性，但這意味著需要比即時可用的演算法和標准預處理技術更多的努力才能找到它。

股票價格機器學習

與股票價格機器學習相關的內容