股票价格机器学习_如何用Python和机器学习炒股赚钱

1. 机器学习在量化交易里面有多大的用处

曾有朋友问过，国内现在量化领域机器学习应用的少，是否因为效果不如简单的策略。其实，把机器学习应用在量化交易上始终面临着两难，却并不是无解的两难。很多时候并不是机器学习不work，而是真正懂如何用正确科学的统计思维使用Machine Learning的人才太少。
机器学习涉及到特征选择、特征工程、模型选择、数据预处理、结果的验证和分析等一整套建模流程，广义角度来说就不单单是模型选择的问题。所以，如果认为“用支持向量机成功预测股票涨跌” 这样的研究，就是把机器学习应用于量化交易，这种狭义的认识无疑是买椟还珠，对机器学习领域散落遍地的珍珠视而不见。如果把机器学习的崛起放在历史进程中考量，无非就是趋势的延续：现在，可通过系统的数据分析证实过去模糊不定的经验，机器学习算法将未曾被察觉的规律得以浮现纸面。
在我看来，未来的发展概有两个方向：
1.针对量化交易的统计学习算法被提出，使其适合于噪声大，分布不稳定的金融数据分析；
2.对于机器学习的热情回归理性，从工具为导向回归到问题为导向。
针对如何以问题为导向，在机器学习算法中挑选合适的工具，分享一些思路。
1.多因子模型的因子权重计算
当我们在构建多因子模型且已经选定了一系列因子之后，要如何根据不同的市场情况调整各个因子的权重呢？在以往的研究中发现，与其它算法相比较，随机森林算法对于存在非线性、噪音和自变量共线性的训练集的分析结果更出色。所以，目前在多因子模型的权重上，采用当期收益率对上期因子进行随机森林回归分析，以确定下一期多因子模型的因子权重。
2.缺失值处理
处理缺失值在金融的量化分析中是个无可避免的问题。选取合理的缺失值处理方法，依赖于数据本身的特点、数据缺失的情况、其对应的经济学意义，以及我们需要使用数据进行何种计算。在尝试构建多因子模型时，我们选择了两种缺失值替换方法：（1）采用期望最大化算法来用同一变量的已知数据对缺失值进行极大似然估计。（2）把模型中包含的所有因子作为特征变量，并赋予其相同的权重，再采用机器学习中的K-近邻算法来寻找最相似的标的，保证缺失值替换后，不会强化一部分因子的影响力。
其实在量化领域，机器学习解决着线性模型天生的缺陷或弊端，所以还是有着很深的介入的。除去凸优化、降维(提取市场特征)等领域的应用，目前“非动态性”和“非线性”是两个重要的弊端。金融关系之间并非静态，很多时候也不是线性的。统计学习的优势此时就会体现出来，它们能够迅速地适应市场，或者用一种更“准确的”方式来描述市场。
在国内，机器学习在量化内应用跟领域有很大的关系，跟频率也有很大的关系。比如，CTA的运用可能就要多于股票，它处理数据的维度要远小于股票，获取市场的长度和动态又强于股票。股票市场的momentum要弱于期货市场的momentum，它的趋势与股票相比更明显和低噪声。这些特征对于机器学习发挥作用都更加有利。
很可能国内一些交易执行算法的设计上就借鉴了机器学习。我们可以通过学习订单薄特征，对下一期盘口变化做一些概率上的预测，经过一定样本的训练之后，可以显著地提升算法表现。
而我仍谨慎看好深度学习等机器学习方法的原因在于，在认识市场上，现行的大部分方法与这些方法并不在一个维度上，这个优势让它们与其他方法相比，捕捉到更多的收益。也就是说，一个新的认识市场的角度才能带来alpha。

2. 机器学习可以预测股票走向，靠谱么

这种是不靠谱的，
因为机器的学习，
想要预测走向，
也是通过大数据来进行分析的。
这一个是根据以前的分析进行的，
所以说这一个是不靠谱的

3. 怎样让《机器学习》进行股票分析，提

学习程序语言，并专研人工智能；
设计相应程序，并不断优化升级；
同时了解与分析股票市场，设计师都不懂，机器怎么学？
设计众多分析公式与指标，比对最合理的参数；
谷歌也做过这样的分析，结果是无效。

现在不行，不等于将来不行。有志者事竟成。

4. 有没有大佬能利用机器学习预测30天后股票涨跌情况啊，我实现不出来，头都大了

考虑两个最简单的模型，第一个是趋势跟随，也就是正在上涨的股票后面大概率还会延续上涨，正在下跌的股票后面大概率还会延续下跌。第二个是均值回归，就是跌得多了，一定会涨；涨的过头了，一定会跌。用这两个作为输出，实现预测。

5. 股票不能通过机器学习来预测，你知道是为什么吗

因为股票市场是非线性的，而且是变化多端的，所以是没有办法进行人为预测的。而机器一般都是被人设定好的程序，所以也没有办法对股票来进行预测。现在很多人都对理财比较感兴趣，所以大家都会对自己的财产进行合理的分配有些人就会拿出自己一些财产来进行炒股。炒股是一门学问，所以并不是每一个人都能够在故事当中获得大量的收益的。

机器只能够模拟过去的股票市场，让大家在学习股票的时候对股票行情和市场有一个基本的了解。但是机器是没有办法预测未来的，所以想要通过机器来预测股市是根本不可能的事情。所以那些想要走捷径，想通过机器预测股票行情的人还是脚踏实地的自己买一些相关的书籍和课程自己学习吧。

6. 人工智能可以用来炒股吗

说的神乎其神，人工智能能用来炒股吗？

人工智能在围棋、象棋、德扑等领域都已经取得了碾压式胜利，这已经是一个不争的事实。事实上AlphaGo这样的AI已经可以用于任何需要理解复杂模式、进行长期计划、并制定决策的领域。人们不禁想问，还有什么是人工智能不能克服的吗？譬如说，变幻莫测的A股？

对于这个问题，持各种观点的都不乏其人。探讨它实可以分为两个部分：1. 股市可以预测吗？ 2、假如可以预测，用机器学习的方法去预测可以吗？

先回答第一个问题：股市的涨跌可以预测吗？

如果将股市的价格变化看做一个随时间变化的序列，Price = Market (t), 我们往往会发现，不管是尝试用N个模型(线性，非线性, 概率)来进行逼近，即使是建立了符合股价变化的这样的模型，并且在有足够多的训练数据的情况下模拟出了股价，但是这些模型最多只能在特定的区间能做一些并不十分精准的预测。

美国硅谷“感知力”技术公司让人工智能程序全程负责股票交易，与其他一些运用人工智能的投资公司不同，该公司交易部门只有两名员工负责监控机器，以确保出现不可控情形时可通过关机终止交易。据报道，“感知力”公司的人工智能投资系统可以通过经验学习实现“自主进化”。公司在全球拥有数千台同时运行的机器，其独特算法创造了数万亿被称为“基因”的虚拟交易者。系统利用历史数据模拟交易，目前可在几分钟内模拟1800天的交易量，经过测试，不好的“基因”被剔除，好的“基因”被保留。通过考验的好“基因”被用于真正的交易。公司员工只需设定好时间、回报率、风险指数等交易指标，剩下的一切都交由机器负责。

公司首席投资官杰夫·霍尔曼透露，目前机器在没有人为干预情况下掌握着大量股票，每天完成数以百计的交易，持仓期限为数日到几周。公司说机器的表现已超越他们设定的内部指标，但没有透露指标的具体内容。

随着人工智能技术的持续进步，人工智能投资成为被学术界和资本看好的领域。英国布里斯托尔大学教授克里斯蒂亚尼尼说，股票投资是十大最有可能被人工智能改变的行业之一。另一方面，也不是所有的投资商都信任机器，英国对冲基金曼氏金融首席科学家莱德福警告说，不应过度信任人工智能投资，该领域还远没有成熟。虽然有各种各样具有迷惑性的承诺，很多投资人的钱却有去无回。

7. 如何用Python和机器学习炒股赚钱

相信很多人都想过让人工智能来帮你赚钱，但到底该如何做呢？瑞士日内瓦的一位金融数据顾问 Gaëtan Rickter 近日发表文章介绍了他利用 Python 和机器学习来帮助炒股的经验，其最终成果的收益率跑赢了长期处于牛市的标准普尔 500 指数。虽然这篇文章并没有将他的方法完全彻底公开，但已公开的内容或许能给我们带来如何用人工智能炒股的启迪。

我终于跑赢了标准普尔 500 指数 10 个百分点！听起来可能不是很多，但是当我们处理的是大量流动性很高的资本时，对冲基金的利润就相当可观。更激进的做法还能得到更高的回报。

这一切都始于我阅读了 Gur Huberman 的一篇题为《Contagious Speculation and a Cure for Cancer: A Non-Event that Made Stock Prices Soar》的论文。该研究描述了一件发生在 1998 年的涉及到一家上市公司 EntreMed（当时股票代码是 ENMD）的事件：

「星期天《纽约时报》上发表的一篇关于癌症治疗新药开发潜力的文章导致 EntreMed 的股价从周五收盘时的 12.063 飙升至 85，在周一收盘时接近 52。在接下来的三周，它的收盘价都在 30 以上。这股投资热情也让其它生物科技股得到了溢价。但是，这个癌症研究方面的可能突破在至少五个月前就已经被 Nature 期刊和各种流行的报纸报道过了，其中甚至包括《泰晤士报》！因此，仅仅是热情的公众关注就能引发股价的持续上涨，即便实际上并没有出现真正的新信息。」

在研究者给出的许多有见地的观察中，其中有一个总结很突出：

「（股价）运动可能会集中于有一些共同之处的股票上，但这些共同之处不一定要是经济基础。」

我就想，能不能基于通常所用的指标之外的其它指标来划分股票。我开始在数据库里面挖掘，几周之后我发现了一个，其包含了一个分数，描述了股票和元素周期表中的元素之间的「已知和隐藏关系」的强度。

我有计算基因组学的背景，这让我想起了基因和它们的细胞信号网络之间的关系是如何地不为人所知。但是，当我们分析数据时，我们又会开始看到我们之前可能无法预测的新关系和相关性。

如果你使用机器学习，就可能在具有已知和隐藏关系的上市公司的寄生、共生和共情关系之上抢占先机，这是很有趣而且可以盈利的。最后，一个人的盈利能力似乎完全关乎他在生成这些类别的数据时想出特征标签（即概念（concept））的强大组合的能力。

我在这类模型上的下一次迭代应该会包含一个用于自动生成特征组合或独特列表的单独算法。也许会基于近乎实时的事件，这可能会影响那些具有只有配备了无监督学习算法的人类才能预测的隐藏关系的股票组。

8. 股票风险预测时，如何才能知道预测结果是否正确

随着机器学习和人工智能的兴起，预测：只需几行代码，就可以在初露头角的数据爱好者处轻松访问最新模型，且他们已经准备好随时攻克可能遇到的一切任务。

但是一知半解是危险的，虽然机器学习的大部分可以归因于统计和编程，但同样重要的是领域知识，但它往往被忽略。这一点在投资领域最为明显。

金融时间序列数据的信噪比一直都非常低，这种细微差别令人难以置信，从业人员花费了大量的精力来尝试实现难以捉摸的目标，但只有少数成功。因此，需要对数据进行更深入的了解，并且找出其成功的共通之处。

很多项目都是从选择一只股票开始的，这只股票通常是苹果(Apple)或亚马逊(Amazon)等科技公司的股票，原因很简单，这些公司众所周知，并在消费者的日常生活中根深蒂固。

这是有问题的，因为选股不是一个任意的过程，它是投资决策过程的一部分，本身需要一个模型。

以苹果为例，如果我们将其表现与更广泛的标准普尔500指数(SP 500)进行对比，我们会发现苹果的表现比该指数高出近60%。

乍一看，EWMA对标普500指数的预测非常准确，但如果我们仔细观察市场下滑的时期，就会发现情况并非看上去那样。

尽管蓝线和橙线似乎紧密相连，但EWMA策略仅能融合过去的信息，即它只包含了过去的信息，无法应对日内波动的信息，因此往往导致它预测上涨，但实际是下跌，反之亦然。在此期间采取这种策略，其表现将逊于标普500指数。

结论

在开始一个股票预测项目之前，特别是在你打算投入实际资金的项目之前，先对这个主题做一些研究并了解数据是有好处的。

如果结果好得令人难以置信。由于参与者的数量越来越多，而且参与者的水平也越来越高，市场在价格发现方面极其有效，尤其是在股票方面。

尽管这可能不会排除潜在机会的可能性，但这意味着需要比即时可用的算法和标准预处理技术更多的努力才能找到它。

股票价格机器学习

与股票价格机器学习相关的内容