当前位置:首页 » 分析预测 » 股票大数据分析模型
扩展阅读
出钱买股票信息可靠吗 2025-05-08 03:17:45
京东股票不能买股票了 2025-05-08 03:17:43
a股深圳燃气股票行情 2025-05-08 03:15:30

股票大数据分析模型

发布时间: 2022-06-20 19:59:59

⑴ 股票的预测模型有哪些

股票的预测模型:
1、净现金流量折现法;
2、投资机会折现法;
3、股利折现法;
4、盈余折现法;
除此之外,想了解更多的股票类的知识,可以下载财源滚滚APP软件,系统学习下

⑵ 大数据分析中,有哪些常见的大数据分析模型

数据分析模型主要是用来指导数据分析师进行一个完整的数据分析,更多是指导数据分析的思路。数据分析常用的模型有:
留存分析模型:用来分析用户参与情况/活跃程度的分析模型,考察进行初始行为的用户中,有多少人会进行后续行为;
全行为路径分析:根据每位用户在APP或网站中的行为事件,分析用户在APP或网站中各个模块的流转规律与特点,挖掘用户的访问或浏览模式,进而实现一些特定的业务用途;
漏斗分析模型:能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型;
热图分析模型:其实就是指页面点击分析;
事件分析模型:是针对用户行为的分析模型之一,也是用户行为数据分析的核心和基础;
用户分群模型:对用户进行精细化运营,用户分群能帮助企业更加了解用户,分析用户的属性特征、以及用户的行为特征;
用户分析模型:通过查看用户数量在注册时间上的变化趋势、查看用户按省份的分布情况等等,丰富用户画像维度;
黏性分析模型:在留存分析的基础上,对一些用户指标进行深化;

⑶ 大数据分析方法与模型有哪些

1、分类分析数据分析法


在数据分析中,如果将数据进行分类就能够更好的分析。分类分析是将一些未知类别的部分放进我们已经分好类别中的其中某一类;或者将对一些数据进行分析,把这些数据归纳到接近这一程度的类别,并按接近这一程度对观测对象给出合理的分类。这样才能够更好的进行分析数据。


2、对比分析数据分析方法


很多数据分析也是经常使用对比分析数据分析方法。对比分析法通常是把两个相互有联系的数据进行比较,从数量上展示和说明研究对象在某一标准的数量进行比较,从中发现其他的差异,以及各种关系是否协调。


3、相关分析数据分析法


相关分析数据分析法也是一种比较常见数据分析方法,相关分析是指研究变量之间相互关系的一类分析方法。按是否区别自变量和因变量为标准一般分为两类:一类是明确自变量和因变量的关系;另一类是不区分因果关系,只研究变量之间是否相关,相关方向和密切程度的分析方法。


4、综合分析数据分析法


层次分析法,是一种实用的多目标或多方案的决策方法。由于他在处理复杂的决策问题上的实用性和有效性,而层次分析数据分析法在世界范围得到广泛的应用。它的应用已遍及经济计划和管理,能源政策和分配,行为科学、军事指挥、运输、农业、教育、医疗和环境等多领域。

⑷ 股票数据分析方法

股票价格的涨跌,简单来说,供求决定价格,买的人多价格就涨,卖的人多价格就跌。做成买卖不平行的原因是多方面的,影响股市的政策面、基本面、技术面、资金面、消息面等,是利空还是利多,升多了会有所调整,跌多了也会出现反弹,这是不变的规律。

⑸ 股票的估值模型越复杂,引用的大数据越多,获得的估值结果就越精确

股票估值的变量很多,从原理上说,引用的数据越多,估值结果就越精确。但是引用的每一个数据都不是准确的,所以引用再多的数据也是没用的。

⑹ 股票诊断工具 一般使用什么模型

诊股大致分为四个方面,一技术面二资金面三消息面四基本面,其实就是把传统和市面上所有能用到的分析方法总结在一起进行大数据分析。
比如技术面的“缩量”“超卖”“价跌量升”“一阳穿三线”“红三兵”等等等,只要近期出现了某个技术指标,就点亮一个,然后放入大数据中进行分析,如出现“价跌量升”特征后,该股近几年的表现是如何如何,平均涨跌幅等等等。
其他的也是一样,比如消息面,就是把最近所有和该股有关系的新闻罗列出来,分为利好面和利空面,并给出市场的看法(如看好或看空)。
基本面,是把所有的基本属性列出来,比如市盈率,市净率,营业收入增长(降低),毛利率,净利率,收益率等等等,然后做出图表和整个板块对比得出排名,最后给出一个看法。
比如排名在前列,看好,排名中间,观望,排名最后,看空。
资金面的分析是最乱的,它统计的是主力资金的净流入和流出,但我们知道交割是平衡的,也就是卖了多少,就一定有人买多少。
所谓的主力净流入一般是指大单主动买入,每个软件的计算方法不一样(如多少手以上算大单?),但计算方式相同。

⑺ 如何用大数据炒股

我们如今生活在一个数据爆炸的世界里。网络每天响应超过60亿次的搜索请求,日处理数据超过100PB,相当于6000多座中国国家图书馆的书籍信息量总和。新浪微博每天都会发布上亿条微博。在荒无人烟的郊外,暗藏着无数大公司的信息存储中心,24小时夜以继日地运转着。
克托·迈尔-舍恩伯格在《大数据时代》一书中认为,大数据的核心就是预测,即只要数据丰富到一定程度,就可预测事情发生的可能性。例如,“从一个人乱穿马路时行进的轨迹和速度来看他能及时穿过马路的可能性”,或者通过一个人穿过马路的速度,预测车子何时应该减速从而让他及时穿过马路。

那么,如果把这种预测能力应用在股票投资上,又会如何?

目前,美国已经有许多对冲基金采用大数据技术进行投资,并且收获甚丰。中国的中证广发网络百发100指数基金(下称百发100),上线四个多月以来已上涨68%。

和传统量化投资类似,大数据投资也是依靠模型,但模型里的数据变量几何倍地增加了,在原有的金融结构化数据基础上,增加了社交言论、地理信息、卫星监测等非结构化数据,并且将这些非结构化数据进行量化,从而让模型可以吸收。

由于大数据模型对成本要求极高,业内人士认为,大数据将成为共享平台化的服务,数据和技术相当于食材和锅,基金经理和分析师可以通过平台制作自己的策略。

量化非结构数据

不要小看大数据的本领,正是这项刚刚兴起的技术已经创造了无数“未卜先知”的奇迹。

2014年,网络用大数据技术预测命中了全国18卷中12卷高考作文题目,被网友称为“神预测”。网络公司人士表示,在这个大数据池中,包含互联网积累的用户数据、历年的命题数据以及教育机构对出题方向作出的判断。

在2014年巴西世界杯比赛中,Google亦通过大数据技术成功预测了16强和8强名单。

从当年英格兰报社的信鸽、费城股票交易所的信号灯到报纸电话,再到如今的互联网、云计算、大数据,前沿技术迅速在投资领域落地。在股票策略中,大数据日益崭露头角。

做股票投资策略,需要的大数据可以分为结构化数据和非结构化数据。结构化数据,简单说就是“一堆数字”,通常包括传统量化分析中常用的CPI、PMI、市值、交易量等专业信息;非结构化数据就是社交文字、地理位置、用户行为等“还没有进行量化的信息”。

量化非结构化就是用深度模型替代简单线性模型的过程,其中所涉及的技术包括自然语言处理、语音识别、图像识别等。

金融大数据平台-通联数据CEO王政表示,通联数据采用的非结构化数据可以分为三类:第一类和人相关,包括社交言论、消费、去过的地点等;第二类与物相关,如通过正在行驶的船只和货车判断物联网情况;第三类则是卫星监测的环境信息,包括汽车流、港口装载量、新的建筑开工等情况。

卫星监测信息在美国已被投入使用,2014年Google斥资5亿美元收购了卫星公司Skybox,从而可以获得实施卫星监测信息。

结构化和非结构化数据也常常相互转化。“结构化和非结构化数据可以形象理解成把所有数据装在一个篮子里,根据应用策略不同相互转化。例如,在搜索频率调查中,用户搜索就是结构化数据;在金融策略分析中,用户搜索就是非结构化数据。”网络公司人士表示。

华尔街拿着丰厚薪水的分析师们还不知道,自己的雇主已经将大量资本投向了取代自己的机器。
2014年11月23日,高盛向Kensho公司投资1500万美元,以支持该公司的大数据平台建设。该平台很像iPhone里的Siri,可以快速整合海量数据进行分析,并且回答投资者提出的各种金融问题,例如“下月有飓风,将对美国建材板块造成什么影响?”

在Kensho处理的信息中,有80%是“非结构化”数据,例如政策文件、自然事件、地理环境、科技创新等。这类信息通常是电脑和模型难以消化的。因此,Kensho的CEO Daniel Nadler认为,华尔街过去是基于20%的信息做出100%的决策。

既然说到高盛,顺便提一下,这家华尔街老牌投行如今对大数据可谓青睐有加。除了Kensho,高盛还和Fortress信贷集团在两年前投资了8000万美元给小额融资平台On Deck Capital。这家公司的核心竞争力也是大数据,它利用大数据对中小企业进行分析,从而选出值得投资的企业并以很快的速度为之提供短期贷款。

捕捉市场情绪

上述诸多非结构化数据,归根结底是为了获得一个信息:市场情绪。

在采访中,2013年诺贝尔经济学奖得主罗伯特•席勒的观点被无数采访对象引述。可以说,大数据策略投资的创业者们无一不是席勒的信奉者。

席勒于上世纪80年代设计的投资模型至今仍被业内称道。在他的模型中,主要参考三个变量:投资项目计划的现金流、公司资本的估算成本、股票市场对投资的反应(市场情绪)。他认为,市场本身带有主观判断因素,投资者情绪会影响投资行为,而投资行为直接影响资产价格。
然而,在大数据技术诞生之前,市场情绪始终无法进行量化。

回顾人类股票投资发展史,其实就是将影响股价的因子不断量化的过程。

上世纪70年代以前,股票投资是一种定性的分析,没有数据应用,而是一门主观的艺术。随着电脑的普及,很多人开始研究驱动股价变化的规律,把传统基本面研究方法用模型代替,市盈率、市净率的概念诞生,量化投资由此兴起。

量化投资技术的兴起也带动了一批华尔街大鳄的诞生。例如,巴克莱全球投资者(BGI)在上世纪70年代就以其超越同行的电脑模型成为全球最大的基金管理公司;进入80年代,另一家基金公司文艺复兴(Renaissance)年均回报率在扣除管理费和投资收益分成等费用后仍高达34%,堪称当时最佳的对冲基金,之后十多年该基金资产亦十分稳定。

“从主观判断到量化投资,是从艺术转为科学的过程。”王政表示,上世纪70年代以前一个基本面研究员只能关注20只到50只股票,覆盖面很有限。有了量化模型就可以覆盖所有股票,这就是一个大的飞跃。此外,随着计算机处理能力的发展,信息的用量也有一个飞跃变化。过去看三个指标就够了,现在看的指标越来越多,做出的预测越来越准确。

随着21世纪的到来,量化投资又遇到了新的瓶颈,就是同质化竞争。各家机构的量化模型越来越趋同,导致投资结果同涨同跌。“能否在看到报表数据之前,用更大的数据寻找规律?”这是大数据策略创业者们试图解决的问题。

于是,量化投资的多米诺骨牌终于触碰到了席勒理论的第三层变量——市场情绪。

计算机通过分析新闻、研究报告、社交信息、搜索行为等,借助自然语言处理方法,提取有用的信息;而借助机器学习智能分析,过去量化投资只能覆盖几十个策略,大数据投资则可以覆盖成千上万个策略。

基于互联网搜索数据和社交行为的经济预测研究,已逐渐成为一个新的学术热点,并在经济、社会以及健康等领域的研究中取得了一定成果。在资本市场应用上,研究发现搜索数据可有效预测未来股市活跃度(以交易量指标衡量)及股价走势的变化。

海外就有学术研究指出,公司的名称或者相关关键词的搜索量,与该公司的股票交易量正相关。德国科学家Tobias Preis就进行了如此研究:Tobias利用谷歌搜索引擎和谷歌趋势(Google Trends),以美国标普500指数的500只股票为其样本,以2004年至2010年为观察区间,发现谷歌趋势数据的公司名称搜索量和对应股票的交易量,在每周一次的时间尺度上有高度关联性。也就是说,当某个公司名称在谷歌的搜索量活动增加时,无论股票的价格是上涨或者下跌,股票成交量与搜索量增加;反之亦然,搜索量下降,股票成交量下降。以标普500指数的样本股为基础,依据上述策略构建的模拟投资组合在六年的时间内获得了高达329%的累计收益。

在美国市场上,还有多家私募对冲基金利用Twitter和Facebook的社交数据作为反映投资者情绪和市场趋势的因子,构建对冲投资策略。利用互联网大数据进行投资策略和工具的开发已经成为世界金融投资领域的新热点。

保罗·霍丁管理的对冲基金Derwent成立于2011年5月,注册在开曼群岛,初始规模约为4000万美元, 2013年投资收益高达23.77%。该基金的投资标的包括流动性较好的股票及股票指数产品。
通联数据董事长肖风在《投资革命》中写道,Derwent的投资策略是通过实时跟踪Twitter用户的情绪,以此感知市场参与者的“贪婪与恐惧”,从而判断市场涨跌来获利。

在Derwent的网页上可以看到这样一句话:“用实时的社交媒体解码暗藏的交易机会。”保罗·霍丁在基金宣传册中表示:“多年以来,投资者已经普遍接受一种观点,即恐惧和贪婪是金融市场的驱动力。但是以前人们没有技术或数据来对人类情感进行量化。这是第四维。Derwent就是要通过即时关注Twitter中的公众情绪,指导投资。”

另一家位于美国加州的对冲基金MarketPsych与汤普森·路透合作提供了分布在119个国家不低于18864项独立指数,比如每分钟更新的心情状态(包括乐观、忧郁、快乐、害怕、生气,甚至还包括创新、诉讼及冲突情况等),而这些指数都是通过分析Twitter的数据文本,作为股市投资的信号。

此类基金还在不断涌现。金融危机后,几个台湾年轻人在波士顿组建了一家名为FlyBerry的对冲基金,口号是“Modeling the World(把世界建模)”。它的投资理念全部依托大数据技术,通过监测市场舆论和行为,对投资做出秒速判断。

关于社交媒体信息的量化应用,在股票投资之外的领域也很常见:Twitter自己也十分注重信息的开发挖掘,它与DataSift和Gnip两家公司达成了一项出售数据访问权限的协议,销售人们的想法、情绪和沟通数据,从而作为顾客的反馈意见汇总后对商业营销活动的效果进行判断。从事类似工作的公司还有DMetics,它通过对人们的购物行为进行分析,寻找影响消费者最终选择的细微原因。

回到股票世界,利用社交媒体信息做投资的公司还有StockTwits。打开这家网站,首先映入眼帘的宣传语是“看看投资者和交易员此刻正如何讨论你的股票”。正如其名,这家网站相当于“股票界的Twitter”,主要面向分析师、媒体和投资者。它通过机器和人工相结合的手段,将关于股票和市场的信息整理为140字以内的短消息供用户参考。

此外,StockTwits还整合了社交功能,并作为插件可以嵌入Twitter、Facebook和LinkedIn等主要社交平台,让人们可以轻易分享投资信息。

另一家公司Market Prophit也很有趣。这家网站的宣传语是“从社交媒体噪音中提炼市场信号”。和StockTwits相比,Market Prophit更加注重大数据的应用。它采用了先进的语义分析法,可以将Twitter里的金融对话量化为“-1(极度看空)”到“1(极度看多)”之间的投资建议。网站还根据语义量化,每天公布前十名和后十名的股票热度榜单。网站还设计了“热度地图”功能,根据投资者情绪和意见,按照不同板块,将板块内的个股按照颜色深浅进行标注,谁涨谁跌一目了然。

中国原创大数据指数

尽管大数据策略投资在美国貌似炙手可热,但事实上,其应用尚仅限于中小型对冲基金和创业平台公司。大数据策略投资第一次被大规模应用,应归于中国的百发100。

网络金融中心相关负责人表示,与欧美等成熟资本市场主要由理性机构投资者构成相比,东亚尤其是中国的股票类证券投资市场仍以散户为主,因此市场受投资者情绪和宏观政策性因素影响很大。而个人投资者行为可以更多地反映在互联网用户行为大数据上,从而为有效地预测市场情绪和趋势提供了可能。这也就是中国国内公募基金在应用互联网大数据投资方面比海外市场并不落后、甚至领先的原因。

百发100指数由网络、中证指数公司、广发基金联合研发推出,于2014年7月8日正式对市场发布,实盘运行以来一路上涨,涨幅超过60%。跟踪该指数的指数基金规模上限为30亿份,2014年9月17日正式获批,10月20日发行时一度创下26小时疯卖18亿份的“神话”。

外界都知道百发100是依托大数据的指数基金,但其背后的细节鲜为人知。

百发100数据层面的分析分为两个层面,即数据工厂的数据归集和数据处理系统的数据分析。其中数据工厂负责大数据的收集分析,例如将来源于互联网的非结构化数据进行指标化、产品化等数据量化过程;数据处理系统,可以在数据工厂递交的大数据中寻找相互统计关联,提取有效信息,最终应用于策略投资。

“其实百发100是在传统量化投资技术上融合了基于互联网大数据的市场走势和投资情绪判断。”业内人士概括道。

和传统量化投资类似,百发100对样本股的甄选要考虑财务因子、基本面因子和动量因子,包括净资产收益率(ROE)、资产收益率(ROA)、每股收益增长率(EPS)、流动负债比率、企业价值倍数(EV/EBITDA)、净利润同比增长率、股权集中度、自由流通市值以及最近一个月的个股价格收益率和波动率等。

此外,市场走势和投资情绪是在传统量化策略基础上的创新产物,也是百发100的核心竞争力。接近网络的人士称,市场情绪因子对百发100基金起决定性作用。

网络金融中心相关负责人是罗伯特•席勒观点的支持者。他认为,投资者行为和情绪对资产价格、市场走势有着巨大的影响。因此“通过互联网用户行为大数据反映的投资市场情绪、宏观经济预期和走势,成为百发100指数模型引入大数据因子的重点”。

传统量化投资主要着眼点在于对专业化金融市场基本面和交易数据的应用。但在网络金融中心相关业务负责人看来,无论是来源于专业金融市场的结构化数据,还是来源于互联网的非结构化数据,都是可以利用的数据资源。因此,前文所述的市场情绪数据,包括来源于互联网的用户行为、搜索量、市场舆情、宏观基本面预期等等,都被网络“变废为宝”,从而通过互联网找到投资者参与特征,选出投资者关注度较高的股票。

“与同期沪深300指数的表现相较,百发100更能在股票市场振荡时期、行业轮动剧烈时期、基本面不明朗时期抓住市场热点、了解投资者情绪、抗击投资波动风险。”网络金融中心相关负责人表示。

百发100选取的100只样本股更换频率是一个月,调整时间为每月第三周的周五。

业内人士指出,百发100指数的月收益率与中证100、沪深300、中证500的相关性依次提升,说明其投资风格偏向中小盘。

但事实并非如此。从样本股的构成来说,以某一期样本股为例,样本股总市值6700亿元,占A股市值4.7%。样本股的构成上,中小板21只,创业板4只,其余75只样本股均为大盘股。由此可见,百发100还是偏向大盘为主、反映主流市场走势。

样本股每个月的改变比例都不同,最极端的时候曾经有60%进行了换仓。用大数据预测热点变化,市场热点往往更迭很快;但同时也要考虑交易成本。两方面考虑,网络最后测算认为一个月换一次仓位为最佳。

样本股对百发100而言是核心机密——据说“全世界只有基金经理和指数编制机构负责人两个人知道”——都是由机器决定后,基金经理分配给不同的交易员建仓买入。基金经理也没有改变样本股的权利。

展望未来,网络金融中心相关负责人踌躇满志,“百发100指数及基金的推出,只是我们的开端和尝试,未来将形成多样化、系列投资产品。”

除了百发100,目前市场上打着大数据旗帜的基金还有2014年9月推出的南方-新浪I100和I300指数基金。

南方-新浪I100和I300是由南方基金、新浪财经和深圳证券信息公司三方联合编制的。和百发100类似,也是按照财务因子和市场情绪因子进行模型打分,按照分值将前100和前300名股票构成样本股。推出至今,这两个指数基金分别上涨了10%左右。

正如百发100的市场情绪因子来自网络,南方-新浪I100和I300的市场情绪因子全部来自新浪平台。其中包括用户在新浪财经对行情的访问热度、对股票的搜索热度;用户在新浪财经对股票相关新闻的浏览热度;股票相关微博的多空分析数据等。

此外,阿里巴巴旗下的天弘基金也有意在大数据策略上做文章。据了解,天弘基金将和阿里巴巴合作,推出大数据基金产品,最早将于2015年初问世。

天弘基金机构产品部总经理刘燕曾对媒体表示,“在传统的调研上,大数据将贡献于基础资产的研究,而以往过度依赖线下研究报告。大数据将视野拓展至了线上的数据分析,给基金经理选股带来新的逻辑。”

在BAT三巨头中,腾讯其实是最早推出指数基金的。腾讯与中证指数公司、济安金信公司合作开发的“中证腾安价值100指数”早在2013年5月就发布了,号称是国内第一家由互联网媒体与专业机构编制发布的A股指数。不过,业内人士表示,有关指数并没有真正应用大数据技术。虽然腾讯旗下的微信是目前最热的社交平台,蕴藏了大量的社交数据,但腾讯未来怎么开发,目前还并不清晰。

大数据投资平台化

中欧商学院副教授陈威如在其《平台战略》一书中提到,21世纪将成为一道分水岭,人类商业行为将全面普及平台模式,大数据金融也不例外。

然而,由于大数据模型对成本要求极高,就好比不可能每家公司都搭建自己的云计算系统一样,让每家机构自己建设大数据模型,从数据来源和处理技术方面看都是不现实的。业内人士认为,大数据未来必将成为平台化的服务。

目前,阿里、网络等企业都表示下一步方向是平台化。

蚂蚁金服所致力搭建的平台,一方面包括招财宝一类的金融产品平台,另一方面包括云计算、大数据服务平台。蚂蚁金服人士说,“我们很清楚自己的优势不是金融,而是包括电商、云计算、大数据等技术。蚂蚁金服希望用这些技术搭建一个基础平台,把这些能力开放出去,供金融机构使用。”

网络亦是如此。接近网络的人士称,未来是否向平台化发展,目前还在讨论中,但可以确定的是,“网络不是金融机构,目的不是发产品,百发100的意义在于打造影响力,而非经济效益。”
当BAT还在摸索前行时,已有嗅觉灵敏者抢占了先机,那就是通联数据。

通联数据股份公司(DataYes)由曾任博时基金副董事长肖风带队创建、万向集团投资成立,总部位于上海,公司愿景是“让投资更容易,用金融服务云平台提升投资管理效率和投研能力”。该平台7月上线公测,目前已拥有130多家机构客户,逾万名个人投资者。

通联数据目前有四个主要平台,分别是通联智能投资研究平台、通联金融大数据服务平台、通联多资产投资管理平台和金融移动办公平台。

通联智能投资研究平台包括雅典娜-智能事件研究、策略研究、智能研报三款产品,可以对基于自然语言的智能事件进行策略分析,实时跟踪市场热点,捕捉市场情绪。可以说,和百发100类似,其核心技术在于将互联网非结构化数据的量化使用。

通联金融大数据服务平台更侧重于专业金融数据的分析整理。它可以提供公司基本面数据、国内外主要证券、期货交易所的行情数据、公司公告数据、公关经济、行业动态的结构化数据、金融新闻和舆情的非结构化数据等。

假如将上述两个平台比作“收割机”,通联多资产投资管理平台就是“厨房”。在这个“厨房”里,可以进行全球跨资产的投资组合管理方案、订单管理方案、资产证券化定价分析方案等。

通联数据可以按照主题热点或者自定义关键字进行分析,构建知识图谱,将相关的新闻和股票提取做成简洁的分析框架。例如用户对特斯拉感兴趣,就可以通过主题热点看到和特斯拉相关的公司,并判断这个概念是否值得投资。“过去这个搜集过程要花费几天时间,现在只需要几分钟就可以完成。”王政表示。

“通联数据就好比一家餐馆,我们把所有原料搜集来、清洗好、准备好,同时准备了一个锅,也就是大数据存储平台。研究员和基金经理像厨师一样,用原料、工具去‘烹制’自己的策略。”王政形容道。

大数据在平台上扮演的角色,就是寻找关联关系。人类总是习惯首先构建因果关系,继而去倒推和佐证。机器学习则不然,它可以在海量数据中查获超越人类想象的关联关系。正如维克托`迈尔-舍恩伯格在《大数据时代》中所提到的,社会需要放弃它对因果关系的渴求,而仅需关注相互关系。

例如,美国超市沃尔玛通过大数据分析,发现飓风用品和蛋挞摆在一起可以提高销量,并由此创造了颇大的经济效益。如果没有大数据技术,谁能将这毫无关联的两件商品联系在一起?
通联数据通过机器学习,也能找到传统量化策略无法发现的市场联系。其中包括各家公司之间的资本关系、产品关系、竞争关系、上下游关系,也包括人与人之间的关系,例如管理团队和其他公司有没有关联,是否牵扯合作等。

未来量化研究员是否将成为一个被淘汰的职业?目前研究员的主要工作就是收集整理数据,变成投资决策,而之后这个工作将更多由机器完成。

“当初医疗科技发展时,人们也认为医生会被淘汰,但其实并不会。同理,研究员也会一直存在,但他们会更注重深入分析和调研,初级的数据搜集可以交给机器完成。”王政表示。
但当未来大数据平台并广泛应用后,是否会迅速挤压套利空间?这也是一个问题。回答根据网上资料整理

⑻ 如何用大数据分析股票

首先要自己建立模型才行。

⑼ 股票估值有哪些经典的模型,要具体过程 谢谢

股票估值分类
绝对估值
绝对估值是通过对上市公司历史及当前的基本面的分析和对未来反应公司经营状况的财务数据的预测获得上市公司股票的内在价值。
绝对估值的方法:一是现金流贴现定价模型,二是B-S期权定价模型(主要应用于期权定价、权证定价等)。现金流贴现定价模型目前使用最多的是DDM和DCF,而DCF估值模型中,最广泛应用的就是FCFE股权自由现金流模型。
绝对估值的作用:股票的价格总是围绕着股票的内在价值上下波动,发现价格被低估的股票,在股票的价格远远低于内在价值的时候买入股票,而在股票的价格回归到内在价值甚至高于内在价值的时候卖出以获利。
相对估值
相对估值是使用市盈率、市净率、市售率、市现率等价格指标与其它多只股票(对比系)进行对比,如果低于对比系的相应的指标值的平均值,股票价格被低估,股价将很有希望上涨,使得指标回归对比系的平均值。
相对估值包括PE、PB、PEG、EV/EBITDA等估值法。通常的做法是对比,一个是和该公司历史数据进行对比,二是和国内同行业企业的数据进行对比,确定它的位置,三是和国际上的(特别是香港和美国)同行业重点企业数据进行对比。
联合估值
联合估值是结合绝对估值和相对估值,寻找同时股价和相对指标都被低估的股票,这种股票的价格最有希望上涨。

首先建立估值体系,根据估值体系确定目标价,

然后决定相应操作。

一般而言,估值的基本方法可以分为以下三种:
• 现金流量折现法(DCF);
• 相对价值法;
• 期权估值法。
在介绍基本的估值方法之前,首先必须明确一个概念:什么是企业价值?
从投资者的角度来看,根据资本市场信息或企业内部信息,对企业未来的现金流量,用反映企业未来现金流量风险的折现率进行折现所做的综合判断,就称为企业的价值。企业价值不是用一个复杂的数学模型算出来的,算出来的只能是一种判断,随着在资本市场上,大家都提供一种判断,综合起来就大致确定出企业证券的价值,它是个波动的概念。因此,企业价值的构成要素有两个:企业未来的现金流量以及反映企业未来现金流量风险的折现率。
决定市场价值的要素,第一,要看投资者,即追求投资回报最大化的机构和个人;第二,必须要有一个现代企业,也就是说,在市场经济社会中,企业必须是投资者实现投资回报的社会组织和载体;第三,就是看企业未来现金流量的折现值;第四,是基于企业内部的各种信息和资本市场信息而做出的综合判断。
基于不同的模型,现金流量有不同的定义。但无论用何种模型对企业进行估值,一方面要看生产经营:研发、采购、制造、营销等等。另一方面要看资本经营,怎样把债务和权益结合起来,提高企业的获利能力?这就要用生产经营得到的利润,除以整个投资资本,得到投资资本回报率(ROIC),然后减去加权平均资本成本(WACC)。因此,在估值时,既要考虑到生产经营成本,又要考虑到资本经营成本。综合起来,对于企业的价值,最后就形成一个判断。
在进行价值评估时,国内企业存在一个误区。国内企业常常用很多陈旧的会计方法来进行资产评估,其实这并不妥当。因为,对企业价值的评估,要用未来现金流量的折现来判断。假如现在向投资者介绍一个投资机会:某企业有一套全新的生产线设备,生产20英寸黑白晶体管电视,准备发行1万股普通股股票,请各位投资者来投资,钱一到,立即到人才交流中心招人,一个星期以后投产,这些资产值不值钱?投资者愿不愿投资?投资者肯定不愿投资。但资产评估却根据设备、厂房、折旧等一系列指标,然后根据财务规定,得出值多少钱来(见图表1-1)。
现在换一种情况,某企业想做中国最大的互联网家电交易商,全国有2500万网民,只要上网点击,一周内就能把货送到,该企业有20个计算机软件专家,现在准备发行普通股股票融资,恐怕有人愿意投资有人不愿意投资,关键要看企业价值,即企业今后的发展能否带来利润。因此,对资产评估,有时可以参考,而有时概念就不是很清楚。

图表1-1 价值评估不同于资产评估

价值评估 资产评估
• 用折现现金流量方法
• 使用来自资产负债表
和损益表的信息 •对资产的现价进行估算
• 较长期的时间范畴
• 预测今后发展
• 使用加权平均资本成本

一、现金流量折现法(DCF)
▲ 基本原理
任何资产的价值等于其预期未来产生的全部现金流量的现值之和,用公式表示为:
V=∑tCFt/(1 rt)n
其中:V = 资产的价值;
n = 资产的寿命;
CFt= 资产在时期t产生的现金流量
rt = 反映预期未来现金流量风险的折现率
▲ 现金流量折现法的适用性和局限性
现金流量折现法是基于预期未来现金流量和折现率的估价方法。在一定的条件下,如果被估价资产当前的现金流量为正,并且可以比较准确地预测未来现金流量的发生时间,同时,根据现金流量的风险特性又能够确定出适当的折现率,那么就适合采用现金流量折现方法。但现实情况往往并非如此,实际情况与模型假设条件相差越大,现金流量折现法的运用就会变得越困难。
在下列情况下,使用现金流量折现法进行估值将会遇到比较大的困难,需要进行相应的调整。
• 陷入财务困境状态的公司
公司处于财务困境状态下,当前的收益和现金流量通常为负,并且无法预期公司未来何时会出现好转。对于此类公司,由于破产的可能性很大,所以预测未来现金流量就十分困难。对于预期将要破产的企业,使用该方法的效果并不理想。即使对于那些预期会绝处逢生的企业而言,应用现金流量折现法时也必须要预测未来现金流量何时为正,数额多少,因为仅计算负现金流量的现值将会导致公司整体价值或股权的价值为负。
• 周期性公司
周期性公司的收益和现金流量往往随宏观经济环境的变化而变化。经济繁荣时,公司收益上升,经济萧条时则下降。很多周期性公司在宏观经济极度萧条时,会与处于困境中的公司一样,具有负的收益和现金流量。如果对这些公司运用现金流量折现法进行估值,通常要对预期未来现金流量进行平滑处理。对于此类公司,在估值前对宏观经济环境进行预测是必不可少的,但这种预测必然会导致分析人员的主观偏见,并且成为影响估值结果的一个因素。
• 拥有未被利用资产的公司
现金流量折现法反映了公司当前所有产生现金流量的经营性资产的价值。如果公司有尚未利用的经营性资产(当前不产生任何现金流量),这些资产的价值就不会体现在公司总价值中。同样,当前未被充分利用的资产也会产生类似问题。通常可以从公司外部得到此类资产的价值,然后将其加到现金流量折现法计算出的价值之中。
• 有专利或产品选择权的公司
公司常常拥有尚未利用的专利或产品选择权,它们在当前并不产生任何现金流量,预计在近期内也不能产生现金流量,但它们是有价值的。对于这类公司,现金流量折现法会低估它们的真实价值。这个问题可以通过同样的方法加以克服。首先在公开市场上、或者运用期权定价模型对这些资产进行估价,然后将其加入到现金流量折现法计算出的价值之中。
• 正在进行重组的公司
正在进行重组的公司通常会出售它们的一些已有的资产,购买新的资产,并且改变它们的资本结构和股利政策。一些公司进行重组时还会改变其所有权结构和管理层的激励方案。每种变化都将使公司未来现金流量的预测变得更为困难,并且会影响未来现金流量的风险特征,并进而影响折现率。历史数据会对这类公司的估值产生误导作用。但是,即使是对于投资和融资政策发生重大变化的公司,如果预测的未来现金流量已经反映了这些变化的影响,并且折现率已经根据公司新的业务和财务风险进行了适当的调整,那么仍然可以使用现金流量折现法。
• 涉及并购事项的公司
使用现金流量折现法来对目标公司进行估值时,至少需要考虑与购并有关的两个棘手问题。第一个问题是购并是否会产生协同效应?协同效应的价值是否可以评估?在假设购并会产生协同效应,并且协同效应会影响公司现金流量的情况下,可以单独估计协同效应的价值。第二个问题是公司管理层的变动对公司现金流量及其风险的影响,这一点在敌意收购中尤为明显和重要。这些变化的影响可以而且应当体现在预期未来现金流量及所选用的折现率中。
• 非上市公司
现金流量折现法要求根据被估值资产的历史价格来估算风险参数,因此,运用现金流量折现法对非上市公司进行估值时,最大的问题是公司风险的度量。由于非上市公司的股票不在公开市场上进行交易,所以这一要求无法满足。解决方法这一是考察可比上市公司的风险,另一个备选方法是根据非上市公司的基本财务指标来估计其风险参数。
企业的价值等于以适当的折现率对该企业预期未来现金流量进行折现所得到的现值,这里所产生的问题是:如何界定现金流量?什么是适当的折现率?虽然解决这些问题的许多备选框架都能得出同样准确的结果,但本文只推荐其中的两种,分别称为“自由现金流量(FCF)折现模型”和“经济增加值(EVA)模型(又称经济利润模型)”,并建议对非金融公司估值时采用这两种模型。其他一些现金流量折现模型各有特点,使用起来受到限制,本文不再详细提及。
1、自由现金流量折现模型
运用自由现金流量折现模型对企业权益估值,是将企业的经营价值(可向所有投资者提供的实体价值)减去债务价值以及其它优于普通股的投资者要求(如优先股)。经营价值和债务价值等于各自预期未来现金流量的现值,而选择的折现率一定要反映各自预期未来现金流量的风险。
经营价值
经营价值等于预期未来自由现金流量的现值。自由现金流量(FCF)等于企业的税后净经营利润加上非现金支出,再减去营运资本需求的变化、资本支出以及其它资产方面的投资。它未纳入任何与筹资有关的现金流量(如利息费用和股息等)。对于这一估值模型来说,自由现金流量是正确的现金流量,因为它可以反映企业经营业务所产生的能够向公司所有资本(包括债务资本和权益资本)供应者提供的现金流量。
为了与定义相一致,用于自由现金流量折现的折现率应反映所有资本供应者按照各自对企业总资本的相对贡献而加权的机会成本,这称为加权平均资本成本(WACC)。某类投资者的机会成本等于投资者从同等风险的其它投资中得到的期望回报率。
企业估值的一个新问题是企业寿命的无限期性,解决的方法是将企业寿命分为两个时期,即明确的预测期及其后阶段。在这种情况下,企业价值可作如下表示:
企业价值(FV)= 明确的预测期期间的现金流量现值 明确的预测期之后的现金流量现值
明确的预测期之后的价值系指持续经营价值(CV),可以用简单的公式估算持续经营价值,而无须详细预测在无限期内的现金流量。
债务价值
企业的债务价值等于对债权人的现金流量按能反映其风险的折现率折现的现值。折现率应等于具有可比条件的类似风险的债务的现行市场水平。在大多数情况下,只有在估值当日尚未偿还的企业债务须估算价值。对于未来借款可假定其净现值为零,因为由这些借款得来的现金流入与未来偿付现金流量的现值完全相等,是以债务的机会成本折现的。
权益价值
企业的权益价值等于其经营价值减去债务价值以及其它优于普通股的投资者要求(如优先股),并对任何非经营性资产或负债进行调整。
2、经济增加值(EVA)模型(又称经济利润模型)
经济增加值模型说明,企业的价值等于投资资本额加上预期未来每年经济增加值的现值。即:
企业价值(FV)= 投资资本 预期未来每年产生的经济增加值的现值
经济增加值(EVA)又称经济利润(EP),它不同于传统的会计利润。传统的会计利润扣除了债务利息,但是完全没有考虑权益资本的成本。经济增加值(EVA)不仅扣除了债务利息,而且也扣除了权益资本的成本,因而是一种真正的利润度量指标。从公式的角度讲,经济增加值(EVA)等于税后净经营利润(NOPAT)减去债务资本和权益资本的成本。
经济增加值模型优于自由现金流量折现模型,因为,经济增加值可以衡量公司在任何单一时期内所创造的价值,而自由现金流量折现模型却做不到。经济增加值(EVA)定义如下:
经济增加值(EVA)= 税后净经营利润 - 资本费用
= 税后净经营利润 -(投资资本×加权平均资本成本)
投资资本=营运资本需求 固定资产净值 其它经营性资产净额

二、相对价值法
▲ 基本原理
在相对价值法中,公司的价值通过参考“可比”公司的价值与某一变量,如收益、现金流量或销售收入等的比率而得到。相对价值法基于经济理论和常识都认同的一个基本原则,即类似的资产应该有类似的交易价格。按照这一原则,评估一项资产价值的一个直截了当的方法就是找到一个由消息灵通的买者和卖者刚刚进行完交易的、相同的或者至少是相近的可比资产。这一原则也意味着被评估资产的价值等于可比资产的交易价格。
然而,由于结构、规模、风险等方面的差异,实践中找到一项直接可比的资产相当困难。处理的方法是进行相应的调整,这涉及到两个数值,一个是价值指标,另一个是与价值有关的可观测变量。运用相对价值法评估公司价值,需要得到可比公司的价值指标数据和可观测变量数据以及目标公司的可观测变量数据。
用数学语言表示相对价值法有助于进一步理解和熟悉这种方法。以V表示价值指标数据,以X表示可观测变量数据。相对价值法所依赖的关键假设前提是目标公司的V/X比率与可比公司的V/X比率相同,如下式所示:
V(目标公司)/X(目标公司)= V(可比公司)/X(可比公司)
变形可得:
V(目标公司)= X(目标公司)× [ V(可比公司)/X(可比公司)]
只要V/X比率在各个公司之间保持常数,上式对于所有的可观测变量X都成立。为此,在应用相对价值法时,一个关键的步骤是挑选可观测变量X,要使得这样一个变量与价值指标有着确定的关系。
▲ 相对价值法的适用性和局限性
相对价值法的优点在于简单且易于使用。使用该方法可以迅速获得被估值公司的价值,尤其是当金融市场上有大量“可比”资产进行交易、并且市场在平均水平上对这些资产的定价是正确的时候。但相对价值法也容易被误用和操纵。因为,现实中绝对没有在风险和成长性方面完全相同的两个公司或两种资产,“可比”公司或资产的定义是一个主观概念。因此,在选择“可比”公司或资产时容易出现偏见。尽管这种潜在的偏见也存在于现金流量折现法之中,但在现金流量折现法中,必须说明决定最终价值的前提假设,而在相对价值法中,这种前提假设往往不必提及。
相对价值法的另一个问题是它会将市场对“可比”公司或资产定价的错误(高估或低估)引入估值之中。而现金流量折现法是基于特定公司自身的增长率和预期未来现金流量,它不会被市场的错误所影响。
尽管在实际操作中还使用其它一些比率,但本文主要介绍以下四种比率:
• 市盈率(P/E);
• 公司价值/自由现金流量(EV/FCF);
• 公司价值/销售收入(EV/S);
• 公司价值/息税折旧摊销前收益(EV/EBITDA)。