当前位置:首页 » 分析预测 » 决策树分析股票
扩展阅读
股票分钟线看多久的行情 2025-05-03 04:54:44
朱中一 2025-05-03 04:53:54

决策树分析股票

发布时间: 2022-06-22 17:47:59

A. 多属性决策模型和层次分析法的区别

中国一直是一个居民储蓄率居高不下的国家,由于中国经济的持续高速发展以及房地产行业的畸形增长,买房对很多人来说越来越困难。其实,不仅仅是房地产,我们身边很多商品的价格都在涨,经济高速增长附带着高通货膨胀率逐渐改变了人们传统的储蓄观念,个人理财业务越来越受到更多人的重视。 目前的个人理财主要集中在商业银行理财业务及理财产品的创新等方面。而学者们的研究也主要基于各大商业银行理财产品的背景下,针对收入较高的社会群体,研究商业银行理财产品如何适应不同风险偏好投资者的需求以及如何创造出更具有吸引力的投资理财产品。对于每一个投资者而言,怎样的银行存款、股票、债券和基金等的组合投资比例才能使投资者获得最大的投资收益同时也符合投资者的风险偏好也是投资者非常在意的问题。将所有资金存入银行,投资者就必须面对通货膨胀率高于存款利息率的风险;将所有资金投入股票市场,投资者又将面对巨大损失的可能;将资金都投入到债券市场,也将要面对债券市场的流动性风险。不同的投资者拥有不同的投资需求,不同的收益预期,不同的风险偏好,如何为个性化需求投资者选择不同理财产品的投资比例,便是本文主要研究的问题。 层次分析法(AHP)是一种基于各属性指标值的评价来进行决策,因其广阔的适用性和丰富的决策方法,使其在各个领域都能获得巨大的应用。现代经济环境,无论是项目建设决策还是经济方案决策,人们面临着越来越多的不确定性信息,没有准确的统计数值,以往许多的决策方法将难以适用,个人理财组合选择也同样如此。层次分析法(AHP)则很好地解决了这些问题,通过对数值和非数值属性指标的重要性评价,根据不同的情况使用不同的决策因子计算获得不同属性权重结果或者最优选择。 本文的创新点是将层次分析法运用到个人理财最优组合选择中,从投资者个人的角度创新性的提出了将影响投资者决策选择的收益率指标、风险水平指标、收入水平指标、财富水平指标和受高等教育指标结合在一起,建立起一个同时考虑投资者预期收益率、风险偏好、收入水平、财富水平和受高等教育程度的指标体系,以获得最适合投资者的投资组合选择。同时,本文对比了其他投资决策方法:期望值、标准差法、资本资产定价模型、决策树法、正太概率分布法和马尔科夫决策方法。期望值、标准差法是标准的数值型决策方法,只能对数值型属性决策做出选择。决策树法、正太概率分布法和马尔科夫决策法都必须知道属性的概率分布。资本资产定价模型是以往使用最多最普遍的个人理财方案选择的方法,但是资本资产定价模型只能通过设定预期收益率来获得最低风险的投资,或者设定最高风险接受水平来获得最高收益率的投资产品组合。该方法在理论上具有一定的研究价值,但在实际操作过程中,人们往往难以估计适合自己的预期收益率,人们总是觉得收益率越高越好,风险越低越好,如何在收益和风险之间找到平横,不能通过收益率和风险的比值来简单概括。 每一种方法都有一定的适用范围,层次分析法也一样,本文在研究过程中发现,当所有的属性都有具体的数值或概率值表示时,使用期望值、标准方差法或者决策树法将会得到更精确的解释。另一方面,当个人理财指标体系越完整时,层次分析法计算的结果就越准确,相反,如果当个人指标体系加入错误的属性项,运用该方法得到的结果就可能存在偏差。因此,一个完整的具有代表性的指标体系将是我们不断追求的方向和今后研究的目标。 本文全文分为六章,第一章为绪论,介绍了全文的研究背景,研究内容和研究方法。第二章通过文献综述法对国内外不同决策方法研究现状以及我国个人理财现状进行了详细的阐述。第三章主要介绍了层次分析法的使用决策过程和方法。第四章研究了个人理财的影响因素,提出了集合收益率、风险水平、收入水平、财富水平和受高等教育水平指数的个人理财影响因素指标体系。为层次分析法下的理财分析做铺垫。第五章是本文的重点,通过分析两种属性下的投资组合选择、三种属性下的投资组合选择以及两种和三种属性投资组合选择的对比分析,然后提出使用五种指标构建的指标体系进行投资理财组合决策。并通过对比其他研究方法,分析得出各种方法的优缺点以及不同方法在不同情况下的应用价值。第六章为总结和展望,对本文的研究内容进行一个总结性描述,同时提出了本文在研究过程中的不足以及今后的研究方向。

B. 在股市投资中,什么能称得上是量化投资

量化交易是利用数学、统计、计算机的模型和方法来指导在金融市场的交易,可以自动下单业可以半自动下单,这个不是核心,核心在于是不是系统化交易(systematic trading)。

比如主观交易会看K线交易,量化交易业会,但区别在于量化交易可以在历史数据上回测各种交易规则,找到表现好的,然后才用来交易。这或许会有过度拟合的风险,但也有一些方法克服。

本人认为"量化交易系统、指标体系交易系统"均为"技术分析系统"的子集,"量化交易系统"与“指标体系系统"等价,即技术分析的概念更广,因波浪理论属于技术分析,但难说它属于量化交易,因有些事情的"量化"有很高难度,量化交易强调必须精准量化,必须能用指标体系表示,必须能精确的历史数据回测。

C. 机器学习有哪些算法

1. 线性回归
在统计学和机器学习领域,线性回归可能是最广为人知也最易理解的算法之一。
2. Logistic 回归
Logistic 回归是机器学习从统计学领域借鉴过来的另一种技术。它是二分类问题的首选方法。
3. 线性判别分析
Logistic 回归是一种传统的分类算法,它的使用场景仅限于二分类问题。如果你有两个以上的类,那么线性判别分析算法(LDA)是首选的线性分类技术。
4.分类和回归树
决策树是一类重要的机器学习预测建模算法。
5. 朴素贝叶斯
朴素贝叶斯是一种简单而强大的预测建模算法。
6. K 最近邻算法
K 最近邻(KNN)算法是非常简单而有效的。KNN 的模型表示就是整个训练数据集。
7. 学习向量量化
KNN 算法的一个缺点是,你需要处理整个训练数据集。
8. 支持向量机
支持向量机(SVM)可能是目前最流行、被讨论地最多的机器学习算法之一。
9. 袋装法和随机森林
随机森林是最流行也最强大的机器学习算法之一,它是一种集成机器学习算法。

想要学习了解更多机器学习的知识,推荐CDA数据分析师课程。CDA(Certified Data Analyst),即“CDA 数据分析师”,是在数字经济大背景和人工智能时代趋势下,面向全行业的专业权威国际资格认证,旨在提升全民数字技能,助力企业数字化转型,推动行业数字化发展。点击预约免费试听课。

D. 我要对股票市场做决策树的模型,可是不会数据预处理,谁可以帮帮我啊,时间紧急啊

数据预处理可以通过很多股票软件进行数据生成,然后通过EXCEL软件进行处理,不过很耗时间

E. 为什么手动实现决策树效率比调包低很多

1.每个算法模块按照“原理讲解→分析数据→自己动手实现→特征与调参”的顺序,“原理加实践,顶天立地”。
2.拒绝简单的“调包”——增加3次“机器学习的角度看数学”和3次“Python数据清洗和特征提取”,提升学习深度、降低学习坡度。
3.增加网络爬虫的原理和编写,从获取数据开始,重视将实践问题转换成实际模型的能力,分享工作中的实际案例或Kaggle案例:广告销量分析、环境数据异常检测和分析、数字图像手写体识别、Titanic乘客存活率预测、用户-电影推荐、真实新闻组数据主题分析、中文分词、股票数据特征分析等。

F. 求问什么是数据挖掘

数据挖掘相关的10个问题 NO.1 Data Mining 和统计分析有什么不同? 硬要去区分Data Mining和Statistics的差异其实是没有太大意义的。一般将之定义为Data Mining技术的CART、CHAID或模糊计算等等理论方法,也都是由统计学者根据统计理论所发展衍生,换另一个角度看,Data Mining有相当大的比重是由高等统计学中的多变量分析所支撑。但是为什么Data Mining的出现会引发各领域的广泛注意呢?主要原因在相较于传统统计分析而言,Data Mining有下列几项特性: 1.处理大量实际数据更强势,且无须太专业的统计背景去使用Data Mining的工具; 2.数据分析趋势为从大型数据库抓取所需数据并使用专属计算机分析软件,Data Mining的工具更符合企业需求; 3. 纯就理论的基础点来看,Data Mining和统计分析有应用上的差别,毕竟Data Mining目的是方便企业终端用户使用而非给统计学家检测用的。 NO.2 Data Warehousing 和 Data Mining 的关系为何? 若将Data Warehousing(数据仓库)比喻作矿坑,Data Mining就是深入矿坑采矿的工作。毕竟Data Mining不是一种无中生有的魔术,也不是点石成金的炼金术,若没有够丰富完整的数据,是很难期待Data Mining能挖掘出什么有意义的信息的。 要将庞大的数据转换成为有用的信息,必须先有效率地收集信息。随着科技的进步,功能完善的数据库系统就成了最好的收集数据的工具。数据仓库,简单地说,就是搜集来自其它系统的有用数据,存放在一整合的储存区内。所以其实就是一个经过处理整合,且容量特别大的关系型数据库,用以储存决策支持系统(Design Support System)所需的数据,供决策支持或数据分析使用。从信息技术的角度来看,数据仓库的目标是在组织中,在正确的时间,将正确的数据交给正确的人。 许多人对于Data Warehousing和Data Mining时常混淆,不知如何分辨。其实,数据仓库是数据库技术的一个新主题,利用计算机系统帮助我们操作、计算和思考,让作业方式改变,决策方式也跟着改变。 数据仓库本身是一个非常大的数据库,它储存着由组织作业数据库中整合而来的数据,特别是指事务处理系统OLTP(On-Line Transactional Processing)所得来的数据。将这些整合过的数据置放于数据昂哭中,而公司的决策者则利用这些数据作决策;但是,这个转换及整合数据的过程,是建立一个数据仓库最大的挑战。因为将作业中的数据转换成有用的的策略性信息是整个数据仓库的重点。综上所述,数据仓库应该具有这些数据:整合性数据(integrated data)、详细和汇总性的数据(detailed and summarized data)、历史数据、解释数据的数据。从数据仓库挖掘出对决策有用的信息与知识,是建立数据仓库与使用Data Mining的最大目的,两者的本质与过程是两回事。换句话说,数据仓库应先行建立完成,Data mining才能有效率的进行,因为数据仓库本身所含数据是干净(不会有错误的数据参杂其中)、完备,且经过整合的。因此两者关系或许可解读为Data Mining是从巨大数据仓库中找出有用信息的一种过程与技术。 NO.3 OLAP 能不能代替 Data Mining? 所谓OLAP(Online Analytical Process)意指由数据库所连结出来的在线分析处理程序。有些人会说:「我已经有OLAP的工具了,所以我不需要Data Mining。」事实上两者间是截然不同的,主要差异在于Data Mining用在产生假设,OLAP则用于查证假设。简单来说,OLAP是由使用者所主导,使用者先有一些假设,然后利用OLAP来查证假设是否成立;而Data Mining则是用来帮助使用者产生假设。所以在使用OLAP或其它Query的工具时,使用者是自己在做探索(Exploration),但Data Mining是用工具在帮助做探索。 举个例子来看,一市场分析师在为超市规划货品架柜摆设时,可能会先假设婴儿尿布和婴儿奶粉会是常被一起购买的产品,接着便可利用OLAP的工具去验证此假设是否为真,又成立的证据有多明显;但Data Mining则不然,执行Data Mining的人将庞大的结帐数据整理后,并不需要假设或期待可能的结果,透过Mining技术可找出存在于数据中的潜在规则,于是我们可能得到例如尿布和啤酒常被同时购买的意料外之发现,这是OLAP所做不到的。 Data Mining常能挖掘出超越归纳范围的关系,但OLAP仅能利用人工查询及可视化的报表来确认某些关系,是以Data Mining此种自动找出甚至不会被怀疑过的数据模型与关系的特性,事实上已超越了我们经验、教育、想象力的限制,OLAP可以和Data Mining互补,但这项特性是Data Mining无法被OLAP取代的。 NO.4 完整的Data Mining 包含哪些步骤? 以下提供一个Data Mining的进行步骤以为参考: 1. 理解业务与理解数据; 2. 获取相关技术与知识; 3. 整合与查询数据; 4. 去除错误或不一致及不完整的数据; 5. 由数据选取样本先行试验; 6. 建立数据模型 7. 实际Data Mining的分析工作; 8. 测试与检验; 9. 找出假设并提出解释; 10. 持续应用于企业流程中。 由上述步骤可看出,Data Mining牵涉了大量的准备工作与规划过程,事实上许多专家皆认为整套Data Mining的进行有80﹪的时间精力是花费在数据前置作业阶段,其中包含数据的净化与格式转换甚或表格的连结。由此可知Data Mining只是信息挖掘过程中的一个步骤而已,在进行此步骤前还有许多的工作要先完成。 NO.5 Data Mining 运用了哪些理论与技术? Data Mining是近年来数据库应用技术中相当热门的议题,看似神奇、听来时髦,实际上却也不是什么新东西,因其所用之诸如预测模型、数据分割,连结分析(Link Analysis)、偏差侦测(Deviation Detection)等,美国早在二次世界大战前就已应用运用在人口普查及军事等方面。 随着信息科技超乎想象的进展,许多新的计算机分析工具问世,例如关系型数据库、模糊计算理论、基因算法则以及类神经网络等,使得从数据中发掘宝藏成为一种系统性且可实行的程序。 一般而言,Data Mining的理论技术可分为传统技术与改良技术两支。 传统技术以统计分析为代表,统计学内所含序列统计、概率论、回归分析、类别数据分析等都属于传统数据挖掘技术,尤其 Data Mining 对象多为变量繁多且样本数庞大的数据,是以高等统计学里所含括之多变量分析中用来精简变量的因素分析(Factor Analysis)、用来分类的判别分析(Discriminant Analysis),以及用来区隔群体的分群分析(Cluster Analysis)等,在Data Mining过程中特别常用。 在改良技术方面,应用较普遍的有决策树理论(Decision Trees)、类神经网络(Neural Network)以及规则归纳法(Rules Inction)等。决策树是一种用树枝状展现数据受各变量的影响情形之预测模型,根据对目标变量产生之效应的不同而建构分类的规则,一般多运用在对客户数据的分析上,例如针对有回函与未回含的邮寄对象找出影响其分类结果的变量组合,常用分类方法为CART(Classification and Regression Trees)及CHAID(Chi-Square Automatic Interaction Detector)两种。 类神经网络是一种仿真人脑思考结构的数据分析模式,由输入之变量与数值中自我学习并根据学习经验所得之知识不断调整参数以期建构数据的型样(patterns)。类神经网络为非线性的设计,与传统回归分析相比,好处是在进行分析时无须限定模式,特别当数据变量间存有交互效应时可自动侦测出;缺点则在于其分析过程为一黑盒子,故常无法以可读之模型格式展现,每阶段的加权与转换亦不明确,是故类神经网络多利用于数据属于高度非线性且带有相当程度的变量交感效应时。 规则归纳法是知识发掘的领域中最常用的格式,这是一种由一连串的「如果…/则…(If / Then)」之逻辑规则对数据进行细分的技术,在实际运用时如何界定规则为有效是最大的问题,通常需先将数据中发生数太少的项目先剔除,以避免产生无意义的逻辑规则。 NO.6 Data Mining包含哪些主要功能? Data Mining实际应用功能可分为三大类六分项来说明:Classification和Clustering属于分类区隔类;Regression和Time-series属于推算预测类;Association和Sequence则属于序列规则类。 Classification是根据一些变量的数值做计算,再依照结果作分类。(计算的结果最后会被分类为几个少数的离散数值,例如将一组数据分为 "可能会响应" 或是 "可能不会响应" 两类)。Classification常被用来处理如前所述之邮寄对象筛选的问题。我们会用一些根据历史经验已经分类好的数据来研究它们的特征,然后再根据这些特征对其他未经分类或是新的数据做预测。这些我们用来寻找特征的已分类数据可能是来自我们的现有的客户数据,或是将一个完整数据库做部份取样,再经由实际的运作来测试;譬如利用一个大型邮寄对象数据库的部份取样来建立一个Classification Model,再利用这个Model来对数据库的其它数据或是新的数据作分类预测。 Clustering用在将数据分群,其目的在于将群间的差异找出来,同时也将群内成员的相似性找出来。Clustering与Classification不同的是,在分析前并不知道会以何种方式或根据来分类。所以必须要配合专业领域知识来解读这些分群的意义。 Regression是使用一系列的现有数值来预测一个连续数值的可能值。若将范围扩大亦可利用Logistic Regression来预测类别变量,特别在广泛运用现代分析技术如类神经网络或决策树理论等分析工具,推估预测的模式已不在止于传统线性的局限,在预测的功能上大大增加了选择工具的弹性与应用范围的广度。 Time-Series Forecasting与Regression功能类似,只是它是用现有的数值来预测未来的数值。两者最大差异在于Time-Series所分析的数值都与时间有关。Time-Series Forecasting的工具可以处理有关时间的一些特性,譬如时间的周期性、阶层性、季节性以及其它的一些特别因素(如过去与未来的关连性)。 Association是要找出在某一事件或是数据中会同时出现的东西。举例而言,如果A是某一事件的一种选择,则B也出现在该事件中的机率有多少。(例如:如果顾客买了火腿和柳橙汁,那么这个顾客同时也会买牛奶的机率是85%。) Sequence Discovery与Association关系很密切,所不同的是Sequence Discovery中事件的相关是以时间因素来作区隔(例如:如果A股票在某一天上涨12%,而且当天股市加权指数下降,则B股票在两天之内上涨的机率是 68%)。 NO.7 Data Mining在各领域的应用情形为何? Data Mining在各领域的应用非常广泛,只要该产业拥有具分析价值与需求的数据仓储或数据库,皆可利用Mining工具进行有目的的挖掘分析。一般较常见的应用案例多发生在零售业、直效行销界、制造业、财务金融保险、通讯业以及医疗服务等。 于销售数据中发掘顾客的消费习性,并可藉由交易纪录找出顾客偏好的产品组合,其它包括找出流失顾客的特征与推出新产品的时机点等等都是零售业常见的实例;直效行销强调的分众概念与数据库行销方式在导入Data Mining的技术后,使直效行销的发展性更为强大,例如利用Data Mining分析顾客群之消费行为与交易纪录,结合基本数据,并依其对品牌价值等级的高低来区隔顾客,进而达到差异化行销的目的;制造业对Data Mining的需求多运用在品质控管方面,由制造过程中找出影响产品品质最重要的因素,以期提高作业流程的效率。 近来电话公司、信用卡公司、保险公司以及股票交易商对于诈欺行为的侦测(Fraud Detection)都很有兴趣,这些行业每年因为诈欺行为而造成的损失都非常可观,Data Mining可以从一些信用不良的客户数据中找出相似特征并预测可能的诈欺交易,达到减少损失的目的。财务金融业可以利用 Data Mining来分析市场动向,并预测个别公司的营运以及股价走向。Data Mining的另一个独特的用法是在医疗业,用来预测手术、用药、诊断、或是流程控制的效率。 NO.8 Web Mining 和Data Mining有什么不同? 如果将Web视为CRM的一个新的Channel,则Web Mining便可单纯看做Data Mining应用在网络数据的泛称。 该如何测量一个网站是否成功?哪些内容、优惠、广告是人气最旺的?主要访客是哪些人?什么原因吸引他们前来?如何从堆积如山之大量由网络所得数据中找出让网站运作更有效率的操作因素?以上种种皆属Web Mining 分析之范畴。Web Mining 不仅只限于一般较为人所知的log file分析,除了计算网页浏览率以及访客人次外,举凡网络上的零售、财务服务、通讯服务、政府机关、医疗咨询、远距教学等等,只要由网络连结出的数据库够大够完整,所有Off-Line可进行的分析,Web Mining都可以做,甚或更可整合Off-Line及On-Line的数据库,实施更大规模的模型预测与推估,毕竟凭借网际网络的便利性与渗透力再配合网络行为的可追踪性与高互动特质,一对一行销的理念是最有机会在网络世界里完全落实的。 整体而言,Web Mining具有以下特性:1. 数据收集容易且不引人注意,所谓凡走过必留下痕迹,当访客进入网站后的一切浏览行为与历程都是可以立即被纪录的;2. 以交互式个人化服务为终极目标,除了因应不同访客呈现专属设计的网页之外,不同的访客也会有不同的服务;3. 可整合外部来源数据让分析功能发挥地更深更广,除了log file、cookies、会员填表数据、线上调查数据、线上交易数据等由网络直接取得的资源外,结合实体世界累积时间更久、范围更广的资源,将使分析的结果更准确也更深入。 利用Data Mining技术建立更深入的访客数据剖析,并赖以架构精准的预测模式,以期呈现真正智能型个人化的网络服务,是Web Mining努力的方向。 NO.9 Data Mining 在 CRM 中扮演的角色为何? CRM(Customer Relationship Management)是近来引起热烈讨论与高度关切的议题,尤其在直效行销的崛起与网络的快速发展带动下,跟不上CRM的脚步如同跟不上时代。事实上CRM并不算新发明,奥美直效行销推动十数年的CO(Customer Ownership)就是现在大家谈的CRM—客户关系管理。 Data Mining应用在CRM的主要方式可对应在Gap Analysis之三个部分: 针对Acquisition Gap,可利用Customer Profiling找出客户的一些共同的特征,希望能藉此深入了解客户,藉由Cluster Analysis对客户进行分群后再透过Pattern Analysis预测哪些人可能成为我们的客户,以帮助行销人员找到正确的行销对象,进而降低成本,也提高行销的成功率。 针对Sales Gap,可利用Basket Analysis帮助了解客户的产品消费模式,找出哪些产品客户最容易一起购买,或是利用Sequence Discovery预测客户在买了某一样产品之后,在多久之内会买另一样产品等等。利用 Data Mining可以更有效的决定产品组合、产品推荐、进货量或库存量,甚或是在店里要如何摆设货品等,同时也可以用来评估促销活动的成效。 针对Retention Gap,可以由原客户后来却转成竞争对手的客户群中,分析其特征,再根据分析结果到现有客户数据中找出可能转向的客户,然后设计一些方法预防客户流失;更有系统的做法是藉由Neural Network根据客户的消费行为与交易纪录对客户忠诚度进行Scoring的排序,如此则可区隔流失率的等级进而配合不同的策略。 CRM不是设一个(080)客服专线就算了,更不仅只是把一堆客户基本数据输入计算机就够,完整的CRM运作机制在相关的硬软件系统能健全的支持之前,有太多的数据准备工作与分析需要推动。

G. 求最小最大后悔值和决策树问题各两道!急!

1.结合实例说明什么是最小最大后悔值法。

最小最大后悔值法也称萨凡奇决策准则
最小最大后悔值法是指管理者在选择了某方案后,如果将来发生的自然状态表明其他方案的收益更大,那么他(或她)会为自已的选择而后悔。最小最大后悔值法就是使后悔值最小的方法。
最小最大后悔值法的运用
在股票市场上,最小最大后悔值法被称为最小后悔法,是股票投资者力图使后悔值降到最低限度的证券投资方法。
由于选取的购买方案往往与预测的企业经营状况存在很大的差异,这样就会出现实际收益大大低于目标收益的状况而使投资者产生后悔。最小后悔法的目的就是要使投资者将这种后悔降低到最低程度。
利用最小后悔法买卖股票的操作程序:
1、列出投资者在各种状态下的购买方案,并在每一购买方案中选出各自然状态下的最大收益值。
2、求出各种自然状态下各种方案的后悔值,其后悔值的公式是:“某方案后悔值”= “某自然状态下的最大收益值”-“该方案的收益值”,然后,将此方案的后悔值填入该方案栏中。
3、由此找出各方案在不同自然状态下的最大后悔值。
4、在各方案的最大后悔值中找出最小的后悔值,最小后悔值所对应的方案即为最优方案。

2.举例说明决策树的作用。

决策树是用二叉树形图来表示处理逻辑的一种工具。可以直观、清晰地表达加工的逻辑要求。特别适合于判断因素比较少、逻辑组合关系不复杂的情况。
决策树提供了一种展示类似在什么条件下会得到什么值这类规则的方法。比如,在贷款申请中,要对申请的风险大小做出判断,图是为了解决这个问题而建立的一棵决策树,从中我们可以看到决策树的基本组成部分:决策节点、分支和叶子。
决策树中最上面的节点称为根节点,是整个决策树的开始。本例中根节点是“收入>¥40,000”,对此问题的不同回答产生了“是”和“否”两个分支。
决策树的每个节点子节点的个数与决策树在用的算法有关。如CART算法得到的决策树每个节点有两个分支,这种树称为二叉树。允许节点含有多于两个子节点的树称为多叉树。
每个分支要么是一个新的决策节点,要么是树的结尾,称为叶子。在沿着决策树从上到下遍历的过程中,在每个节点都会遇到一个问题,对每个节点上问题的不同回答导致不同的分支,最后会到达一个叶子节点。这个过程就是利用决策树进行分类的过程,利用几个变量(每个变量对应一个问题)来判断所属的类别(最后每个叶子会对应一个类别)。
假如负责借贷的银行官员利用上面这棵决策树来决定支持哪些贷款和拒绝哪些贷款,那么他就可以用贷款申请表来运行这棵决策树,用决策树来判断风险的大小。“年收入>¥40,00”和“高负债”的用户被认为是“高风险”,同时“收入<¥40,000”但“工作时间>5年”的申请,则被认为“低风险”而建议贷款给他/她。
数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测(就像上面的银行官员用他来预测贷款风险)。常用的算法有CHAID、 CART、 Quest 和C5.0。
建立决策树的过程,即树的生长过程是不断的把数据进行切分的过程,每次切分对应一个问题,也对应着一个节点。对每个切分都要求分成的组之间的“差异”最大。
各种决策树算法之间的主要区别就是对这个“差异”衡量方式的区别。对具体衡量方式算法的讨论超出了本文的范围,在此我们只需要把切分看成是把一组数据分成几份,份与份之间尽量不同,而同一份内的数据尽量相同。这个切分的过程也可称为数据的“纯化”。看我们的例子,包含两个类别--低风险和高风险。如果经过一次切分后得到的分组,每个分组中的数据都属于同一个类别,显然达到这样效果的切分方法就是我们所追求的。
到现在为止我们所讨论的例子都是非常简单的,树也容易理解,当然实际中应用的决策树可能非常复杂。假定我们利用历史数据建立了一个包含几百个属性、输出的类有十几种的决策树,这样的一棵树对人来说可能太复杂了,但每一条从根结点到叶子节点的路径所描述的含义仍然是可以理解的。决策树的这种易理解性对数据挖掘的使用者来说是一个显著的优点。
然而决策树的这种明确性可能带来误导。比如,决策树每个节点对应分割的定义都是非常明确毫不含糊的,但在实际生活中这种明确可能带来麻烦(凭什么说年收入¥40,001的人具有较小的信用风险而¥40,000的人就没有)。

H. 考研金融学专业的研究方向都有哪些

一、金融经济(含国际金融、金融理论)
具体研究马克思、凯恩斯和斯密及当代著名经济学家所阐述的金融学原理;研究虚拟经济与实际经济的关联与影响;研究金融发展与经济增长之间的关系,分析金融政策的期限结构和动态反馈机制,以及各国银行制度与法规比较等。
热度分析:截至2007年3月末,我国外债余额为3315.62亿美元(不包括香港特区、澳门特区和台湾地区对外负债),比上年末增加85.74亿美元,增长2.65%。许多新兴的名词如外汇储备增速、开放资本项目管制、国有银行股改、股票印花税都涉及到重要的金融经济理论问题。
就业方向:该方向就业范围比较广泛,与其他各个方向都有交叉的地方。毕业生主要去向是外向型投资银行、证券公司、保险公司、基金管理公司和商业银行等外资金融机构,以及中资金融机构的涉外部门、跨国公司投融资部门和政府经济管理部门等相关工作。
二、投资学
投资学主要包括证券投资、国际投资、企业投资等几个研究领域。
热度分析:中国股市经历牛市后,人们对投资学的兴趣也随之高涨,其实投资不仅仅是证券投资,其范围极广泛。国家发展、企业赢利、个人获利,都离不开投资。
就业方向:一般来说,投资学专业的毕业生主要有以下几个毕业去向:第一,到证券、信托投资公司和投资银行从事证券投资;第二,到企业的投资部门从事企业投资工作;第三,到政府相关部门从事有关投资的政策制定和政策管理;第四,到高校、科研部门从事教学、科研工作。需要说明的是,应届毕业生的第一份工作一般都是一线的操作员,因为没有任何单位会让一个没有工作经验的员工进入管理层,即使是基层管理岗位。
三、货币银行学
主要研究的是跟银行及国家货币政策相关的问题,这里的银行包括中央银行和商业银行等等。
热度分析:2006年以来,借助人民币汇率对美元升值效应,各家银行纷纷推出本、外币理财新产。之前就倍受关注的银行业持续加温,成为热点。
就业方向:该专业方向主要在银行系统、学校和科研单位从事金融业务和管理工作,多在金融教学、研究领域就业。随着我国证券市场的不断完善,进入工商企业和上市公司成为许多金融人才的就业方向。
四、保险学
保监会将保险专业的教学模式分为"西财模式"、"武大模式"和"南开模式",其对应的大学分别是西南财经大学、武汉大学和南开大学。而保险业的"黄埔军校"则是位于湖南长沙的保险职业学院。
热度分析:在我国,保险业被誉为2l世纪的朝阳产业。首先,我国巨大的人口基数以及人口的老龄化有利于保险业市场的扩张;其次,我国目前的保险深度及保险密度都很低,有很大的市场潜力;第三,人均收入水平的不断提高,为保险业市场扩大规模提供良好的经济基础。保监会《中国保险业发展"十一五"规划纲要(讨论稿)》预计,未来5年我国保险业务收入年均增长15%左右。今年来许多险种受到关注:银行保险、航意险、交强险、健康险、体育保险、房贷险、农业保险、高管责任险。
就业方向:许多人误以为保险专业就业就是卖保险,实际上保险营销只是保险业中一部分工作,其它工作诸如组训、培训讲师、核赔核保人员和资金运作人员、精算人员。毕业生主要到保险公司、其他金融机构、社会保险部门及保险监管机构从事保险实务工作,也可到高等院校从事教学和研究工作。此外,还有中介企业、社会保障机构、政府监管机构、银行和证券投资机构、大型企业风险管理部门等也需要该方向的毕业生。比较热门的职业有保险代理人、保险核保、保险理赔、保险精算师(FIA)等等。
五、公司理财(公司金融)
又称公司财务管理,公司理财等。一般来说,公司金融学会利用各种分析工具来管理公司的财务,例如使用贴现法(DCF)来为投资计划总值作出评估,使用决策树分析来了解投资及营运的弹性。
热度分析:公司理财近年创下多个之最:贷款之最(E.On)、并购之最(Hospital Corporation of America)、证券化之最(Lloyds TSB Arkle)以及全球第一大IPO交易(中国工商银行)。公司理财相比其他方向是历史较短但发展很迅猛。
就业方向:该专业毕业生可选择各类公司从事融资、投资工作;商业银行、证券公司、基金管理公司等金融机构从事实务工作;也可以在金融监管机构、政府部门从事经济管理工作,或进一步深造后从事教学科研工作。

I. 10、决策树属于( )。

风险型决策:在未来的决定因素,可能出现的结果不能作出充分肯定的情况下,根据各种可能结果的客观概率作出的决策。决策者对此要承担一定的风险。风险型问题具有决策者期望达到的明确标准,存在两个以上的可供选择方案和决策者无法控制的两种以上的自然状态,并且在不同自然状态下不同方案的损益值可以计算出来,对于未来发生何种自然状态,决策者虽然不能作出确定回答,但能大致估计出其发生的概率值。对这类决策问题,常用损益矩阵分析法和决策树法求解;
程序化决策:就是可以根据既定的信息建立数学模型,把决策目标和约束条件统一起来,进行优化的一种决策。比如工厂选址、采购运输等等决策。这种决策是可以运用筹学技术来完成的。在这种程序化决策中,决策所需要的信息都可以通过计量和统计调查得到,它的约束条件也是明确而具体的,并且都是能够量化的。对于这种决策,运用计算机信息技术可以取得非常好的效果。通过建立数学模型,让计算机代为运算,并找出最优的方案,都是在价值观念之外做出的,至少价值观念对这种决策的约束作用不是主导因素。
悲观决策:采用悲观决策准则,通常要放弃最大利益,但由于决策者是从每一方案最坏处着眼,因此风险较小。小中取大法又称为最小风险法,是一种把风险降低到最小程度来获取收益的股票投资方法。最小风险法是一种较为稳妥的股票投资决策方法,较适合保守型的股票投资者采用。
乐观决策:
大中取大法又称乐观法、大中取大原则、乐观决策法、冒险法、最大的最大收益法,采用这种方法的管理者对未来持乐观的看法,认为未来会出现最好的自然状态,因此不论采取哪种方案,都能获取该方案的最大收益。

由于决策树,是对事物进行定量和定性分析,采用各类事物产生的概率及风险进行评估,所以选A

J. 管理学-决策树问题,求详解

----------销路好0.7 100万
......1--|
. ----------销路差0.3 -20万
.
. ------------销路好0.7 40万
I--......2--|
. ------------销路差0.3 30万
.
. -----扩建4 95万
. -----------Ⅱ---|
. | -----不扩建5 40万
......3--|
|
|
---------------销路差0.3 30万

方案一:结点1的期望收益是(0.7*100-0.3*20)*10-300=340
方案二:结点2的期望收益是(0.7*40+0.3*30)*10-140=230
方案三:结点4的期望收益是95*7-200=465,大于结点5的期望收益40*7=280,所以销路好时,扩建比不扩建好,结点3的期望收益是(0.7*40*3+0.7*465+0.3*30*10)-140=359.5
可以看出,三种方案中方案三最好

弄着一个决策树真费劲,不如在word上好弄