如何看待股票型基金仓位?
基金仓位的意思是基金投入股市的资金占基金所能运用的资产的比例。下限就是最低的比例。投入股市的资金如何计算:是股票成本或是股票市值?基金所能运用的资产是净资产还是现金
以前通用的仓位是基金每季公布的股票市值与净值之比。这种算法有一个问题是:股票市值及净值中含估值增值部分,即股价增长数额,并不代表基金在股价增长之前投入的实际资金。估值增值部分的计入,虚增了基金投入股市的资金,也加大了投资前的资金量,是不太科学的。
股票市值与基金净值之比并不能准确地表示基金的仓位。股票成本与扣除估值增值后的净值之比是比较准确的。这个概念中,股票以成本计,净值也扣除了估值增值部分。这个算法等于股票成本与股票成本及可用流动资金之比所计算出的仓位,其包含的真实意思有:基金短期内可动用的资金也包括在内(银行存款加各项应收款与应付款之差),反映的是基金可支配的总体资金状况。这应该是较为准确全面的仓位计算方法。
目前股票型基金按照证监会的要求最低不能低于80%的股票仓位,所以在目前股市单边上涨行情中,股票型基金的基金净值上升是较多的。因为必须保持60以上的股票仓位。而混合型基金就相对灵活一些,可以在债券和股票中来回转换仓位。与此同时,下跌时混合型基金风险也相对较小一些。
基金仓位测算方法有哪些?
基金收益率=基金BETA*市场收益率+alpha 用多日数据可以拟合出BETA和alpha。然后根据Beta就可以知道基金的仓位变化了。
一、直接用比例来做。用基金涨跌幅度比上指数的涨跌幅度。简单易行,粗糙。
二、用回归来做。基本原理就是P=aX+bY+cZ,P是基金的净值,X,Y,Z选择的是不同的指数来回归,但不限于三个。最后用回归来确定a,b,c的值,合起来就是基金的仓位。后来对于基金仓位预测的分歧主要集中在X,Y,Z的选择上,一些研究报告里面所谓的第二代第三代模型就是这点区别,本质都是回归,用excel下个叫megastat的插件都能做。所谓第二代就是X,Y,Z选的是大盘股、中盘股、小盘股等指数,第三代则为不同行业的指数,医药、银行、房地产等。问题是:
1、选择大盘股、中盘股、小盘股等指标(当然可以是别的,也可以用A股,创业板,中小板),做出的回归实际投资指导意义不大。
2、所以很多模型选择用行业指数来进行回归,常见的就是中证、申万的行业指数,网上可以下到。
3、回归类的模型要考虑两个问题,首先,基金并不是全部投资股票的,会投资债券等,但是当一只基金投资债券时,它的仓位预测出来就可能很低,而政府对于基金有最低仓位要求的,不符合实际,所以再选择基金类型上有甄别,或者要做出相应的调整。其次,回归使用的指数一般会有非常强的多重共线性(就是这些指数一起涨一起跌,很难分辨基金买了哪类股票),需要对多重共线进行处理,目前能使用的方法主要由差分法、岭回归、主成分提取。岭回归我还没试过,差分法效果不显著,主成分提取还不错,但是也有很大的缺陷。更多使用的方法还是主成分分析法,虽然在分行业的仓位计算有缺陷,但是基金的总体仓位预测误差不大,所录的基金仓位最高为85%左右,最低60%左右,基本和能看到的报道、法规一致。
Ⅱ 如何用Python和机器学习炒股赚钱
相信很多人都想过让人工智能来帮你赚钱,但到底该如何做呢?瑞士日内瓦的一位金融数据顾问 Gaëtan Rickter 近日发表文章介绍了他利用 Python 和机器学习来帮助炒股的经验,其最终成果的收益率跑赢了长期处于牛市的标准普尔 500 指数。虽然这篇文章并没有将他的方法完全彻底公开,但已公开的内容或许能给我们带来如何用人工智能炒股的启迪。
我终于跑赢了标准普尔 500 指数 10 个百分点!听起来可能不是很多,但是当我们处理的是大量流动性很高的资本时,对冲基金的利润就相当可观。更激进的做法还能得到更高的回报。
这一切都始于我阅读了 Gur Huberman 的一篇题为《Contagious Speculation and a Cure for Cancer: A Non-Event that Made Stock Prices Soar》的论文。该研究描述了一件发生在 1998 年的涉及到一家上市公司 EntreMed(当时股票代码是 ENMD)的事件:
「星期天《纽约时报》上发表的一篇关于癌症治疗新药开发潜力的文章导致 EntreMed 的股价从周五收盘时的 12.063 飙升至 85,在周一收盘时接近 52。在接下来的三周,它的收盘价都在 30 以上。这股投资热情也让其它生物科技股得到了溢价。但是,这个癌症研究方面的可能突破在至少五个月前就已经被 Nature 期刊和各种流行的报纸报道过了,其中甚至包括《泰晤士报》!因此,仅仅是热情的公众关注就能引发股价的持续上涨,即便实际上并没有出现真正的新信息。」
在研究者给出的许多有见地的观察中,其中有一个总结很突出:
「(股价)运动可能会集中于有一些共同之处的股票上,但这些共同之处不一定要是经济基础。」
我就想,能不能基于通常所用的指标之外的其它指标来划分股票。我开始在数据库里面挖掘,几周之后我发现了一个,其包含了一个分数,描述了股票和元素周期表中的元素之间的「已知和隐藏关系」的强度。
我有计算基因组学的背景,这让我想起了基因和它们的细胞信号网络之间的关系是如何地不为人所知。但是,当我们分析数据时,我们又会开始看到我们之前可能无法预测的新关系和相关性。
如果你使用机器学习,就可能在具有已知和隐藏关系的上市公司的寄生、共生和共情关系之上抢占先机,这是很有趣而且可以盈利的。最后,一个人的盈利能力似乎完全关乎他在生成这些类别的数据时想出特征标签(即概念(concept))的强大组合的能力。
我在这类模型上的下一次迭代应该会包含一个用于自动生成特征组合或独特列表的单独算法。也许会基于近乎实时的事件,这可能会影响那些具有只有配备了无监督学习算法的人类才能预测的隐藏关系的股票组。
Ⅲ 对于一个具有多指标的问题,有哪几种评价方法就是如何删选指标,类似主成分分析法的方法
多指标评价方法 很多的啊。你可以看看多准则评价方法。
Ⅳ p2p是什么意思
P2P是英文peertopeerlending(或peer-to-peer)的缩写,意即个人对个人(伙伴对伙伴)。又称点对点网络借款,是一种将小额资金聚集起来借贷给有资金需求人群的一种民间小额借贷模式。属于互联网金融(ITFIN)产品的一种。属于民间小额借贷,借助互联网、移动互联网技术的网络信贷平台及相关理财行为、金融服务。
2019年9月4日,互联网金融风险专项整治工作领导小组、网贷风险专项整治工作领导小组联合发布《关于加强P2P网贷领域征信体系建设的通知》,支持在营P2P网贷机构接入征信系统。
本条内容来源于:中国法律出版社《中华人民共和国金融法典:应用版》
Ⅳ IPO抑价现象及其解释
IPO抑价(IPO underpricing)现象是指首次公开发行的股票上市后(一般指第一天)的市场交易价格远高于发行价格,发行市场与交易市场出现了巨额的价差,导致首次公开发行存在较高的超额收益率。
我国IPO抑价发行原因:
1.流通股比例低 有关实证研究表明.新股抑价与流通股比例成负相关关系.流通股在企业所有股票中所占比例越大.IPO抑价程度越低流通股比例主要从下面两个方面来影响新股上市抑价程度:一是流通股比例低,即投资者持股比例小.难以在公司股东大会上行使自己的权利,也难以获得企业内部的信息.在二级市场上承担更大的风险.所以需要较高的发行抑价来补偿投资者的投资风险 另一方面.如果流通股比例很小的话,容易引起市场的操纵行为发生.小股东的利益受到侵害.在客观上迫使中小投资者以投机为目的参与市场交易.增加了股票抑价程度
2.新股发行存在体制缺陷 由于我国股票市场成立时间比较短.发展也不成熟.市场化程度不高,我国股市仍是一个弱势有效市场 自2001年3月起.新股发行将取消沿用了十年的审批制,实施核准制。核准制对监管机构、券商、上市公司等的规范运作都提出了更高的要求.是我国股票发行制度的一次重大改革.与带有较强的行政色彩的审批制相比.核准制的行政色彩要少一些 但是核准制在实质上仍是批准制的一种.仍然需要管理层又“核”又“准”.与先进的注册制还有很大的差距。体制缺陷造成了证券市场严重的供求矛盾,引起TiPO严重抑价现象
3.投资者结构不合理,市场投机气氛较浓。 机构投资者具有稳定市场的作用.一方面可以使得市场定价率更高.价格更趋合理;另一方面可以使得市场价格的波动频率更少.波幅更小。但在中国证券市场上.投资者结构以个人投资者为主,机构投资者为辅。根据中国证券登记结算有限公.-3统计.截至2009年6月30日.中国证券市场投资者总数~16017.84万户(包括A股、B股和基金账户).其中个人投资者15962.49万户,占99.65%,机构者55-35万户.仅0.35%。由于投资知识结构以及投资理念的差异.个人投资者与机构投资者相比,投资心理不成熟.投机心理较重.不利于证券市场价格发现功能的发挥我国股市的换手率过高.意味着市场中非理性成分占上风、投机气氛较浓。发达国家证券市场的首日换手率为8.2%,而我国中小企业板的新股上市首日换手率平均约为33.32%。 2006年6月19日.全流通首只新股“中工国际”在中小企业板挂牌上市后.最高涨幅达576%.换手率高达75.24%。新股发行过程中如此高的换手率.说明市场中过度投机行为严重.一级市场的投资者目的在于谋取短期回报,而不是长期投资。
Ⅵ 怎样提高KMO值和累积贡献率
我们在投资的时候需要比对不同股票的实力,这时候就需要运用到spss计算。 Spss计算中有两个非常重要的数值需要观测,这就是KMO值和累计贡献率。那这两个数值怎么提高呢?由小编告诉你吧。
- 三、总结
这两个数值是很重要的,所以在分析的时候如果数值过低,要想办法将它们提高,这样才能进行更好的投资,获得更多的收益。
Ⅶ 主成分分析中如何将高优指标转化为低优指标
不知道你这个会不会是为了推荐某个网站的广告贴,如果不是,强烈推荐你网络 NEW 星星 老师博客 老师博客写的股票投资知识非常实用,实战性强。是普通投资者学习的天堂。
Ⅷ 量化投资
没有你想的书
我多年来都有关注这方面的书 可是也没有在国内找到
数量化投资是将投资理念及策略通过具体指标、参数的设计,体现到具体的模型中,让模型对市场进行不带任何情绪的跟踪;相对于传统投资方式来说,具有快速高效、客观理性、收益与风险平衡和个股与组合平衡等四大特点。量化投资技术几乎覆盖了投资的全过程,包括估值与选股、资产配置与组合优化、订单生成与交易执行、绩效评估和风险管理等,在各个环节都有不同的方法及量化模型:
一、估值与选股
估值:对上市公司进行估值是公司基本面分析的重要方法,在“价值投资”的基本逻辑下,可以通过对公司的估值判断二级市场股票价格的扭曲程度,继而找出价值被低估或高估的股票,作为投资决策的参考。对上市公司的估值包括相对估值法和绝对估值法,相对估值法主要采用乘数方法,如PE估值法、PB估值法、PS估值法、PEG估值法、PSG估值法、EV/EBITDA估值法等;绝对估值法主要采用折现的方法,如公司自由现金流模型、股权自由现金流模型和股利折现模型等。相对估值法因简单易懂,便于计算而被广泛使用;绝对估值法因基础数据缺乏及不符合模型要求的全流通假设而一直处于非主流地位。随着全流通时代的到来和国内证券市场的快速发展,绝对估值法正逐渐受到重视。
选股:在当前品种繁多的资本市场中,从浩瀚复杂的数据背后选出适合自己投资风格的股票变得越加困难。在基本面研究的基础上结合量化分析的手段就可以构建数量化选股策略,主流的选股方法如下:
资产配置方法与模型
资产配置类别 资产配置层次 资产配置方法 资产配置模型
战略资产配置 全球资产配置 大类资产配置 行业风格配置 收益测度 风险测度 估计方法 马克维茨 MV 模型 均值 -LPM 模型 VaR 约束模型 Black-Litterman 模型
战术资产配置 ( 动态资产配置 ) 周期判断 风格判断 时机判断 行业轮动策略 风格轮动策略 Alpha 策略 投资组合保险策略
基本面选股:通过对上市公司财务指标的分析,找出影响股价的重要因子,如:与收益指标相关的盈利能力、与现金流指标相关的获现能力、与负债率指标相关的偿债能力、与净资产指标相关的成长能力、与周转率指标相关的资产管理能力等。然后通过建立股价与因子之间的关系模型得出对股票收益的预测。股价与因子的关系模型分为结构模型和统计模型两类:结构模型给出股票的收益和因子之间的直观表达,实用性较强,包括价值型(本杰明·格雷厄姆—防御价值型、查尔斯·布兰迪—价值型等)、成长型(德伍·切斯—大型成长动能、葛廉·毕克斯达夫—中大型成长股等)、价值成长型(沃伦·巴菲特—优质企业选择法、彼得·林奇—GARP价值成长法等)三种选股方法;统计模型是用统计方法提取出近似线性无关的因子建立模型,这种建模方法因不需先验知识且可以检验模型的有效性,被众多经济学家推崇,包括主成分法、极大似然法等。
多因素选股:通过寻找引起股价共同变动的因素,建立收益与联动因素间线性相关关系的多因素模型。影响股价的共同因素包括宏观因子、市场因子和统计因子(通过统计方法得到)三大类,通过逐步回归和分层回归的方法对三类因素进行选取,然后通过主成分分析选出解释度较高的某几个指标来反映原有的大部分信息。多因素模型对因子的选择有很高的要求,因子的选择可依赖统计方法、投资经验或二者的结合,所选的因子要有统计意义上或市场意义上的显著性,一般可从动量、波动性、成长性、规模、价值、活跃性及收益性等方面选择指标来解释股票的收益率。
动量、反向选股:动量选股策略是指分析股票在过去相对短期的表现,事先对股票收益和交易量设定条件,当条件满足时买进或卖出股票的投资策略,该投资策略基于投资者对股票中期的反应不足和保守心理,在投资行为上表现为购买过去几个月表现好的股票而卖出过去几个月表现差的股票。反向选股策略则基于投资者的锚定和过度自信的心理特征,认为投资者会对上市公司的业绩状况做出持续过度反应,形成对业绩差的公司业绩过分低估和业绩的好公司业绩过分高估的现象,这为投资者利用反向投资策略提供了套利机会,在投资行为上表现为买进过去表现差的股票而卖出过去表现好的股票。反向选股策略是行为金融学理论发展至今最为成熟,也是最受关注的策略之一。
二、资产配置
资产配置指资产类别选择、投资组合中各类资产的配置比例以及对这些混合资产进行实时管理。资产配置一般包括两大类别、三大层次,两大类别为战略资产配置和战术/动态资产配置,三大层次为全球资产配置、大类资产配置和行业风格配置。资产配置的主要方法及模型如下:
战略资产配置针对当前市场条件,在较长的时间周期内控制投资风险,使得长期风险调整后收益最大化。战术资产配置通常在相对较短的时间周期内,针对某种具体的市场状态制定最优配置策略,利用市场短期波动机会获取超额收益。因此,战术资产配置是在长期战略配置的过程中针对市场变化制定的短期配置策略,二者相互补充。战略资产配置为未来较长时间内的投资活动建立业务基准,战术资产配置通过主动把握投资机会适当偏离战略资产配置基准,获取超额收益。
三、股价预测
股价的可预测性与有效市场假说密切相关。如果有效市场假说成立,股价就反映了所有相关的信息,价格变化服从随机游走,股价的预测就毫无意义,而我国的股市远未达到有效市场阶段,因此股价时间序列不是序列无关,而是序列相关的,即历史数据对股价的形成起作用,因此可以通过对历史信息的分析来预测股价。
主流的股价预测模型有灰色预测模型、神经网络预测模型和支持向量机预测模型(SVM)。灰色预测模型对股价的短期变化有很强的预测能力,近年发展起来的灰色预测模型包括GM(1, 1)模型、灰色新陈代谢模型和灰色马尔可夫模型。人工神经网络模型具有巨量并行性、存储分布性、结构可变性、高度非线性和自组织性等特点,且可以逼近任何连续函数,目前在金融分析和预测方面已有广泛的应用,效果较好。支持向量机模型在解决小样本、非线性及高维模式识别问题中有许多优势,且结构简单,具有全局优化性和较好的泛化能力,比神经网络有更好的拟合度。
四、绩效评估
作为集合投资、风险分散、专业化管理、变现性强等特点的投资产品,基金的业绩虽然受到投资者的关注,但要对基金有一个全面的评价,则需要考量基金业绩变动背后的形成原因、基金回报的来源等因素,绩效评估能够在这方面提供较好的视角与方法,风险调整收益、择时/股能力、业绩归因分析、业绩持续性及Fama的业绩分解等指标和方法可从不同的角度对基金的绩效进行评估。
绩效评估模型 / 指标
绩效评估准则
择时 / 股能力
业绩归因分析
风险调整收益
业绩持续性
Fama 业绩分解
模型 / 指标
T-M 模型
H-M 模型
GII 模型
C-L 模型
资产配置收益
证券选择收益
行业选择收益
行业内个股选择收益
RAROC
Sharp, Stutzer
Treynor, Jensen
, ,
双向表分析
时间序列相关性
总风险收益
系统风险收益
分散化投资收益
五、基于行为金融学的投资策略
上世纪50~70年代,随着马科维茨组合理论、CAPM模型、MM定理及有效市场假说的提出,现代金融经济学建立了一套成熟的理论体系,并且在学术界占据了主导地位,也被国际投资机构广泛应用和推广,但以上传统经济学的理论基石是理性人假设,在理性人假设下,市场是有效率的,但进入80年代以后,关于股票市场的一系列研究和实证发现了与理性人假设不符合的异常现象,如:日历效应、股权溢价之谜、期权微笑、封闭式基金折溢价之谜、小盘股效应等。面对这些金融市场的异常现象,诸多研究学者从传统金融理论的基本假设入手,放松关于投资者是完全理性的严格假设,吸收心理学的研究成果,研究股市投资者行为、价格形成机制与价格表现特征,取得了一系列有影响的研究成果,形成了具有重要影响力的学术流派-行为金融学。
行为金融学是对传统金融学理论的革命,也是对传统投资实践的挑战。随着行为金融理论的发展,理论界和投资界对行为金融理论和相关投资策略作了广泛的宣传和应用,好买认为,无论机构投资者还是个人投资者,了解行为金融学的指导意义在于:可以采取针对非理性市场行为的投资策略来实现投资目标。在大多数投资者认识到自己的错误以前,投资那些定价错误的股票,并在股价正确定位之后获利。目前国际金融市场中比较常见且相对成熟的行为金融投资策略包括动量投资策略、反向投资策略、小盘股策略和时间分散化策略等。
六、程序化交易与算法交易策略
根据NYSE的定义,程序化交易指任何含有15只股票以上或单值为一百万美元以上的交易。程序化交易强调订单是如何生成的,即通过某种策略生成交易指令,以便实现某个特定的投资目标。程序化交易主要是大机构的工具,它们同时买进或卖出整个股票组合,而买进和卖出程序可以用来实现不同的目标,目前程序化交易策略主要包括数量化程序交易策略、动态对冲策略、指数套利策略、配对交易策略和久期平均策略等。
算法交易,也称自动交易、黑盒交易或无人值守交易,是使用计算机来确定订单最佳的执行路径、执行时间、执行价格及执行数量的交易方法,主要针对经纪商。算法交易广泛应用于对冲基金、企业年金、共同基金以及其他一些大型的机构投资者,他们使用算法交易对大额订单进行分拆,寻找最佳路由和最有利的执行价格,以降低市场的冲击成本、提高执行效率和订单执行的隐蔽性。任何投资策略都可以使用算法交易进行订单的执行,包括做市、场内价差交易、套利及趋势跟随交易。算法交易在交易中的作用主要体现在智能路由、降低冲击成本、提高执行效率、减少人力成本和增加投资组合收益等方面。主要的算法包括:交易量加权平均价格算法(VWAP)、保证成交量加权平均价格算法(Guaranteed VWAP)、时间加权平均价格算法(TWAP)、游击战算法(Guerrilla)、狙击手算法(Sniper)、模式识别算法(Pattern Recognition)等。
综上所述,数量化投资技术贯穿基金的整个投资流程,从估值选股、资产配置到程序化交易与绩效评估等。结合量化投资的特点及我国证券市场的现状,好买认为量化投资技术在国内基金业中的应用将主要集中在量化选股、资产配置、绩效评估与风险管理、行为金融等方面,而随着包括基金在内的机构投资者占比的不断提高、衍生品工具的日渐丰富(股指期货、融资融券等)以及量化投资技术的进步,基金管理人的投资策略将会越来越复杂,程序化交易(系统)也将有快速的发展。
Ⅸ matlab股票协方差
pp概述
原则上,所有图象处理都是图像的变换,而本章所谓的图象变换特指数字图象经过某种数学工具的处理,把原先二维空间域中的数据,变换到另外一个"变换域"形式描述的过程。例如,傅立叶变换将时域或空域信号变换成频域的能量分布描述。
任何图象信号处理都不同程度改变图象信号的频率成分的分布,因此,对信号的频域(变换域)分析和处理是重要的技术手段,而且,有一些在空间域不容易实现的操作,可以在频域(变换域)中简单、方便地完成。
Pp
如上所述,图象变换是将 维空间图象数据变换成另外一组基向量空间(通常是正交向量空间)的坐标参数,我们希望这些离散图象信号坐标参数更集中地代表了图象中的有效信息,或者是更便于达到某种处理目的。下图描述了数字图象处理中空域处理与变换域处理的关系。
pp
图象变换的实质就是将图象从一个空间变换到另一个空间,各种变换的不同之处关键在于变换的基向量不同。以下给出几种不同变换基向量的变换示例。
例如,由直角坐标系变化到极坐标系,见下图
pp
同样,一幅彩色图象可以按照某种准则,分解成若干个基本色彩分量图象的和。
傅立叶变换可以将一维信号从时间域变换到频率域,例如下图,一个正弦信号经过傅立叶变换后,得到它的频率分布零频(直流分量)和基频。
一维傅立叶变换的定义:
一维傅立叶反变换定义:
F(u)包含了正弦和余弦项的无限项的和,u称为频率变量,它的每一个值确定了所对应的正弦-余弦对的频率。
根据尤拉公式
傅立叶变换系数可以写成如下式的复数和极坐标形式:
其中:
傅立叶谱(幅值函数)为
相角为
能量谱为
pp
连续二维函数的傅立叶变换对定义
二维函数的傅立叶正变换
二维函数的傅立叶逆变换
二维函数的傅立叶谱
二维函数的傅立叶变换的相角
二维函数的傅立叶变换的能量谱
pp
2离散傅立叶变换
由于实际问题的时间或空间函数的区间是有限的,或者是频谱有截止频率。至少在横坐标超过一定范围时,函数值已趋于 而可以略去不计。将 和 的有效宽度同样等分为 个小间隔,对连续傅立叶变换进行近似的数值计算,得到离散的傅立叶变换定义。
其中,一维离散傅立叶正变换
一维离散傅立叶逆变换
pp
二维离散傅立叶变换:对于 图象
对于 图象
pp
1.3离散傅立叶变换的性质
性质1:可分离性
二维傅立叶变换可分解成了两个方向的一维变换顺序执行。
pp
性质2:平移性
空间域平移:
频率域平移:
pp
当 时有:
可以简单的用 乘以 将 的傅立叶变换的原点移动到相应 频率方阵的中心。
(图)
pp
性质3:周期性及共轭对称性
离散的傅立叶变换和它的反变换具有周期为 的周期性:
傅立叶变换也存在共轭对称性:
pp
性质4:旋转性质
平面直角坐标改写成极坐标形式:
做代换有:
如果 被旋转 则 被旋转同一角度。即有傅立叶变换对:
pp
(图)
性质5:线性性质
如果:
则有:
pp
性质6: 与图象均值的关系
二维图象灰度均值定义:
而傅立叶变换变换域原点的频谱分量:
所以有:
即 数值 倍于图象灰度均值。
Pp
性质7:图象拉普拉斯算子处理后的傅立叶变换
图象拉普拉斯算子处理的定义:
则图象拉普拉斯算子处理后的傅立叶变换对为:
pp
性质8:卷积与相关定理
卷积定理 一维序列的卷积运算定义为:
当
则有
注意在用傅立叶变换计算卷积时, 由于函数被周期化,为了保证卷积结果正确,计算过程中两个序列长度N1,N2都要补零加长为N1+ N2-1。二维图象序列卷积定理的定义和计算过程与一维情况相同。*为卷积符号。
pp
相关定理:
一维、二维两个离散序列的相关可以写作
则有相关定理
pp
4快速傅立叶变换
由一维傅立叶变换入手,换一种表示方法
pp
定义:
则:
因为:
pp
傅立叶变换的快速计算示意图:
(图)
pp
一维傅立叶变换:
其逆变换为: R
则有:
对于二维情况:
pp
§2离散余弦变换(DCT)
从第一节内容我们可以看到,傅立叶变换是用无穷区间上的复正弦基函数和信号的内积描述信号中总体频率分布,或者是将信号向不同频率变量基函数矢量投影。实际上,基函数可以有其它不同类型,相当于用不同类型基函数去分解信号(图象)。余弦变换是其中常用的一种。
pp
设离散序列 ,为一离散序列,根据下式延拓成偶对称序列 :
其中 。 是关于 为中心的偶对称序列如下图所示。
(图)
pp
以 代入在 范围内作 点的傅立叶变换:
pp
余弦变换的变换核为:
表示成矩阵形式为:(其中各列模为1)
pp
定义偶余弦变换(EDCT)和逆变换为:
pp
二维余弦变换:
二维余弦变换具有可分离性:
表示成矩阵形式:
pp
余弦变换可以利用傅立叶变换实现:
将 延拓为:
则有:
借助傅立叶变换计算余弦变换的步骤:
1)把 延拓成 ,长度为 ;
2)求 的 点的FFT;
3)对 各项乘上对应的因子 ;
4)取实部,并乘上因子 ;
5)取 的前 项,即为 的余弦变换。
Pp
余弦反变换:
首先延拓 ,
反变换,
pp
§3 正弦变换
一维正弦变换核
一维正弦变换
二维正弦变换核
二维正弦变换
pp
§4 沃尔什-哈达玛变换
沃尔什-哈德玛(Walsh-Hadamard)变换的变换核是一类非正弦的正交函数(Walsh函数),例如方波或矩形波。与正弦波频率相对应,这种非正弦波形可用"列率"(单位时间内波形通过零点数平均值的一半)描述。Walsh函数可以由Rademacher函数构成,Rademacher函数集是一个不完备的正交函数集,Rademacher函数有两个自变量 和 ,用 表示。
pp
Rademacher函数波形图和矩阵表示
(图)
pp
用Rademacher函数构造沃尔什函数:
其中: 表示 所选用的二进制位数
是Rademacher函数
是 的自然二进制的位序反写后的第 位数字,
例: 用三位二进制码, ,求
pp
(图)
pp
Walsh函数的矩阵形式
其变换核矩阵有递推关系:(直积)
沃尔什-哈达玛变换定义:
一维沃尔什-哈达玛变换可表示成矩阵形式:
pp
例:
二维沃尔什-哈达玛变换:
,
其中 , 阶数相同。
pp
例:
另外有
pp
§5 奇异值分解
基于矩阵奇异值分解的二维酉变换:
任何 矩阵 可以分解成:
和 是正交矩阵, 是矩阵 的特征值。
则:
称为矩阵 的奇异值。
Pp
对矩阵 作奇异值分解:
令:
则;
是 或 的特征值所构成的对角阵。
矩阵的特征矢量
矩阵的特征矢量
pp
矩阵 可用奇异值分解的级数展开式表示成:
是 矩阵的第 行第 列阵元,即 分别是 矩阵的第 列矢量。
(图)
pp
§6 K_L变换
K_L变换又称为Hotelling变换和主成分分析。
当变量之间存在一定的相关关系时,可以通过原始变量的线性组合,构成为数较少的不相关的新变量代替原始变量,而每个新变量都含有尽量多的原始变量的信息。这种处理问题的方法,叫做主成分分析,新变量叫做原始变量的主成分。例如人脸图象可表示成:
(图)
pp
主成分分析与线性回归的比较:
设有 个观测点 ,散布如图所示,线性回归的问题是要找一条对 个点 的拟合直线 ,使偏差平方和最小。
主成分的基本思想是,先对 个点 求出第一条"最佳"拟合直线,使得这 个点到该直线的垂直距离的平方和最小,并称此直线为第一主成分。然后再求与第一主成分相互独立(或者说垂直)的,且与 个点 的垂直距离平方和最小的第二主成分。
Pp
(图)
有 幅图象 ,大小为 。每幅图象表示成向量:
向量的协方差矩阵定义为:
其中:
令 和 是 的特征向量和对应的特征值。
特征值按减序排列,
变换矩阵的行为 的特征值,则变换矩阵为:
对应第 个特征向量的第 个分量。
K_L变换定义为:
变换后,有:
pp
K_L变换的计算步骤:
1. 求协方差矩阵 ;
2. 求协方差矩阵的特征值 ;
3. 求相应的特征向量
4. 用特征向量 构成变换矩阵 ,求 。
Pp
K-L变换的一种快速算法:
输入图像样本集合为: ,每一个样本图的大小为 , 可以用 维的向量 来表示(即把原图像按行连到一起构成 维向量)。它也可看作 维空间的一个点,称此空间为原始图像空间S。实际上样本图像具有较大的相似性的, 因此,全部样本图象不会
充满整个 维的空间,只是会聚集
在图像空间的一个相对狭小子空间内。
Pp
(图)
样本图象在原始图像空间中的分布
如果以样本图集的总体协方差矩阵为主成分分析的产生矩阵,则所有样本图像的总体协方差矩阵为:
式中, , 是全体样本图像均值。 满足下面的方程
是矩阵 的特征向量, 是对应的特征值。根据主成分分析理论,得到一个从原始图像空间到新特征空间的线性变换 。 是由 的特征向量构成的变换矩阵。
Pp
但是,直接求矩阵 的特征值和特征向量很困难。如果样本图象个数 不太多,可以先计算出 维矩阵 的特征值 和特征向量 。因为
左乘矩阵 ,得
那么 就是矩阵 的特征向量。
Pp
-主成分空间的基。根据主成分分析,可以选择 个较大特征值对应的特征向量(主成分),构造新的 维主成分空间 。每一幅图象在此空间的投影对应一个 维向量 ,它们就是低维新特征向量(主成分)。
Pp
小结
傅立叶变换(FFT) 具有快速算法,数字图象处理中最常用。需要复数运算。可把整幅图象的信息很好地用若干个系数来表达。
余弦变换(DCT) 有快速算法,只要求实数运算。在相关性图象的处理中,最接近最佳的K_L变换,在实现编码和维纳滤波时有用。同DFT一样,可实现很好的信息压缩。
正弦变换(DST) 比快速DCT快一倍。只需实数运算,可导出快速的K_L变换算法。在实现编码和滤波时有用。具有很好的信息压缩效果好。
沃尔什-哈达玛变换(WHT) 在数字图象处理的硬件实现时有用。容易模拟但很难分析。在图象数据压缩、滤波、编码中有应用。信息压缩效果好。
K_L变换(KLT) 在许多意义下是最佳的。无快速算法。在进行性能评估和寻找最佳性能时有用。对小规模的向量有用,如彩色多谱或其他特征向量。对一组图象集而言,具有均方差意义下最佳的信息压缩效果。
奇异值分解(SVD) 对任何一幅给定的图象而言,具有最佳的信息压缩效果。无快速算法。设计有限冲激响应(FIR)滤波器时,寻找线性方程的最小范数解时有用。潜在的应用是图象恢复,能量估计和数据压缩。
>> A=[0,0,0;2,0,2;]
A =
0 0 0
2 0 2
>> v = diag(cov(A))'
v =
2 0 2 说实在的我也看不懂啦,。