⑴ 我也想根据EXCEL所做的回归方程求出X1 X2 X3 X4的最优组合,望指导!
Excel绘制标准曲线全图片教程 (老是不会,老是要去找,所以发上来备份,哈哈)Excel绘制标准曲线全图片教程coolautumn 随着计算机的日益普及,越来越多的检验工作者希望能从一些烦琐的工作中解脱出来,如:绘制标准曲线、绘制质控图、计算检测值等等。当然借助检验科办公系统理论上是最方便的,但很多单位是没有检验科办公系统的。其实借助Microsoft的Excel电子表格工具对检验工作也会带来很大的便利。 Excel是Microsoft offices系统的重要组成,它是界于WORD字处理软件与ACCESS数据库软件之间的电子表格工具,功能十分强大,特别适合于日常工作使用。使用得好,完全比目前所有的检验科办公系统优秀。 现就先介绍一下如何使用Excel绘制标准曲线。 首先,将数据整理好输入Excel,并选取完成的数据区,并点击图表向导,如下图所示。 点击图表向导后会运行图表向导如下图,先在图表类型中选“XY散点图”,并选了图表类型的“散点图”(第一个没有连线的)。 点击“下一步”,出现如下图界面。如是输入是如本例横向列表的就不用更改,如果是纵向列表就改选“列”。 如果发现图不理想,就要仔细察看是否数据区选择有问题,如果有误,可以点击“系列”来更改,如下图。 如果是X值错了就点击它文本框右边的小图标,结果如下图: 出现上图后,如图在表上选取正确的数据区域。然后点击“下一步”出现图表选项界面,如下图,上应调整选项,以满足自己想要的效果。 点击“下一步”,现在一张带标准值的完整散点图就已经完成,如下图。 完成了散点图,现在需要根据数据进行回归分析,计算回归方程,绘制出标准曲线。其实这很简单,先点击图上的标准值点,然后按右键,点击“添加趋势线”。如下图。 由于本例是线性关系,在类型中选“线性”如下图 点击“确定”,标准曲线就回归并画好了。 标准曲线是画好了,可是我们怎么知道回归后的方程是什么样呢?这了简单,点击趋势线(也就是我们说的标准曲线)然后按右键,选趋势线格式,如下图:在显示公式和显示R平方值(直线相关系数)前点一下,勾上。再点确定。好了,现在公式和相关系数都出来了。如图:呵R的平方达0.996,线性相当好。 可是有时候有的项目是成指数增加的,散点图如下图, 从上图看并不值关,除了最大的一个点外其余的几乎都成了直线。这不难理解,对于10000000而言,10与10000都差不了多少。因此我们平时常使用半对数坐标纸画图。对于Excel也可以,先点中Y坐标轴,再按右键,选“坐标轴格式”如下图 将左下方的对数刻度选中,确定。完整的一个半对数标准曲线就做好了。 利用Excel制作标准曲线简单吧?如果认真调整参数可以得到不同的效果,大家多研究一下
⑵ 某一股票与市场组合的协方差是什么意思
方差描述了一组数列的波动情况,如果一个数列都是1种数,如1,1,1,1,1,1 那么它的方差为0
期望其实就是一组数的平均值
协方差是建立在方差分析和回归分析基础之上的一种统计分析方法
两个不同参数之间的方差就是协方差
相关系数r
相关系数是变量之间相关程度的指标。样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值范围为[-1,1]。|r|值越大,误差Q越小,变量之间的线性相关程度越高;|r|值越接近0,Q越大,变量之间的线性相关程度越低。
相关系数 又称皮(尔生)氏积矩相关系数,说明两个现象之间相关关系密切程度的统计分析指标。
相关系数用希腊字母γ表示,γ值的范围在-1和+1之间。
γ>0为正相关,γ<0为负相关。γ=0表示不相关;
γ的绝对值越大,相关程度越高。
两个现象之间的相关程度,一般划分为四级:
如两者呈正相关,r呈正值,r=1时为完全正相关;如两者呈负相关则r呈负值,而r=-1时为完全负相关。完全正相关或负相关时,所有图点都在直线回归线上;点子的分布在直线回归线上下越离散,r的绝对值越小。当例数相等时,相关系数的绝对值越接近1,相关越密切;越接近于0,相关越不密切。当r=0时,说明X和Y两个变量之间无直线关系。通常|r|大于0.75时,认为两个变量有很强的线性相关性。
相关系数的计算公式为:
其中xi为自变量的标志值;i=1,2,…n;■为自变量的平均值,
为因变量数列的标志值;■为因变量数列的平均值。
为自变量数列的项数。对于单变量分组表的资料,相关系数的计算公式为:
其中fi为权数,即自变量每组的次数。在使用具有统计功能的电子计算机时,可以用一种简捷的方法计算相关系数,其公式为:
使用这种计算方法时,当计算机在输入x、y数据之后,可以直接得出n、■、∑xi、∑yi、∑■、∑xiy1、γ等数值,不
必再列计算表。
参考资料:网络
⑶ excel回归分析的结果各项都代表着什么
Multiple R:相关系数R,值在-1与1之间,越接近-1,代表越高的负相关,反之,代表越高的正相关关系。
R Square:测定系数,也叫拟合优度。是相关系数R的平方,同时也等于回归分析SS/(回归分析SS+残差SS),这个值在0~1之间,越大代表回归模型与实际数据的拟合程度越高。
Adjusted R Square:校正的测定系数,对两个具有不同个数的自变量的回归方程进行比较时,考虑方程所包含的自变量个数的影响。
标准误差:等于表2中残差SS / 残差df 的平方根。与测定系数一样都能描述回归模型与实际数据的拟合程度,它代表的是实际值与回归线的距离。
观测值:有多少组自变量的意思。
excel回归分析的使用方法:
1、首先在excel表格中输入需要进行回归分析的数据。
⑷ 对于回归模型的几个主要假定里。。第四条看不懂。。什么叫对于所有x都。。是说无论取什么范围的x,误差
这条是说无论x取什么值,ε的方差都是不变的,即满足同方差假定。在回归中,x不是随机变量,ε是随机变量,同时根据经典假定,ε~N(0,σ^2)
⑸ 回归分析表怎么看懂
我给你解读一份stata的回归表格吧,应该有标准表格的所有内容了,因为你没有给范例,……不过我们考试基本就是考stata或者eview的输出表格,它们是类似的。
X变量:教育年限
Y变量:儿女数目
各个系数的含义:
左上列:
Model SS是指计量上的SSE,是y估计值减去y均值平方后加总,表示的是模型的差异
Model df是模型的自由度,一般就是指解释变量X的个数,这里只有一个
Resial SS 和df 分别是残差平方和以及残差自由度 N-K-1(此处K=1)=17565
Total SS 和 df分别是y的差异(y减去y均值平方后加总)以及其自由度N-1=17566
MS都是对应的SS除以df,表示单位的差异
右上列:
Number of obs是观测值的数目N,这里意味着有17567个观测值
F是F估计值,它是对回归中所有系数的联合检验(H0:X1=X2=…=0),这里因为只有一个X,所以恰好是t的平方。这里F值很大,因此回归十分显著。
Prob>F是指5%单边F检验对应的P值,P=0意味着很容易否定H0假设,回归显著。
R-squared是SSE/SST的值,它的意义是全部的差异有多少能被模型解释,这里R-squared有0.0855,说明模型的解释度还是可以的。
Adj R-squared是调整的R-squared,它等于1-(n-1)SSR/(n-k-1)SST,它的目的是为了剔除当加入更多X解释变量时,R-squared的必然上升趋势,从而在多元回归中更好的看出模型的解释力,但是本回归是一元的,这个值没有太大意义。
Root MSE是RMS的开方,是单位残差平方和的一种表现形式。
下列:
Coef分别出示了X变量schooling的系数和常数项的值,其含义是,如果一个人没有受过教育,我们预测会平均生育3个子女,当其他因素不变时,一个人每多受一年教育,我们预测其将会少生0.096个孩子。X变量的coef并不大,因此其实际(也叫经济)显著性并不太高。
Std.err则是估计系数和常数项的标准差。一般我们认为,标准差越小,估计值越集中、精确。
t是t估计值,它用于检验统计显著性,t值较大,因此回归是显著的。
P>abs(t)项是5%双边t检验对应的P值,P=0意味着很容易否定H0假设,统计显著。
95%conf interval项是95%的置信区间,它是x变量的系数(或常数项)分别加减1.96*SE,这是说,有95%的可能性,系数的真值落在这个区域。
⑹ 为什么相关或回归分析时 x和y取log
取对数作用主要有:
缩小数据的绝对数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了,例如TF-IDF计算时,由于在大规模语料库中,很多词的频率是非常大的数字。
2. 取对数后,可以将乘法计算转换称加法计算。
3. 某些情况下,在数据的整个值域中的在不同区间的差异带来的影响不同。例如,中文分词的mmseg算法,计算语素自由度时候就取了对数,这是因为,如果某两个字的频率分别都是500,频率和为1000,另外两个字的频率分别为200和800,如果单纯比较频率和都是相等的,但是取对数后,log500=2.69897, log200=2.30103, log800=2.90308 这时候前者为2log500=5.39794, 后者为log200+log800=5.20411,这时前者的和更大,取前者。因为前面两个词频率都是500,可见都比较常见。后面有个词频是200,说明不太常见,所以选择前者。
从log函数的图像可以看到,自变量x的值越小,函数值y的变化越快,还是前面的例子,同样是相差了300,但log500-log200>log800-log500,因为前面一对的比后面一对更小。
也就是说,对数值小的部分差异的敏感程度比数值大的部分的差异敏感程度更高。这也是符合生活常识的,例如对于价格,买个家电,如果价格相差几百元能够很大程度影响你决策,但是你买汽车时相差几百元你会忽略不计了。
4. 取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度,例如800/200=4, 但log800/log200=1.2616,数据更加平稳,也消弱了模型的共线性、异方差性等。
5. 所得到的数据易消除异方差问题。
6. 在经济学中,常取自然对数再做回归,这时回归方程为 lnY=a lnX+b ,两边同时对X求导,1/Y*(DY/DX)=a*1/X, b=(DY/DX)*(X/Y)=(DY*X)/(DX*Y)=(DY/Y)/(DX/X) 这正好是弹性的定义。
⑺ 对股票进行回归分析通常自变量和因变量选什么好
因变量通常是回报,比如行业超额回报、或者经无风险利率调整的回报。自变量,根据APT,有k个factor。所以你认为的是影响因素的变量都可以加入。常用的有市场回报(CAPM模型)、会计信息(sloan模型)、上期回报(Engle模型)和宏观变量(国债长短端利差、通胀等)。但是要重点看看t检验和adj R square,会对不相关的变量进行惩罚