知识库/银行从业 /线性回归分析

线性回归分析

线性回归分析相关课程

本视频可免费试听30秒,看完整版请购买课程

线性回归分析考点解析

所属考试:银行从业
授课老师:赵磊
所属科目:初级风险管理
考点标签: 了解
所属章节:第一章 风险管理基础/第三节 风险管理定量基础/线性回归分析
所属版本:

线性回归分析介绍

(1)回归方程

Y=α+β1X1+……+βnXn+ε

①当n=1时,称一元回归,回归系数β也称为斜率

②当n>1时,称为多元回归

(2)模型的假定

①Y与解释变量Xi之间的关系是线性的;

②解释变量Xi之间互不相关,即不存在多重共线性;

③误差项ε的期望值为零,即E(ε)=0;

④对不同的观察值,ε的方差不变,即不存在异方差;

⑤误差项ε满足正态分布。

(3)建立模型

逐步回归的基本思想:逐一增加解释变量个数,逐一进行显著性检验,直到既没有显著的解释变量选入回归方程,也没有不显著的解释变量从回归方程中剔除,保证最后所得到的解释变量集是最优的。

(4)评估模型的性能

①残差图:从预测结果中减去对应的目标变量的真实值,便可获得残差值。

②均方误差:误差平方和的平均值。

③拟合优度:可解释的波动与总波动之比,反映了Y的波动有多少百分比能被X的波动所描述。

④模型拟合优良性评价准则:评价准则包括AIC准则(赤池信息准则)、BIC准则(贝叶斯信息准则)

(5)回归分析在压力测试中的应用(2023新增)

在信用风险压力的情景测试方法中,需要分析多个风险因素同时发生变化以及某些极端不利事件发生对银行资产组合和银行承受风险能力的影响。

建立回归模型包括以下步骤:

①因子分析。包括:检验因变量与自变量之间统计量显著并符合经济常识;检验自变量之间不存在明显的多重共线性等问题。

②选择模型入模因子。通过逐步回归的方式挑选入模因子,若统计量不显著或经济含义不准确,可以尝试用宏观因子的一阶或多阶滞后项代入模型,直到满足统计检验和经济含义解析显著为止。

③确定压力测试模型。利用拟合优度、 AIC 或BIC 准则等模型评估指标,选择最终适用的压力测试模型,确定违约率(因变量)与宏观压力因子(自变量)之间的关系。

专题更新时间:2025/08/27 11:02:17

线性回归分析考点试题

判断题 1. 残差图、均方误差(MSE)、拟合优度(R2)都可以用来评价回归模型的拟合效果。
A .
B .

正确答案: B

答案解析: 一般来说,可以用残差图、均方误差(MSE)、拟合优度(R2)、模型拟合优良性评价准则等来评价一个回归模型的拟合效果。

多选题 2. 下列关于线性回归模型的假设,表述正确的有(  )。
A . 被解释变量Y与解释变量Xi之间的关系是线性的
B . 解释变量Xi之间不存在多重共线性
C . 误差符合满足标准正态分布
D . 对不同的观察值,误差项的方差等于0
E . 调整项的期望值为1

正确答案: A

答案解析: 多元线性回归模型的假设:
第一:Y与解释变量Xi之间的关系是线性的;
第二,解释变量Xi之间互不相关,即不存在多重共线性;
第三,误差项ε的期望值为零,即E(ε)=0;
第四,对不同的观察值,ε的方差不变,即不存在异方差;
第五,误差项ε满足正态分布。

单选题 3.在多元线性回归方程中,回归系数βi的含义是(  )
A . 在其他自变量不变的情况下,自变量再变化1个单位对因变量的影响
B . 自变量和因变量成比例关系
C . 回归系数越大,自变量对因变量的影响越小
D . 在其他自变量不变的情况下,因变量变动1个单位时,自变量的平均变动量

正确答案: A

答案解析: βi是计量经济学中的一个重要概念,通常表示自变量对因变量的影响程度,也称为回归系数或斜率系数。具体来说,βi表示当自变量X变化一个单位时,因变量Y的变化量。故选A。

判断题 4.残差图、均方误差(MSE)、拟合优度(R2)都可以用来评价回归模型的拟合效果。
A .
B .

正确答案: B

答案解析: 一般来说,可以用残差图、均方误差 (MSE) 、拟合优度 (R2)、模型拟合优良性评价准则等来评价一个回归模型的拟合效果。  

单选题 5.线性回归模型的表述中错误的是:
A . Y与X之间的关系是非线性的 
B . 误差项的期望值为0 
C . 误差项满足正态分布 
D . 不同的观察值,误差项方差不变

正确答案: A

答案解析: Y与解释变量X之间的关系是线性的。

大咖讲解:线性回归分析

李开源
银行从业
互联网金融硕士,高级金融讲师,上海财经广播特约评论嘉宾
查看老师课程
相关知识点推荐
高频

概率及概率分布

(1)随机事件与概率

不确定性事件:在相同的条件下重复一个行为或试验,所出现的结果有多种,但具体是哪种结果事前不可预知。

确定性事件:在相同的条件下重复同一行为或试验,出现的结果是相同的。

(2)随机变量及其概率分布

①离散型随机变量:列举法、表格法

②连续型随机变量:概率密度函数、累积概率分布函数

(3)随机变量的期望、方差和协方差

期望

随机变量的概率加权和。

方差

描述随机变量偏离其期望值的程度。

当一个随机变量取值以很大的可能性偏离其期望值时,其方差就比较大,反之方差较小。

标准差

通常将随机变量方差的算术平方根称为标准差或波动率。

线性变换

风险管理中通常需要关注多个变量的线性组合。例如,分析投资组合的期望、方差等统计规律时,要对变量进行线性变换后再计算期望和方差。

协方差与相关系数

协方差Cov(X,Y)可以用来度量不同随机变量之间的相关性。取值是负无穷到正无穷。

相关系数的取值范围为-1~1。当相关系数等于-1时,表示X和Y完全负相关;当相关系数等于1时,表示X和Y完全正相关;当相关系数等于零时,表示X和Y不相关,此时Cov(X,Y)=0。相关系数越大,表明X和Y相关程度越高。

(4)一些重要的概率分布(2023新增)

二项分布

描述只有两种可能结果的多次重复事件的离散型随机变量的概率分布。

泊松分布

通常用来描述单位时间内(也可以是单位面积、单位产品)某一事件成功次数所对应的概率。

指数分布

指数分布是描述泊松过程中事件间隔时间的概率分布。

在信用风险管理中,可以用指数分布来计量违约概率。

指数分布存在无记忆性。

均匀分布

随机变量在一个区间内以相等可能性取得一个区间中的任何一个实数值,即分布密度在区间内是一个常数,分布函数是一条斜线。

正态分布

正态分布的性质

关于x=μ对称,在x=μ处曲线最高,在x=μ±σ处各有一个拐点;

若固定σ,随μ值不同,曲线位置不同,故也称μ为位置参数;

若固定μσ大时,曲线矮而胖,σ小时,曲线瘦而高,故也称σ为形状参数;

整个曲线下面积为1;

正态随机变量X的观测值落在距均值的距离为1倍、2倍、2.5倍标准差范围内的概率分别如下:

P(μ-σ<X<μ+σ68%;P(μ-2σ<X<μ+2σ95%;P(μ-2.5σ<X<μ+2.5σ99%

μ=0,σ=1时,称正态分布为标准正态分布

χ2分布

假设n个随机变量X1,X2…,Xn独立同分布且服从标准正态分布,则称统计量服从自由度为n的χ2分布。常用于假设检验和置信区间的计算。

t分布

设随机变量X服从标准正态分布N(0,1),Y服从χ2分布,且X,Y相互独立,则称统计量

服从自由度为nt分布

t分布的性质如下:

t~tn)时,则EX=0,其中n>1DX=n/n-2),其中n>2

t分布曲线是一条以0为中心,左右对称的单峰分布曲线。

自由度n是确定t分布形状的参数。当n较小时,t分布的概率密度函数呈现厚尾形状;随着n逐渐增大,t分布越来越接近于标准正态分布。

F分布

设随机变量X服从χ2(m)分布,Y服从χ2(n)分布,且X与Y独立,则称统计量服从自由度分别是mnF分布F分布的性质如下:Z~Fmn),则1/Z~Fnm);T~tn),则T2~F1,n

(5)偏度和峰度

偏度

峰度

用来度量随机变量概率分布的不对称性。

偏度的取值范围为(-+),

偏度>0:X右边偏离均值的数据较多,数据分布呈现出右偏,也称正偏。

偏度<0:X左边偏离均值的数据较多,数据分布呈现出左偏,也称负偏。

对于正态分布来说,偏度等于零,表示数据分布左右对称。

用来度量随机变量概率分布的陡峭程度。

峰度的取值范围为[1,+),正态分布的峰度为3。

若峰度小于3,则称为低峰,图形上相比正态分布呈现

出矮峰瘦尾;

若峰度值大于3,则称为高峰,图形上相比正态分布呈现出尖峰肥尾。

高频

收益和风险的度量

(1)收益的度量

①绝对收益:对投资收益最直接和直观的计量方式,是投资成果的直接反映。

绝对收益=期末资产价值总额-期初投入的资金总额

②持有期收益率:最常用的评价投资收益的方式。

持有期收益率=(期末价格-期初价格+持有期间现金收益)/期初价格

③预期收益率:假定收益率R服从某种概率分布,资产的未来收益率有n种可能的取值r1,r2,……rn,每种收益率对应出现的概率为Pi则该资产的预期收益率E(R)为

E(R)=P1r1+P2r2+.…..+Pnrn

(2)风险的度量:方差和标准差

资产收益率的不确定性就是风险的集中体现,而风险的大小可以由未来收益率与预期收益率的偏离程度来反映。

资产收益率标准差越大,表明资产收益率的波动性越大。当标准差很小或接近于零时,资产的收益率基本稳定在预期收益水平,出现的不确定性程度逐渐减小。

 

高频

风险分散的数理原理

根据投资组合理论,构建资产组合即多元化投资能够降低投资风险。以投资两种资产为例,假设两种资产的预期收益率分别为R1和R2,每一种资产的投资权重分别W1和W2=1-W1,则该资产组合的预期收益率为

Rp=W1R1+W2R2

高频

随机事件与概率

不确定性事件:在相同的条件下重复一个行为或试验,所出现的结果有多种,但具体是哪种结果事前不可预知。

确定性事件:在相同的条件下重复同一行为或试验,出现的结果是相同的。

高频

随机变量及其概率分布

①离散型随机变量:列举法、表格法

②连续型随机变量:概率密度函数、累积概率分布函数

高频

随机变量的期望、方差和协方差

随机变量的期望、方差和协方差

期望

随机变量的概率加权和。

方差

描述随机变量偏离其期望值的程度。

当一个随机变量取值以很大的可能性偏离其期望值时,其方差就比较大,反之方差较小。

标准差

通常将随机变量方差的算术平方根称为标准差或波动率。

线性变换

风险管理中通常需要关注多个变量的线性组合。例如,分析投资组合的期望、方差等统计规律时,要对变量进行线性变换后再计算期望和方差。

协方差与相关系数

协方差Cov(X,Y)可以用来度量不同随机变量之间的相关性。取值是负无穷到正无穷。

相关系数的取值范围为-1~1。当相关系数等于-1时,表示X和Y完全负相关;当相关系数等于1时,表示X和Y完全正相关;当相关系数等于零时,表示X和Y不相关,此时Cov(X,Y)=0。相关系数越大,表明X和Y相关程度越高。

高频

一些重要的概率分布

一些重要的概率分布(2023新增):

二项分布

描述只有两种可能结果的多次重复事件的离散型随机变量的概率分布。

泊松分布

通常用来描述单位时间内(也可以是单位面积、单位产品)某一事件成功次数所对应的概率。

指数分布

指数分布是描述泊松过程中事件间隔时间的概率分布。

在信用风险管理中,可以用指数分布来计量违约概率。

指数分布存在无记忆性。

均匀分布

随机变量在一个区间内以相等可能性取得一个区间中的任何一个实数值,即分布密度在区间内是一个常数,分布函数是一条斜线。

正态分布

正态分布的性质

关于x=μ对称,在x=μ处曲线最高,在x=μ±σ处各有一个拐点;

若固定σ,随μ值不同,曲线位置不同,故也称μ为位置参数;

若固定μσ大时,曲线矮而胖,σ小时,曲线瘦而高,故也称σ为形状参数;

整个曲线下面积为1;

正态随机变量X的观测值落在距均值的距离为1倍、2倍、2.5倍标准差范围内的概率分别如下:

P(μ-σ<X<μ+σ68%;P(μ-2σ<X<μ+2σ95%;P(μ-2.5σ<X<μ+2.5σ99%

μ=0,σ=1时,称正态分布为标准正态分布

χ2分布

假设n个随机变量X1,X2…,Xn独立同分布且服从标准正态分布,则称统计量服从自由度为n的χ2分布。常用于假设检验和置信区间的计算。

t分布

设随机变量X服从标准正态分布N(0,1),Y服从χ2分布,且X,Y相互独立,则称统计量

服从自由度为nt分布

t分布的性质如下:

t~tn)时,则EX=0,其中n>1DX=n/n-2),其中n>2

t分布曲线是一条以0为中心,左右对称的单峰分布曲线。

自由度n是确定t分布形状的参数。当n较小时,t分布的概率密度函数呈现厚尾形状;随着n逐渐增大,t分布越来越接近于标准正态分布。

F分布

设随机变量X服从χ2(m)分布,Y服从χ2(n)分布,且X与Y独立,则称统计量服从自由度分别是mnF分布F分布的性质如下:Z~Fmn),则1/Z~Fnm);T~tn),则T2~F1,n

 

高频

偏度和峰度

偏度和峰度:

偏度

峰度

用来度量随机变量概率分布的不对称性。

偏度的取值范围为(-+),

偏度>0:X右边偏离均值的数据较多,数据分布呈现出右偏,也称正偏。

偏度<0:X左边偏离均值的数据较多,数据分布呈现出左偏,也称负偏。

对于正态分布来说,偏度等于零,表示数据分布左右对称。

用来度量随机变量概率分布的陡峭程度。

峰度的取值范围为[1,+),正态分布的峰度为3。

若峰度小于3,则称为低峰,图形上相比正态分布呈现

出矮峰瘦尾;

若峰度值大于3,则称为高峰,图形上相比正态分布呈现出尖峰肥尾。

高频

收益的度量

①绝对收益:对投资收益最直接和直观的计量方式,是投资成果的直接反映。

绝对收益=期末资产价值总额-期初投入的资金总额

②持有期收益率:最常用的评价投资收益的方式。

持有期收益率=(期末价格-期初价格+持有期间现金收益)/期初价格

③预期收益率:假定收益率R服从某种概率分布,资产的未来收益率有n种可能的取值r1,r2,……rn,每种收益率对应出现的概率为Pi则该资产的预期收益率E(R)为

E(R)=P1r1+P2r2+.…..+Pnrn

高频

风险的度量:方差和标准差

风险的度量:方差和标准差

资产收益率的不确定性就是风险的集中体现,而风险的大小可以由未来收益率与预期收益率的偏离程度来反映。

资产收益率标准差越大,表明资产收益率的波动性越大。当标准差很小或接近于零时,资产的收益率基本稳定在预期收益水平,出现的不确定性程度逐渐减小。

添加银行学霸君或学习群

领取资料&加备考群

233网校官方认证

扫码加学霸君领资料

233网校官方认证

扫码进群学习

233网校官方认证

扫码加学霸君领资料

233网校官方认证

扫码进群学习

拒绝盲目备考,加学习群领资料共同进步!

师资团队

银行从业书籍
互动交流
扫描二维码直接进入

微信扫码关注公众号

获取更多考试资料