第1讲 回归分析概述第1讲单元测试1、回归分析中关于解释变量x和被解释变量y的说法正确的是:
a、解释变量x和被解释变量y都是随机变量
b、解释变量x和被解释变量y都是非随机变量
c、解释变量x是非随机变量,被解释变量y是随机变量
d、解释变量x是随机变量,被解释变量y是非随机变量
2、以下模型属于线性回归模型的是:
a、
b、
c、
d、
e、
3、在回归方程中,g代表性别虚拟变量,男性则为1,否则为0。若g的定义改变为女性为1,否则为0,则回归方程应为:
a、
b、
c、
d、
4、以下关于计量经济学用途的说法正确的有:
a、分析个人消费与个人可支配收入之间的关系。
b、检验边际效用递减在现实中是否成立。
c、预测未来经济走势,如国内生产总值(gdp)。
d、描述商品价格与需求量之间的因果关系。
e、分析父母身高与子女身高之间的函数关系。
5、计量经济学可用于描述商品需求曲线,即需求量与价格的关系。
6、计量经济学只能做定量研究,不能做定性研究,如个人的职业选择。
7、回归分析考察的是解释变量与被解释变量之间的函数关系。
8、回归方程中,被解释变量等于其估计值与随机误差项之和。
9、残差指的是被解释变量的真实值与估计值之差。
10、数据不准确可能导致回归分析的结论存在偏误。
第1讲单元作业1、为分析不同州的公共教育支出花费在学生身上的教育经费,估计了如下的回归方程: 式中,s代表第i个州花费在每个公立学校学生身上的教育经费;y代表第i个州的资本收入;g代表第i个州公立学校学生的增长率。 1a 说明变量y与变量g的参数估计值的经济意义。
2、1b 你预期变量y和g的参数符号各是什么?请说明理由。估计结果与你的预期一致吗?
3、1c 变量g是用小数来衡量的,因此,当一个州的招生人数增加了10%时,g等于0.1。如果变量g用百分比的形式来衡量,那么当一个州的招生人数增加了10%时,g等于10。此时,方程的参数估计值会如何变化?(文字说明即可)
4、jaime diaz发表在《体育画报》上的一篇论文研究了美国职业高尔夫球协会(pga)巡回赛中不同距离的推杆次数。论文中建立了推杆进洞次数百分比(p)关于推杆距离(l,英尺)的关系式。推杆距离越长,进洞的可能性越小。可以预测,l的参数估计值为负。回归方程如下: 2a 说明l的参数估计值的经济意义。
5、2b 利用该方程估计一个pga高尔夫球员10英尺推杆进球的次数百分比。再分别估计1英尺和25英尺的情况。结果是否符合现实?
6、2c 上一题的答案说明回归分析时存在什么问题?
第2讲 普通最小二乘法第2讲单元测试1、讨论回归结果时不用花费太多时间去分析常数项的估计值,这主要依据的假设是:
a、误差项总体均值为0。
b、所有解释变量与误差项都不相关。
c、误差项与观测值互不相关 。
d、误差项具有同方差。
e、模型设定无误。
2、在关于身高和体重的模型中,新增qq号码这个变量后,以下说法错误的是:
a、身高的参数估计值可能发生变化。
b、判定系数可能减小。
c、调整的判定系数可能减小。
d、qq号码的参数估计值一定为0.
e、常数项的估计值可能发生变化。
3、一元回归方程的样本回归线必然通过的点为:
a、
b、
c、
d、
e、
4、以下关于最小二乘法的说法正确的有:
a、最小二乘法的目标是残差平方和最小。
b、所估计的对象是方程中的参数。
c、最小二乘法的目标是残差之和最小。
d、判定系数可以为负数
e、判定系数越大,模型越好。
f、判定系数并不是越大越好。
5、建立玉米产量y对施肥密度f和降雨量r的回归方程,估计结果为。则以下说法正确的有:
a、常数项-120意味着玉米产量可能为负。
b、若变量f的参数真实值为0.20,则参数估计值-0.10表明ols估计量是有偏的。
c、变量f的参数估计值的符号不符合预期,并不影响ols估计量的blue性质。
d、若方程不满足所有古典假设,变量r的参数真实值也可能等于5.33。
6、最小二乘法的目标是误差项之和最小。
7、若所有解释变量对被解释变量没有影响,回归方程的判定系数一定为0。
8、若某解释变量在理论上对被解释变量没有影响,该解释变量的参数估计值一定为0.
9、若采用两组样本估计同一回归方程,参数估计值的差异体现了数据的随机性。
10、若解释变量之间存在完全多重共线性,则参数估计值无法获得。
11、随机误差项的总体均值为0以及随机误差项与解释变量不相关保证了参数估计量的无偏性。
12、若随机误差项服从t分布,则ols估计量不再具有blue性质。
第2讲单元作业1、1 查尔斯·拉弗(charles lave)发表了一篇驾驶员交通事故率的研究报告。他的总体结论是驾驶速度的方差(同一公路上汽车驾驶速度差异的程度)是交通事故率的重要决定因素。在他的分析中,采用两年的全美数据分别估计,得出的回归方程为: 第一年: 第二年: 式中,代表第i个州州际公路上的交通事故数量(单位:车辆每行驶一亿英里的交通事故数);代表一个不确定的估计截距;代表第i个州的驾驶速度的方差;代表第i个州每名驾驶员的平均罚单数量;代表第i个州内每平方英里医院的数量。 1a.考察变量的理论依据,给出其参数符号的预期。
2、1b.这两年的参数估计的差异是否值得重视?请说出你的理由。在什么情况下,应该关注这些差异呢?
3、1c.通过比较两个方程的调整的判定系数,哪一个方程具有更高的判定系数?调整的判定系数越高,回归方程越好吗?为什么?
4、假定你决定建一个离你学校最近的冷冻酸奶商店的销售量模型。店主很乐意帮助收集数据,因为她相信你们学校的学生是她的主要顾客。经过长时间的数据收集以及无限量的冷冻酸奶供给之后,你估计得到以下回归方程: 式中,代表第t个两周内冷冻酸奶的销售总量;代表t期的平均温度(单位:华氏温度);代表t期该商店冷冻酸奶价格(单位:美元);代表反映是否在学校报纸发布广告的虚拟变量(1=店主在学校报纸上做了广告);代表反映是否为学校学期时间的虚拟变量(1=t期是学校学期时间,即9月初到12月初、1月初到5月底)。 2a.为什么要假定“无限量的冷冻酸奶供给”?(提示:考虑模型是否满足经典假设)
5、2b.说明变量和变量的参数估计值的经济含义。
6、2c.你和店主对变量c的参数符号都很惊讶。你能解释为什么吗?
第3讲 假设检验第3讲单元测试1、以下不适用f检验的情形是
a、在含季节性虚拟变量的回归方程中,检验季节性是否存在。
b、在柯布—道格拉斯生产函数中,检验规模报酬是否不变。
c、在回归方程中,检验结构是否存在变化。
d、在回归方程中,检验误差项是否服从正态分布。
e、在回归方程中,检验某一参数是否异于零。
f、在回归方程中,检验某一参数是否大于零。
2、以下关于t检验的局限性的说法错误的是
a、t检验的结果是完全可信的。
b、t检验的统计显著性并不等同于理论有效性。
c、t检验不能考察相应变量在方程中的相对重要性。
d、随着样本容量的增大,t统计量的值会越来越大。
e、对于一个超大规模的样本而言,t检验没有任何意义,因为你几乎可以拒绝任何原假设。
f、在回归方程中,参数估计值和t统计量的值越大,该变量越重要。
3、以下关于单侧t检验的判定方法正确的是
a、如果t统计量的值大于临界值,则拒绝原假设。
b、如果t统计量的值大于临界值,且参数符号与h0隐含的符号相同,则拒绝原假设。
c、如果t统计量的值大于临界值,且参数符号与ha隐含的符号相同,则拒绝原假设。
d、如果p值小于研究所要求的显著性水平,则拒绝原假设。
e、如果p值小于研究所要求的显著性水平,且参数符号与h0隐含的符号相同,则拒绝原假设。
f、如果p值小于研究所要求的显著性水平,且参数符号与ha隐含的符号相同,则拒绝原假设。
4、以下关于单侧t检验和双侧t检验的说法正确的有
a、对参数符号具有明显预期时用单侧t检验,预期不确定时用双侧t检验。
b、eviews回归结果中的t检验默认的是双侧检验。
c、eviews回归结果中的t检验默认的是单侧检验。
d、给定自由度和显著性水平,双侧t检验的临界值大于单侧t检验的临界值。
e、给定自由度和显著性水平,双侧t检验的临界值是单侧t检验的临界值的2倍。
f、在给定的显著性水平下,若某参数的双侧t检验拒绝原假设,该参数的单侧t检验在参数符号符合预期时也拒绝原假设。
g、在给定的显著性水平下,若某参数的单侧t检验拒绝原假设,该参数的双侧t检验也拒绝原假设。
5、以下关于邹检验的说法正确的有
a、邹检验主要考察方程的总体显著性。
b、邹检验只能处理回归方程仅存在一次结构变化的情形。
c、邹检验假定两个子样本的误差项服从独立、同方差的正态分布。
d、邹检验明确指出子样本中方程的差别来源于截距项。
e、邹检验不确定子样本中方程的差别来源于截距还是斜率,或二者兼有。
f、邹检验假定结构转折点的时间是已知的。
g、邹检验允许结构变化的时间是未知的。
6、假设检验通常将希望出现的结果作为原假设,将不希望出现的结果作为备择假设。
7、检验回归参数是否显著地异于某一特定的非零值,可以用t检验,也可以用f检验。
8、若方程总体显著性的f检验拒绝原假设,每个斜率参数的双侧t检验都拒绝“参数为零”原假设。
9、假设检验的结论是“不拒绝”而不是“接受”。
10、显著性水平也就是第一类错误的概率。
11、在回归分析中,t统计量的绝对值越大,相应的解释变量越重要。
第3讲单元作业1、假想现在要估计一个关于房价的模型,来推断面朝海滩的环境对房屋价值的影响。由于一系列理论和数据的可获得性等方面的原因,所以,经过一番研究,决定使用地皮的面积而不是房屋本身的面积作为其中一个变量。分析结果如下(括号内的数值为标准误): 式中,代表第i幢房子的价格(单位:1000万美元);代表第i幢房子所占地皮面积(单位:1000万平方米);代表第i幢房子的已建年限;代表第i幢房子里的房间数目;代表虚拟变量,若第i幢房子有壁炉则为1,否则为0;代表虚拟变量,若第i幢房子朝向海滩则为1,否则为0。 自由度 单侧:10% 5% 2.5% 24 1.318 1.711 2.064 25 1.316 1.708 2.060 1a. 对变量lot、bed的参数建立适当的假设,并在5%的显著性水平下进行检验。
2、1b.壁炉可能增加房屋的价值,但你的一个朋友说壁炉太脏不利于保持室内整洁,使你不能确定它的参数符号。请建立适当的假设,并在5%的显著性水平下进行检验。
3、1c. 回归结果是否出现与预期不符的情形?(提示:考虑参数的显著性)
4、1d. 请写出关于方程总体显著性的f检验的原假设和备择假设。
5、为研究医生建议病人减少饮酒对个人饮酒量的作用,建立回归模型,选取500个观察值作为样本,估计结果如下(括号中的数值为标准误): 式中,drinks代表第i个人过去两周的饮酒量;advice代表虚拟变量,医生建议第i个人减少饮酒则为1,否则为0;educ代表第i个人受教育的年限;divsep代表虚拟变量,第i个人离婚或者分居则为1,否则为0;unemp代表虚拟变量,第i个人失业则为1,否则为0。 自由度 单侧:10% 5% 0.5% 120 1.289 1.658 2.617 2a. 变量divsep和unemp的参数按常理来说应为正。建立变量divsep和unemp的参数的适当假设,并在5%的显著性水平下进行检验(提示:使用自由度为120下的t统计量临界值)。
6、2b. 对变量educ的参数建立以0为中心的双侧假设,在1%显著性水平下进行检验。为何这个参数适合采用双侧检验?
7、2c. 大多数医生希望经过他们的劝说,病人能够减少饮酒量,这也是经过劝说之后病人们通常会做的(假定方程中其他因素是固定的)。建立适当的假设,并在10%的显著性水平下进行检验。
8、2d. 若变量advice的参数符号不符合预期,是否应该改变你的预期?为什么?
第4讲 模型设定第4讲单元测试1、以下关于模型设定准则的说法正确的是
a、回归方程包含一个变量的最重要的准则是理论,而不是统计上的显著性。
b、参数t检验不显著的变量不能简单地从方程中剔除。
c、若变量加入方程后,判定系数增大,方程应包含该变量。
d、若变量加入方程,其他变量的系数符号发生改变且不再符合预期,方程不应包含该变量。
e、若某变量是理论上必须包含的变量,即使系数t检验不显著,方程也应包含该变量。
f、t检验不显著的变量应该从方程中剔除。
2、以下关于函数形式选择的说法正确的是
a、研究柯布-道格拉斯生产函数,方程为
b、研究柯布-道格拉斯效用函数,方程为
c、研究可支配收入对某种商品消费量的影响,方程为
d、研究可支配收入对消费的影响,方程为
e、研究员工年龄对员工年收入的影响,方程为
3、当方程中同时存在遗漏变量和不相干变量时,应首先解决遗漏变量的问题。
4、相对而言,遗漏变量的后果比不相干变量的后果更加严重。
5、模型设定准则中aic的值越大越好,sc的值越小越好。
6、方程函数形式的选择主要取决于哪个函数形式拟合的最好。
第4讲单元作业1、1.假设你已经被提升为“amish”公司速溶麦片粥的产品经理,你的首项任务是决定下一年度是否要提价。(速溶麦片粥是一种用热水冲泡之后就可以作为谷类早餐的很好选择,比普通麦片冲泡时间短。)为了保持你作为amish oats公司计量经济学家的声誉,你决定建立关于销售价格对销售量影响的模型,并且估计了如下假设方程(括号内的数值为标准误): 式中,oat代表第t年amish公司速溶麦片粥在美国的销售量;pr代表第t年amish公司速溶麦片粥在美国的销售价格;prcomp代表第t年作为竞争品的速溶燕麦粥在美国的价格;ads代表第t年amish公司速溶麦片粥的广告投入;yd代表第t年美国的可支配收入。 自由度 单侧:5% 2.5% 24 1.711 2.064 1a.建立pr 的斜率参数的适当假设,并在5% 的显著性水平下进行检验。
2、1b. 这个方程是否存在计量经济学问题?是否能看出有变量被遗漏的迹象?有没有迹象表明该方程有不相干变量?
3、1c.如果可以给方程中加入一个变量,你建议加入什么变量?
4、什么样的汽车加速最快?大多数人都会回答,高功率的、轻型的、流线型的汽车加速最快。为检验这种说法是否正确,利用2009年模型车数据估计了如下方程: 式中,time 代表第i辆车的速度从0加速到每小时60英里所需要的时间(单位:秒);top代表虚拟变量,如果第i辆车是手动挡则为1,否则为0;weight代表第i辆车的重量(单位:磅);hp代表第i辆车的马力。 2a. 假设你的邻居是物理学专业的,他告诉你马力可以表示为:。其中,m表示质量,d表示距离,a表示加速度。那么,你认为方程存在怎样的计量经济学问题?
5、2b. 你决定将time和hp之间的函数形式改为反函数形式。新方程的回归结果如下: 你认为哪一个方程更恰当?为什么?
6、2c. 既然这两个方程选用的是两种不同的函数形式,那么,它们的调整的判定系数可以用来比较吗?为什么?
第5讲 多重共线性第5讲单元测试1、建立人均鸡肉消费量y对鸡肉价格pc、牛肉价格pb、人均总收入xd、人均可支配收入yd的回归方程,采用年度数据的回归结果显示,方程存在多重共线性。以下关于多重共线性的补救措施正确的是
a、剔除鸡肉价格pc
b、剔除牛肉价格pb
c、剔除人均总收入xd或人均可支配收入yd
d、采用相对价格pc/pb或pb/pc替代pc和pb
e、增大样本容量
2、支配变量通常与被解释变量高度相关,以至于掩盖了方程中其他解释变量对被解释变量的影响。因此,回归分析中应避免使用支配变量。以下情形中,所涉及的变量属于支配变量的是
a、某棒球队每年参加比赛的次数都相同,在关于赢得比赛次数的方程中,该球队输掉比赛的次数。
b、某餐厅的各连锁店的销售额基本相同,在总销售额模型中,连锁店的个数。
c、总消费支出的方程中,可支配收入。
d、某汽车制造商(自己不制造轮胎)生产汽车数量的年度模型中,所购买的轮胎数量。
e、农业供给函数中,每亩地使用的化肥数量。
3、如果回归方程选取和为解释变量,由于是的函数,方程存在完全多重共线性。
4、多重共线性可能造成参数估计值的符号与预期不一致。
5、多重共线性指的是解释变量与被解释变量之间存在的线性关系。
6、几乎每一个回归方程都在某种程度上存在多重共线性问题。
第5讲单元作业1、你受雇于学生辅导办公室,帮助减少调皮学生对宿舍的破坏。你要做的第一步就是建立一个截面模型,该模型把上学期每个宿舍的破坏损失作为宿舍成员特征的函数(括号中的数值为标准误): 式中,d代表上学期第i个宿舍的破坏损失(单位:美元);f代表在第i个宿舍中大一新生的入住百分比;s代表第i个宿舍的学生人数;a代表上学期第i个宿舍向学生辅导办公室报告的涉及酗酒事件的次数。 自由度 单侧:5% 2.5% 29 1.699 2.045 30 1.697 2.042 a. 针对变量s的参数做出适当假设,并在5%的显著性水平下进行检验。
2、b. 该方程存在什么问题(从遗漏变量、不相干变量或多重共线性中选择)?为什么?
3、c. 假定你现在得知,变量s和a之间的简单相关系数为0.94,这会改变你在b中的答案吗?如果改变的话,怎样改变的?
4、d. 参数估计值的符号与预期不一致,这可能是由多重共线性引起的吗?为什么?
第6讲 序列相关性第6讲单元测试1、序列相关性产生的后果主要包括:
a、ols估计量是有偏的。
b、ols估计量仍是无偏的。
c、ols估计量是有效的。
d、ols估计量不再是有效的。
e、标准误的ols估计量是有偏的。
f、ols估计假设检验仍然可靠。
g、ols估计的假设检验不可靠。
2、以下关于序列相关检验方法的说法正确的有:
a、序列相关检验首先要明确是纯序列相关还是非纯序列相关。
b、德宾-沃森d统计量的取值在-1和 1之间。
c、德宾-沃森d检验是双侧检验,即检验误差项是否存在序列相关。
d、德宾-沃森d检验假定误差项具有同方差性。
e、德宾-沃森d检验只能检验一阶序列相关。
3、设定偏误可能导致回归模型存在非纯序列相关。
4、若回归模型修正了非纯序列相关问题后,无需检验纯序列相关问题。
5、若德宾-沃森d检验未发现序列相关性,回归模型一定不存在序列相关性问题。
6、德宾-沃森d统计量仅在时间序列数据的回归模型中有意义。
第7讲 异方差性第7讲单元测试1、异方差性产生的后果主要包括:
a、ols估计量是有偏的。
b、ols估计量仍是无偏的。
c、ols估计量仍是有效的。
d、ols估计量不再是有效的。
e、标准误的ols估计量是有偏的。
f、标准误的ols估计量是无偏的。
g、ols估计假设检验仍然可靠。
h、ols估计的假设检验不可靠。
2、以下关于异方差性检验方法的说法正确的有:
a、异方差检验首先要明确是纯异方差还是非纯异方差。
b、park检验中对t统计量进行检验时应采用单侧检验
c、park检验采用的是双对数回归模型。
d、white检验中可包含解释变量的交叉项,也可不包含解释变量的交叉项。
e、异方差检验主要关注残差。
f、若异方差与解释变量完全没有关系,white检验也无能为力。
3、遗漏变量可能导致回归模型存在非纯异方差性。
4、横截面数据的回归更容易产生异方差。
5、异方差性的检验思路与序列相关性的检验思路是相似的。
6、若回归模型修正了非纯异方差性问题后,无需检验纯异方差性问题。
7、若park检验和white检验均未检验出异方差性,回归模型一定不存在异方差问题。
8、异方差性是回归分析中普遍存在的问题,几乎每个方程都需要进行异方差性修正,因此,同方差不必包含在古典假设中。
第8讲 虚拟变量第8讲单元测试1、在仅含虚拟变量的一元回归模型中,若重新设置被省略的状态,改变虚拟变量的定义,则以下说法正确的是:
a、截距参数不会发生变化。
b、斜率参数不会发生变化。
c、仅有截距参数发生变化。
d、仅有斜率参数发生变化。
e、截距参数和斜率参数均会发生变化。
2、在研究收入问题时,有人发现收入主要受到工作经验、学历的影响。而且随着工作经验的增加,学历产生的影响更大。令y代表收入;exp代表工作年限;d代表学历虚拟变量,大学毕业及以上取1,大学以下取0。以下回归方程中正确的是:
a、
b、
c、
d、
e、
f、
3、虚拟变量的个数一般比定性变量的状态个数少1。
4、若研究东部、中部、西部的员工工资差异,模型中需要设置3个虚拟变量。
5、运用斜率虚拟变量时,方程中一般同时包含截距虚拟变量和一般解释变量。
6、若分析学历(含高中生、本科生、硕士生三类)对薪水的影响,可设置硕士生为2,本科生为1,其他为0。
7、引入加法形式的虚拟变量主要考察截距的不同。
8、引入乘法形式的虚拟变量主要考察斜率的不同。
9、邹检验可采用虚拟变量模型实现。
第9讲 虚拟应变量第9讲单元测试1、以下关于模型设定的说法错误的是:
a、考察性别对薪酬的影响需使用虚拟变量模型。
b、自然实验中,分析某项政策的影响需使用difference-in-difference方法。
c、研究高中文理分科的影响因素可使用logit模型或probit模型。
d、分析个人的职业选择可使用多元logit模型。
e、分析线上购物和线下购物的选择可使用线性概率模型。
f、分析债券信用评级的影响因素可使用多元logit模型。
2、以下关于虚拟应变量模型的说法错误的是:
a、线性概率模型可能存在被解释变量的估计值不在(0,1)之间的问题。
b、调整的判定系数不能准确度量线性概率模型的拟合优度。
c、logit模型和probit模型可采用极大似然法估计。
d、logit模型和probit模型不存在遗漏变量的问题。
3、虚拟应变量模型仅能分析二元选择问题。
4、虚拟变量仅可作为解释变量,不能作为被解释变量。
5、研究大学毕业生是选择就业还是选择深造,可采用logit模型或probit模型。
6、通常情况下,logit模型和probit模型得到的参数估计值在符号和显著性上是相似的。
7、调整的判定系数可精确度量线性概率模型的拟合优度。
8、虚拟应变量模型不能采用虚拟变量为解释变量。
第10讲 预测第10讲单元测试1、一个预测方程在样本内拟合得很好,但并不能保证在样本外也可以进行准确的预测。
2、预测是对被解释变量样本外的观测值的估计。
3、计量模型的预测既可以进行均值预测,又可以进行区间预测。
4、平稳时间序列和非平稳时间序列均可采用arma模型预测。
5、均方根误差rmse指标越小,模型的预测能力越强。
6、时间序列模型预测中,动态预测的效果一定优于静态预测的效果。
7、当存在序列相关时,广义最小二乘法的预测结果通常优于普通最小二乘法。
8、时间序列分析体现了“让数据自己说话”的思想。
猜你喜欢
- 2022-12-05 20:10
- 2022-12-05 20:08
- 2022-12-05 20:01
- 2022-12-05 19:59
- 2022-12-05 19:51
- 2022-12-05 19:07
- 2022-12-05 19:06
- 2022-12-05 18:43
- 2022-12-05 18:32
- 2022-12-05 18:22