狗熊会精品案例 | 基于面板模子的城市房价阐发

访客2023-11-30 10:27:5227

1 布景介绍

面板数据,是统计学与计量经济学中截面数据与时间序列数据的连系。差别于混合横截面数据,面板数据是对统一主体的差别时间点的看测值。因为它同时具有多个个别或单位和多个时间点的信息,它能够用来研究个别、单位或群体之间的改变,从而更好天文解它们之间的关系。假设在面板数据中,每个期间在样本中的个别聚集完全一样,则称为“平衡面板数据”;反之,则称为“非平衡面板数据”。

常见的面板数据有国民经济统计数据、临床试验数据和微看查询拜访数据等。国民经济数据是按年、季度或其他时间间隔按期统计的国度经济的各项数据和目标,那些目标包罗国内消费总值(GDP)、就业率、通胀率和商业平衡等,能够供给经济现状的全面概述。临床研究中也经常需要按期搜集临床试验参与者目标如生物标记物浓度和药物效果等,用于评估新的医疗治疗、设备或药物的平安性和有效性;此外,近年来国表里积极建立的微看数据库也是面板数据的重要来源,很多微看研究是针对每个研究对象继续多年的跟踪查询拜访,凡是涵盖收进、职业、教导布景等数千个变量,国内已有的微看数据库有中国度庭收进查询拜访和中国度庭金融查询拜访等。

面板数据可以供给统一个别丰富的纵向信息,我们能够利用面板模子对面板数据停止回回研究变量影响因素。一般情状下,面板模子可分为三品种型,别离是混合估量模子即一般线性回回,固定效应模子和随机效应模子。本案例将以20个城市日度房价数据为例,介绍面板数据阐发办法和成果解读。

2 数据阐明

本案例搜集了20个城市2017年4月24日至2018年3月19日的每日房价信息。颠末整理,最末面板数据构造如表1所示,包罗20个个别328期看测数据,是一个平衡面板数据集,5个字段别离为日期、城市、当日房价、昨日房价、前日房价。

表 1 数据样例表

3 描述性阐发

20个城市中,房价均价排名前5的城市依次为北京、深圳、上海、厦门和广州。图1展现了那五个城市房价的箱线图,从箱线图能够发现,北京均匀房价远超其他四个城市,而广州均匀房价明显低于前四个城市。此中深圳、上海和广州的房价的整体颠簸较小,而北京和厦门房价颠簸较大。

展开全文

图 1 房价均价排名前五城市房价箱线图

为了展现便利,以北京、上海、厦门和广州四个城市为例,图2展现了四个城市的每周房价均价走势图。差别城市的周均房价均匀程度存在较大差别,房价从高到低排序为:北京上海厦门广州。总体而言,在看测的47周内,上海和广州的房价走势较为平稳,北京的房价则闪现猛烈颠簸,厦门房价在第10周摆布一度超越上海,随后呈现明显下降,曲至最初一周也未能再次超越上海。

图 2 房价每周均价趋向图

为了进一步探究差别城市的房价颠簸情状,我们计算了城市的房价周增长率即本周房价比拟上周房价的改变率,图3绘造了4个城市的房价周增长率改变图。此中,北京房价继续颠簸,周增长率绝对值屡次超越5%;上海相对平稳,周增长率在-5%到5%之间浮动;厦门房价在前期颠簸很小,在最初10周呈现猛烈震荡,更大颠簸到达-8%;广州房价颠簸介于北京和上海之间,在最初10周也呈现较大水平颠簸。

图 3 房价周增长率折线图

为进一步探究房价面板数据的个别效应特征,我们以北京、上海、厦门和广州四个城市为例,以当日价格为因变量,昨日价格和前日价格别离为自变量,别离拟合四个城市以及总体的回回曲线。图4和图5别离展现了四个城市的部门数据点和响应的回回曲线。从图中能够发现,北京、上海和广州的斜率十分接近而截距差别,厦门相关于其他城市则愈加峻峭,总体回回曲线相对四个城市都愈加峻峭。从以上阐发能够发现,差别个别之间存在异量性,能够考虑摘用固定效应模子或者随机效应模子。

图 4 当日房价-昨日房价回回曲线图

图 5 当日房价-前日房价回回曲线图

4 建模阐发

在本节中我们将别离介绍混合估量模子,固定效应模子和随机效应模子,并以当日房价为因变量,昨日房价和前日房价为自变量对数据建模,比力混合估量模子、固定效应模子和随机效应模子的成果。后续还能够搜集愈加丰富的自变量如节假日、天文位置和空气量量等,探究房价的影响因素。

4.1 混合估量模子

面板数据原则静态模子是一种用于阐发面板数据的统计模子。它假设数据是由一组固定的单元构成的,并在固定的时间间隔内看察。那种模子凡是用于研究持久趋向和单元间的差别,并能够通过回回阐发等办法来估量参数。一个有 个个别和 期看测的原则静态模子能够表达为:

此中, 是p维的阐明变量, 为截距项,独立于个别 和时间 ; 为 向量,独立于个别 和时间 ; 为误差项,随 和 改变。

我们能够对所有数据拟合一般线性回回,表2展现了一般线性回回参数估量成果,所有系数均通过了显著性查验,模子的 和调整的 均为0.9968,模子截距项为44.18。成果表白昨日房价和前日房价对当日房价都有显著正向影响,掌握其他变量稳定,昨日房价每上涨1元,当日房价均匀上涨0.59元,前日房价每上涨1元,当日房价均匀上涨0.40元。

表 2 混合估量模子参数估量成果表

4.2 固定效应模子4.2.1 模子理论

模子(1)中可能存在不随时间改变但随个别改变的个别特征 , 则模子能够表达为:

现实利用中,模子(2)中的个别特征 其实不老是可测的,我们能够利用 捕获所有个别特征对因变量的效应,关于模子:

能够将 合成为 此中 ,同方差且无序列相关性。在那个合成中,所有的个别特征(包罗所有看察到的以及所有未看察到的不随时间改变的特征)都被回纳到 中,模子可表达为:

4.2.2 模子拟合

接下来我们将以仅有一个阐明变量的模子为例,介绍固定效应模子的参数估量办法,对每个 ,有

模子待估参数包罗差别个别共有的参数和每个个别特有的效应。一个天然的设法是在模子中加进代表个别的哑变量并停止回回,即虚拟变量法(LSDV):

此中,当 时, ,不然 。对模子(5)求取OLS估量量能够得到LSDV估量量。LSDV对每个看察单位都成立一个虚拟变量,假设看察单位良多,那么会使得计算量增加。此时,我们还能够利用变更办法消弭固定效应。对每个 求方程在时间上的均匀, 便得到

此中, 。对横截面方程(6)求取OLS估量量即为 组间估量量(Between estimator):

此中 。

然而,假设 与 相关, 它将是有偏误的,而假设我们认为 与 无关,则利用随机效应估量量要更好一些。组间估量量漠视了变量若何跟着时间而改变的重要信息。

因 在差别时间固定稳定,故它同时呈现在(4)和(6)中。若关于每个 ,都将 (6) 从 (4) 中减往, 我们便得到

方程(7 )中, 非看测效应 已随之消逝,能够利用混合OLS往估量。基于除时间均值变量的混合 OLS 估量量被称为 固定效应估量量或 组内估量量。

在R中,能够利用plm包中的plm函数对面板数据成立模子,设置参数model为“within”,抉择拟合模子为固定效应模子,拟合办法为Within办法。利用Within办法拟合房价数据,表3展现了参数估量成果。Within办法供给三种拟合优度,别离是组内 ,组间 和整体 。为了便于对差别模子的拟合效果停止比力,在本案例中摘用整体 做为评判固定效应的拟合优度,与一般线性模子的 计算公式一致,即

所有系数均通过了显著性查验,模子的 和调整的 均为0.9969。成果表白昨日房价和前日房价对当日房价都有显著正向影响,掌握其他变量稳定,昨日房价每上涨1元,当日房价均匀上涨0.54元,前日房价每上涨1元,当日房价均匀上涨0.35元,与一般线性模子的估量成果有差别。

表3 固定效应模子参数估量成果表

图6展现了差别城市的固定效应估量值柱状图,能够发现差别城市的个别固定效应有明显差别,此中更高的为北京,其值为7255,远超其余城市。更低的为长沙,其值为1076。

图6 差别城市的固定效应估量值柱状图

4.2.3 模子查验

我们能够通过F查验来查验能否存在个别固定效应,查验原假设为混合估量模子优于固定效应模子。在R中,能够利用函数pFtest停止查验,参数为两个模子。对前文中拟合得到的混合估量模子和固定效应模子停止查验,成果展现,F查验的p值 0.05,阐明个别固定效应确实存在,个别固定效应模子是比混合估量模子更好的抉择。

4.3 随机效应模子4.3.1 模子理论

从统一个非看测效应模子动身:

此中, 我们明白引进一个截距项, 使得我们可以假定非看测效应 有零均值而又不失一般性。利用组内估量法时, 我们的目标是要把 消往,那是因为 被认为与一个或多个 相关。但想象我们认为 与任何一个阐明变量在任何期间都无关, 那么, 利用消往 的变更招致了非有效估量量。

若假设效应 是随机的,且与误差项和阐明变量不相关,则模子为随机效应模子,模子可表达为

此中 是具有不异方差的随机变量,差别个别的 独立,均值为零且同方差,只要一个额外参数 。

4.3.2 模子拟合

在R中,仍然利用plm函数拟合随机效应模子,需要设置参数model为“random”。表4展现了参数估量成果,所有系数均通过了显著性查验,模子的R2和调整的R2均为0.9968。随机效应原则差的估量值为872.8,那表白,当昨日价格和前日价格稳定时,差别城市房价的原则差的为872.8。

表4 随机效应模子参数估量成果表

4.3.3 模子查验

为了决定利用固定效应仍是随机效应,能够利用Hausman查验。Hausman查验对随机效应与固定效应的估量量停止查验,查抄它们能否存在显著差别,从而揣度随机效应模子能否一致。在R中,能够利用函数phtest停止查验,参数为两个模子。对前文中拟合得到的固定效应模子和随机效应模子停止查验,成果展现,Hausman查验的p值 0.05,此中一个模子是纷歧致的。也就是说,未被看测到的异量性项与阐明变量之间确实存在相关性,应当利用固定效应模子。

5 总结

在本案例中,我们介绍了面板数据的定义和分类,引进了三种常见的面板数据模子即混合估量模子、固定效应模子和随机效应模子,而且介绍了响应的参数估量办法。接着,对城市房价的散布、每周房价的颠簸趋向、房价周增长率的改变趋向以及当日房价和自变量的相关关系停止了描述性阐发,发现数据中可能存在个别效应,为建模指了然标的目的。最初,对城市房价数据别离拟合混合估量模子、固定效应模子和随机效应模子,比力差别模子的效果并停止响应的假设查验。

狗熊会特殊感激为本案例供给贵重素材和为案例从头整理加工供给搀扶帮助的小伙伴:来自复旦大学的刘雯洋。

狗熊会还特殊感激为案例供给审查搀扶帮助的小伙伴:来自厦门大学的高天辰同窗。

本案例为狗熊会精品案例库收录。狗熊会精品案例库为狗熊会核心贸易产物,目前收录了超越100个案例,包罗探痛快数据阐发、回回阐发、机器进修、文天职析、时间序列阐发等模块,涉及电商、金融、餐饮等行业。狠戳阅读原文,查看狗熊会精品案例库。狗熊会精品案例库面向机构收费受权开放,有意洽商者,请加熊二微信clubear2详尽沟通。

点击此处“阅读全文”查看更多内容

控制面板

您好,欢迎到访网站!
  查看权限

最新留言