家庭背景的教育收益率差异(2)

二、文献综述 (一)教育收益率现状 (二)教育收益率长期趋势 (三)教育收益率群体间差异 三、计量模型 式(1)为明瑟工资方程的基本形式: LnWi=0+1Ed


二、 文献综述

(一) 教育收益率现状

(二) 教育收益率长期趋势

(三) 教育收益率群体间差异

三、 计量模型

式(1)为明瑟工资方程的基本形式:

LnWi=0+1Edui+2Expi+3Exp2i+i                         (1)

该方程会高估教育收益率,因此,我们需要在此基础上对其他影响工资收入的变量,如性别、单位所有制、地区等个人特征,以及家庭背景加以控制。为了研究家庭背景对教育收益率的影响,我们在回归方程中加入家庭背景与受教育水平的交叉项来考察。

本文在明瑟工资方程的基础上,建立经典线性回归模型来研究教育收益率的家庭背景差异,模型的设定如下:

LnWi=0+1Edui+2Expi+3Exp2i+4Xi+5Yi+6Yi*Edui+i           (2)

其中,LnWi表示个体i收入取对数,Edui表示个体i的受教育水平,Expi表示个体的工作年限,Exp2i表示个体工作年限对收入的影响为非线性,Xi表示影响个体i收入的其他个人因素,Yi表示家庭背景,i表示随机干扰项。

当劳动力市场完全竞争时,个体的教育收益率与单位所有制、地区、行业无关,即在劳动力市场上统一。但现实中,劳动力市场存在分割,教育的直接效应和间接效应不完全相同。因此需要在估计方程中添加控制变量,否则将高估教育收益率。另外,家庭背景除了直接影响个体收入,还会通过影响个体的受教育水平间接影响个体收入,因此需要在估计方程中添加家庭背景与受教育水平的交叉项。

四、 数据与变量

(一) 数据及样本

本文使用中国家庭收入项目调查(CHIP)数据,该调查由国家统计局农调总队和中国社会科学院经济研究所共同开展。CHIP调查于1988年、1995年、2002年、2013年,对全国省份的城镇及农村进行数据收集。调查主要包括与户主关系、性别、年龄、受教育年限、所有制、总收入、是否党员、户口等个人信息,以及家庭总收入、家庭人口数、居住面积等家庭信息。

本文选取了CHIP2013年的调查数据作为研究对象,原始样本量为58952个。为了得到有效样本,对原始样本进行了筛选,具体筛选步骤为:首先,将城镇样本与农村样本进行合并;其次,根据法定工作年龄及退休年龄,在劳动力中剔除年龄小于16或年龄大于60的样本;考虑到健康状况对收入的影响,剔除身体存在严重健康状况的样本;再者,剔除总收入缺失的样本;最后,由于对子女的收入、父母的收入、受教育年限等数据的需求,剔除家庭内部无子女的样本并剔除父母样本,只保留身为子女的样本作为研究对象。最终获得的样本量为6963个。