论文部分内容阅读
近一二十年以来,上海各类市/区重点高中的高一新生中来自于民办初中的学生越来越多,能够进入一个好的民办初中,也就意味着离那些重点高中、顶级高校又近了一步;所以,虽然很多民办初中的学费不菲,但也阻挡不了很多学生的报考热情。根据各类文献可知,虽然有很多专家学者对中国非义务制教育阶段的高校学费或者幼儿园学费影响因素采用多元线性回归和BP神经网络等做了一定的分析研究;然而纵观国内外学术界,大家对中国民办初中的学费影响因素进行专门研究的基本上是一片空白。鉴于上海是中国经济发展的龙头城市,民办学校在上海的发展,相对来说已经有了一个很成熟的基础,基于数据可得性、系统性的原则,作者采用文献研究法、归纳总结分析法、调查研究法以及实证分析法,经过三轮筛选,以上海各主要区县的92家民办初中为最终研究对象,将2018年预初年级每学期的学费作为因变量;把每所学校的注册资本、平均每班人数、校园环境、硬件设施、校内活动、升学成绩、课程设置、2017年该区义务教育财政拨款、2017年预初年级每学期的学费等一共11个因素作为自变量,分别采用随机森林和Lasso方法进行模型构建,然后基于两种算法的比较,将他们共同都筛选出来的三个特征变量进行Lasso回归,最后通过模型结果得出结论:主要影响上海民办初中学费的因素,一共有3个,包括了上一年的每学期学费,硬件设施分值以及平均每班人数。假设其他特征变量的数值不变,2017年每学期学费每增加1%,平均来看,2018年每学期学费就会随之增加0.84%;假设其他特征变量的数值不变,硬件设施的分值每增加1分,2018年每学期学费的对数值平均来说就会随之增加0.065个单位;假设其他特征变量的数值不变,平均每班人数每增加1个人,2018年每学期学费的对数值平均就会随之减少0.002个单位。和前人关于学费研究的文献相比,本文不仅在研究对象上有所创新,第一次关注义务制教育阶段的民办初中;而且对于变量的选择也有所创新,不仅包括了前人所考虑的很多宏观层面的比如GDP、政府财政拨款等因素,同时也选取了很多微观层面具体到每所学校的数据,比如注册资本、招生数量等等;另外对于研究方法,本文也有非常好的创新,作者第一次尝试了将现在机器学习中非常热门的随机森林和Lasso算法引入学费的实证研究中,从模型结果来看,这两种机器学习的方法在学费研究方面具有可行性。一个合理的学费水平可以让更多的人享受到国家的优质教育,作为填补理论界对于义务制教育阶段的民办初中研究的一个空白,本文不仅能够为义务制教育阶段的民办初中学费定价的分析框架的建立提供一定的参考借鉴作用;而且可以在一定程度上丰富价格研究和学费定价研究的内容和案例库;另外,本文对民办初中学费定价的变量选择和建模方法,也为这方面的研究提供了一个完全崭新的视角。同时,本文的定价模型,也为有关政府以及相关学校进一步完善民办初中学费定价制度提供了实用性很强的参考建议。