论文部分内容阅读
中国确立计划生育政策为基本国策已届30周年,7月11日将迎来第23个世界人口日。值此之际,梳理省思中国人口普查数据及相关政策尤为必要。
人口普查是最具权威的全国性统计调查,内容涵盖个人和家庭全生命周期的重要信息,目前任何抽样调查和行政登记都很难替代。对人口普查数据的深入开发利用,可以在人口发展过程不可逆的情况下挖掘长周期内的人口规律,并为医疗社保等政策研究提供基础。
人口普查数据的开发利用通常分三个步骤:第一步发布人口普查公报,内容主要是总人口等最基础信息;第二步是出版人口普查汇总资料,对一些主要数据进行公开出版宣介;第三步是继之其后的课题研究和微观数据开发研究。
人口普查原始数据的开发利用不仅仅是对最新人口普查数据的研究,也包括对历史数据的深入研究。最新技术对历史数据的挖掘分析,将为今天更深刻地认识人口事件、人口过程提供历史的踪迹。因此,人口普查数据的开发、共享愈加充分,其价值和使用价值就越有分量。
在人口普查比较发达的国家,即便是一些几十年前甚至上百年前完整的原始数据,也会不断被有效地归档保存和深入开发利用,不会由于技术的发展、制度的变迁和政权的更替而发生损毁和遗失。同时,他们注意提供大量有代表性的原始抽样数据供科学研究者长期深入研究,如美国提供1%或5%的原始抽样数据,法国提供4%或5%的原始抽样数据,巴西、埃及、墨西哥提供5%甚至10%的原始抽样数据。特别是最近30年来,越来越多的国家提供原始抽样数据以便让开发研究更加深入。
从数据的开发研究角度而言,我国六次人口普查的数据公开状态还有欠缺。
限于当时的条件,1953、1964年两次人口普查只发布了简单的汇总数据,原始调查数据没有录入计算机,也没有进行事后补救。
1982年第三次人口普查,是我国人口普查历史上公认的数据质量最高的一次,开创了许多中国第一。如不仅发布了普查公报,全国和分省市县人口普查汇总数据资料,而且还第一次对课题研究在发布汇总数据的同时,提供地址代码到县一级1%原始抽样数据。
1990年第四次人口普查与1982年一样,发布了普查公报,全国和分省市县人口普查汇总数据资料,同步提供给课题研究的1%原始抽样数据,地址代码也是到县一级。
2000年第五次人口普查与1982年和1990年明显不同,虽然也发布了人口普查公报,全国和分省市县人口普查汇总数据资料,但提供给课题研究的原始抽样数据下降到0.95‰,地址代码也只提供到地区一级。
迄今为止,2010年第六次人口普查数据的开发模式与1982年以来历次均有不同。尽管也发布了普查公报,包括全国和分省汇总数据资料,但在课题研究已全面展开情况下,到目前为止还没有提供原始抽样数据,仅对部分课题提供数据汇总服务。这实质上是对普查信息资源的一种浪费。
实际上,使用汇总数据进行人口统计研究,仅仅是研究的初级阶段。汇总数据简单、容易理解,缺点是只提供了数据资源的非常表层信息。由于人口普查至少有几十项调查内容,靠汇总数据或几千页的数据汇总资料,很难做到充分开发原始普查海量数据的可能用途。
从技术层面上看,现代科技可以实现人口普查数据在不同层次上进行分析,并对应有专门的分析方法和分析技术。但只有原始数据资源才能实现深入细致的分析,任何二手或汇总数据都不可能代替对原始数据的直接研究。
当前,中国面临的人口形势之复杂前所未有。“十二五”时期人口发展进入关键转折期,更需要科研来辅助科学发展和决策。深入研究中国人口变动的特点和规律,不仅需对当前最新数据资源进行深度开发,而且需结合历史数据与当前最新数据,全面挖掘信息资源的潜在价值,避免在人口问题上犯重大错误。
我们期待对中国第六次人口普查数据进行合理的进一步公开深入开发,也希望对过去人口普查资料进行全面研究。研究的基础不应仅限于1%原始抽样数据,而应在若干年后,扩展到1982年以来各次100%的人口普查原始数据。
(作者为中国社科院人口与劳动经济研究所研究员)
人口普查是最具权威的全国性统计调查,内容涵盖个人和家庭全生命周期的重要信息,目前任何抽样调查和行政登记都很难替代。对人口普查数据的深入开发利用,可以在人口发展过程不可逆的情况下挖掘长周期内的人口规律,并为医疗社保等政策研究提供基础。
人口普查数据的开发利用通常分三个步骤:第一步发布人口普查公报,内容主要是总人口等最基础信息;第二步是出版人口普查汇总资料,对一些主要数据进行公开出版宣介;第三步是继之其后的课题研究和微观数据开发研究。
人口普查原始数据的开发利用不仅仅是对最新人口普查数据的研究,也包括对历史数据的深入研究。最新技术对历史数据的挖掘分析,将为今天更深刻地认识人口事件、人口过程提供历史的踪迹。因此,人口普查数据的开发、共享愈加充分,其价值和使用价值就越有分量。
在人口普查比较发达的国家,即便是一些几十年前甚至上百年前完整的原始数据,也会不断被有效地归档保存和深入开发利用,不会由于技术的发展、制度的变迁和政权的更替而发生损毁和遗失。同时,他们注意提供大量有代表性的原始抽样数据供科学研究者长期深入研究,如美国提供1%或5%的原始抽样数据,法国提供4%或5%的原始抽样数据,巴西、埃及、墨西哥提供5%甚至10%的原始抽样数据。特别是最近30年来,越来越多的国家提供原始抽样数据以便让开发研究更加深入。
从数据的开发研究角度而言,我国六次人口普查的数据公开状态还有欠缺。
限于当时的条件,1953、1964年两次人口普查只发布了简单的汇总数据,原始调查数据没有录入计算机,也没有进行事后补救。
1982年第三次人口普查,是我国人口普查历史上公认的数据质量最高的一次,开创了许多中国第一。如不仅发布了普查公报,全国和分省市县人口普查汇总数据资料,而且还第一次对课题研究在发布汇总数据的同时,提供地址代码到县一级1%原始抽样数据。
1990年第四次人口普查与1982年一样,发布了普查公报,全国和分省市县人口普查汇总数据资料,同步提供给课题研究的1%原始抽样数据,地址代码也是到县一级。
2000年第五次人口普查与1982年和1990年明显不同,虽然也发布了人口普查公报,全国和分省市县人口普查汇总数据资料,但提供给课题研究的原始抽样数据下降到0.95‰,地址代码也只提供到地区一级。
迄今为止,2010年第六次人口普查数据的开发模式与1982年以来历次均有不同。尽管也发布了普查公报,包括全国和分省汇总数据资料,但在课题研究已全面展开情况下,到目前为止还没有提供原始抽样数据,仅对部分课题提供数据汇总服务。这实质上是对普查信息资源的一种浪费。
实际上,使用汇总数据进行人口统计研究,仅仅是研究的初级阶段。汇总数据简单、容易理解,缺点是只提供了数据资源的非常表层信息。由于人口普查至少有几十项调查内容,靠汇总数据或几千页的数据汇总资料,很难做到充分开发原始普查海量数据的可能用途。
从技术层面上看,现代科技可以实现人口普查数据在不同层次上进行分析,并对应有专门的分析方法和分析技术。但只有原始数据资源才能实现深入细致的分析,任何二手或汇总数据都不可能代替对原始数据的直接研究。
当前,中国面临的人口形势之复杂前所未有。“十二五”时期人口发展进入关键转折期,更需要科研来辅助科学发展和决策。深入研究中国人口变动的特点和规律,不仅需对当前最新数据资源进行深度开发,而且需结合历史数据与当前最新数据,全面挖掘信息资源的潜在价值,避免在人口问题上犯重大错误。
我们期待对中国第六次人口普查数据进行合理的进一步公开深入开发,也希望对过去人口普查资料进行全面研究。研究的基础不应仅限于1%原始抽样数据,而应在若干年后,扩展到1982年以来各次100%的人口普查原始数据。
(作者为中国社科院人口与劳动经济研究所研究员)