论文部分内容阅读
本次研究在对确切推断有关文献、算法的全面收集、整理和分析基础上,指出了目前确切推断理论与算法方面存在的主要问题,其一是确切检验方法体系及相关软件尚不完整,主要表现在大多数专业统计软件中提供的确切检验方法基本局限于列联表资料的假设检验;其二是算法和程序实现手段单一,主要表现在算法选择问题上,大多数专业统计软件单纯选择网络算法。由此,对应用于其它数据资料和模型的确切检验方法以及效率更高、更具特色的算法进行研究,具有重大的意义。本次研究即在这一背景下,结合医学领域数据特点,对列联表条件确切检验、Hardy-Weinberg平衡条件确切检验和列联表对数线性模型拟合优度确切检验的有关假设检验方法进行了较为全面的分析,并系统地提出了相应的基于递归技术和数据库技术的完全排列算法。在列联表条件确切检验方面,分别对2×2、2×c、r×c列联表资料,及s ( 2×2)、s ( 2×c)、s ( r×c)分层列联表资料的数据结构特点、适用检验方法、参照系及排列表确切概率等内容进行了系统的分析与讨论。对于2×2列联表,不同的资料收集方式,即完全随机设计和配对设计,对应了两类不同的检验方法,由于其确切检验参照系不同,对应的完全排列算法也不相同;对于2×c列联表,尽管列分类变量可为有序或无序变量,相应的假设检验方法也比较多,但其确切检验参照系是相同的,从而仅需设计一种完全排列算法,通过构造不同的检验统计量,即可实现不同的确切检验; r×c列联表的情形与2 ×c列联表类似,不同的资料收集方式和不同的分类变量属性,可分别对应不同的假设检验方法,但其确切检验参照系是相同的,从而通过构造不同的检验统计量,使用共同的完全排列算法,即可实现不同的确切检验;对于各种分层列联表资料,一般来说,首先应进行各层之间的齐性检验,如满足齐性要求,可进一步就行列分类变量之间关联关系进行相应的假设检验,此两类检验分别对应了两种不同的完全排列算法,齐性检验对应于三维列联表对数线性模型齐性关联模型的拟合优度确切检验,而关联关系检验对应于三维列联表对数线性模型条件独立模型的拟合优度确切检验。在算法的构造与实现方面,本研究从一维列联表