论文部分内容阅读
本研究是关于频数资料分布及其在生物医学中应用的研究。 现在绝大多数关于频数资料分布的研究都是基于正态分布的,而对其他类型的分布研究得比较少,实际上频数分布在许多情况下并非呈现正态分布,分布的形态丰富多彩,很多资料都是呈现单峰分布,本研究就是利用数学上常见的八种连续型变量的分布类型去拟合单峰频数资料。我们利用SAS编程的手段,利用数学上的正态分布、对数正态分布、威布尔分布、伽玛分布、贝塔分布、哥西分布、若吉斯蒂克分布、拉普拉斯分布这八种连续型变量的统计分布函数去拟合实际的频数资料。利用SAS的SQL和MACRO等语句编写了大量的程序,以拟合优度检验结果为标准,不断地变换八种分布的参数变化范围,通过宏程序的不断循环,逐步缩小参数的范围,最后达到预先设定的标准,从而可以发现八种分布中哪几种分布能比较好地拟合给定的实际频数资料,我们再根据拟合优度检验的结果判断出哪种分布拟合实际频数资料最好,最终获得该频数资料的最佳的理论分布函数形式。 频数分布研究在生物医学上的应用很广泛,本研究主要是针对两个方面,一个是估计正常值范围问题,另一个是描述频数分布问题。从理论上说明了现在常用的确定正常值范围的方法存在一定的问题,尤其证明了大家使用得比较多的百分位数法存在的缺陷,说明了曲线拟合法的优点,而在频数分布拟合完成之后,就已经找到了频数分布资料的理论分布曲线,有了理论分布函数,我们利用分布函数计算正常值范围就比较容易,也比较准确。分布的描述是直观了解频数资料变化规律需要做的事,当定量资料的分布属于正态分布时,可以利用算术平均数和标准差来反映频数分布的集中趋势和离散程度;如果频数资料为非正态分布时,一般用中位数和四分位数间距来反映频数分布的集中趋势和离散程度。但是如果知道频数分布资料的理论分布之后,就可以利用该分布的一些特征数来反映频数分布资料的集中趋势和离散程度,八种连续型变量的分布中除了哥西分布在数学上不存在数学期望值和方差之外,其他的都可以通过计算该理论分布的数学期望值和方差,用来反映集中趋势和离散程度。本研究针对上面两个应用编写了相关的程序,可以通过改变宏参数直接给出该分布的正常值的范围、数学期望值