论文部分内容阅读
CT图像是不同灰度的像素按矩阵排列构成,这些像素反映了相应体素的X射线吸收系数。CT图像在不破坏物体的前提下可以获取其内部信息的优点,使得CT扫描成像成为医学、地学等学科不可或缺的研究手段。由于CT图像数据量较大,造成传统CT图像的处理速度慢,甚至难以进行。目前,Hadoop已成为业内公认的应对大数据冲击的分布式计算平台,具有高效性及高容错性、高可靠性、高扩展性等优势。利用Hadoop的分布高效特性,解决CT图像处理中的速度慢、内存需求高等问题具有针对性,为实现上述研究本文做出了如下探索:使用Hadoop平台研究了提高CT图像识别度的若干方法,并利用Hadoop分布式计算平台的计算优势研究更高效率的并行空间统计。详细介绍了Hadoop平台及其核心组件HDFS和MapReduce,并对数据集处理过程中HDFS和MapReduce的工作流程和方法进行了详细阐述。此外,还介绍了Hadoop集群的搭建方法,研究了几种提高CT图像识别度的图像增强方式,并针对本文采用的实验源数据实践了两种更为适合该类型CT图像的图像去噪和图像增强方法。最后,对1208张CT图片包含的煤岩体裂隙、岩石等信息进行了并行空间统计,进而从CT图像中挖掘更为详细的定量信息。