论文部分内容阅读
小文件引起的大尴尬
相信大家都有过类似的经历:复制粘贴一个内含无数小文件的文件夹(如离线地图、游戏数据包等)时的速度极慢,但如果先将该文件夹压缩成一个压缩包再复制粘贴,你会发现速度又变得极快。很遗憾,我们在安装游戏时会产生大量小文件、数据备份时会遭遇大量小文件……日常应用中最最普遍的系统瓶颈(卡顿)几乎都是由无数个小文件引起的。因此,如何可以提高硬盘读写小文件的能力,无疑就是摆脱存储瓶颈的关键所在。
因量变而引起质变
理论上,SSD的4K性能将严重影响到小文件的读写性能。为了证明这一理论,笔者进行了3次“奇葩”的测试:
测试说明:为了突出4K性能对性能的实际影响,本次测试使用了东芝Q-PRO系列的128GB和256GB两款SSD硬盘(图1)。其中,256GB版的4K性能要优于128GB版(图2)。因此,我们可以将128GB SSD视为未4K对齐时的状态,而256GB SSD则可模拟已4K对齐时的状态。
第1次:分别在两块SSD中拷贝单文件大于1GB容量的电影,共22.4GB,合24个小文件;
第2次:分别在两块SSD中拷贝从KB到MB大小不等的图片,共24.8GB,合21745个小文件;
第3次:分别在两块SSD中拷贝单文件仅有23字节的txt文档,共25MB,合100万个小文件。
在第1次测试中,两块SSD的拷贝速度极为接近,可见大文件的读写对4K性能并不敏感。在第2次测试中,两块SSD的拷贝速度就体现出明显差距了,其中128GB版的SSD速度会从最初的250MB/s左右逐渐降到200MB/s左右(图3),而256GB版的SSD速度却始终稳定在290MB/s左右(图4),效率要比前者提高32%左右(见表)。
而最令人惊讶的就是第三次测试的结果。别看100万个txt小文件只有25MB大小,但它却占用了3.72GB的磁盘空间!此时,向128G SSD里拷贝这100万个小文件时的速度竟然只有56.9KB/s(图5),而256GB SSD的拷贝速度也仅有80.3KB/s(图6)。你没有看错,但是就是KB/s而不是MB/s!
看到这里,相信你已经了解海量小文件的威力了,而4K性能的强弱将直接影响到对大量小文件读写时的效率。虽然说测试3的环境太过极端,但测试2的情景相信大家都会经常面对吧?
先对齐还是后对齐
很多SSD用户都会遇到类似的尴尬:新买SSD装完系统后才发现忘记4K对齐了。此时我们只剩下两种选择:
1.为了避免已有数据影响性能而重新格式化硬盘再进行4K对齐;
2.在不影响已有数据的前提下使用软件进行后续4K对齐的补救(图7)。
那么,这两种先后的4K对齐顺序对SSD的4K性能有无影响呢?答案是没有影响。无论SSD内部有无数据,只要进行了4K对齐即可发挥出100%的性能。因此,我们大可不必担心网上盛传的类似“SSD必须在干净时4K对齐效果最好”的传言了。
相信大家都有过类似的经历:复制粘贴一个内含无数小文件的文件夹(如离线地图、游戏数据包等)时的速度极慢,但如果先将该文件夹压缩成一个压缩包再复制粘贴,你会发现速度又变得极快。很遗憾,我们在安装游戏时会产生大量小文件、数据备份时会遭遇大量小文件……日常应用中最最普遍的系统瓶颈(卡顿)几乎都是由无数个小文件引起的。因此,如何可以提高硬盘读写小文件的能力,无疑就是摆脱存储瓶颈的关键所在。
因量变而引起质变
理论上,SSD的4K性能将严重影响到小文件的读写性能。为了证明这一理论,笔者进行了3次“奇葩”的测试:
测试说明:为了突出4K性能对性能的实际影响,本次测试使用了东芝Q-PRO系列的128GB和256GB两款SSD硬盘(图1)。其中,256GB版的4K性能要优于128GB版(图2)。因此,我们可以将128GB SSD视为未4K对齐时的状态,而256GB SSD则可模拟已4K对齐时的状态。
第1次:分别在两块SSD中拷贝单文件大于1GB容量的电影,共22.4GB,合24个小文件;
第2次:分别在两块SSD中拷贝从KB到MB大小不等的图片,共24.8GB,合21745个小文件;
第3次:分别在两块SSD中拷贝单文件仅有23字节的txt文档,共25MB,合100万个小文件。
在第1次测试中,两块SSD的拷贝速度极为接近,可见大文件的读写对4K性能并不敏感。在第2次测试中,两块SSD的拷贝速度就体现出明显差距了,其中128GB版的SSD速度会从最初的250MB/s左右逐渐降到200MB/s左右(图3),而256GB版的SSD速度却始终稳定在290MB/s左右(图4),效率要比前者提高32%左右(见表)。
而最令人惊讶的就是第三次测试的结果。别看100万个txt小文件只有25MB大小,但它却占用了3.72GB的磁盘空间!此时,向128G SSD里拷贝这100万个小文件时的速度竟然只有56.9KB/s(图5),而256GB SSD的拷贝速度也仅有80.3KB/s(图6)。你没有看错,但是就是KB/s而不是MB/s!
看到这里,相信你已经了解海量小文件的威力了,而4K性能的强弱将直接影响到对大量小文件读写时的效率。虽然说测试3的环境太过极端,但测试2的情景相信大家都会经常面对吧?
先对齐还是后对齐
很多SSD用户都会遇到类似的尴尬:新买SSD装完系统后才发现忘记4K对齐了。此时我们只剩下两种选择:
1.为了避免已有数据影响性能而重新格式化硬盘再进行4K对齐;
2.在不影响已有数据的前提下使用软件进行后续4K对齐的补救(图7)。
那么,这两种先后的4K对齐顺序对SSD的4K性能有无影响呢?答案是没有影响。无论SSD内部有无数据,只要进行了4K对齐即可发挥出100%的性能。因此,我们大可不必担心网上盛传的类似“SSD必须在干净时4K对齐效果最好”的传言了。