论文部分内容阅读
2018 年 3 月 20 日挪威科学与文学院宣布,将该年度阿贝尔奖(挪威设立的数学大奖)授予美籍加拿大数学家罗伯特·朗兰兹(Robert Langlands),以表彰他在数学领域所作出的终身成就.他提出的最终以他名字命名的数学理论“朗兰兹纲领”(Langlands program),通过与素数的共同联系将几何学、代数学和分析学等概念结合起来,在数学的众多分支领域之间架起了“桥梁”.
当时挪威国王为朗兰兹颁奖,致敬这项最新的科研成果.素数,可以说是数学领域中最庞大、最古老的数集,数学家们历经 2300 年的努力一直在不断探索它的奥秘.那么是什么吸引无数杰出的数学家,数千年来前仆后继地投身于素数研究中?
一、寻找素数的历程
为了研究素数,数学家们利用素数筛选算法,将正整数进行筛选,并将仅剩的素数保留下来.在 19 世纪,用试除法来筛选获得了数百万以内的素数列表.当然,现代计算机可以在不到一秒钟的时间内找出数十亿以内的素数,但所用筛法的核心思想 2000 年来从未改变.
公元前 300 年,亚历山大里亚的数学家欧几里得描述到:“素数是只能用 1 来计数的数.”这意味着素数不能被除了 1 以外的任何小于自身的数整除.并且为了保证整数的唯一分解,数学家们并不把 1 看作素数.此外,欧几里得还证明了素数的个数是无限的、没有穷尽.
公元前 200 左右,古希腊数学家埃拉托斯特尼(Eratosthenes)提出了素数的快速筛选法,这是一种简单且古老的筛法,用来找出一定范围内所有的素数.
埃拉托斯特尼素数筛法的思路是这样的:首先,留下 2 ,把 2 的倍数都划掉;2 后面第一个没划去的数是 3 ,留下 3 ,把 3 的倍数都划掉;然后留下 5 ,把 5 的倍数都划掉;再留下 7 ,把 7 的倍数都划掉.如此这般,将最小的四个质数——2,3,5,7——的倍数依次筛掉.此时,下一个未被筛掉 11 的平方已经大于 100,所以停止.这样在 2 到 100 之间的整数只执行这 4 次筛选,最终只留下了素数集合.
从 1 ~ 100 之间的数字中筛除 2, 3, 5 和 7 的倍数,留下就是素数再通过8次筛选,可以分离出 400 以内的全部素数.通过 168 次筛选,可以分离出 100 万以内的全部素数.这便是埃氏筛法的强大之处.
为素数制表的早期代表人物是英国数学家约翰·佩尔(John Pell),他致力于将有用的数字制成表格.其研究动力来源于对古希腊数学家丟番图(Diophantos) 所提出的古老算术问题的研究热情,还来自于对数学真理进行系统整合的个人追求.由于他的不懈努力,在 18 世纪早期 10 万以内的素数得以广泛传播.截止 1800 年,各种独立的研究项目列出了百万以内的全部素数.
为了将这项繁琐的筛选工作自动化,德国数学家卡尔·弗里德里希·兴登堡 (Carl Friedrich Hindenburg)使用一种可调节的滑块,一次性排除整张纸上的所有倍数.另一种技术含量低却高效的方法是使用模板来定位特定素数的倍数.到19世纪中叶,奥地利数学家雅各布·库利克(Jacob Kulik)开展了一个项目:找出 1 亿以内的所有素数.但直至库利克逝世,这些工作还没有完成,不过已经找出来的素数填满了4212页表格.
如果不是"数学王子"高斯(Carl Friedrich Gauss)决定对素数自身进行分析整理,这样一套“大数据”的结果可能也仅限于用作素数参考表.
17 世纪,对数表的诞生大大推动了天文、航海的蓬勃发展.一本作为给高斯生日礼物的对数工具书后附录了一张300万以内的素数表,这个在旁人看起来无实际用途的表格却激发了他的强烈兴趣.他开始着手进行数据分析统计工作.
他每次以 1000 个数为一组,分别计数这一范围内素数的个数.先计数 1000 以内素数的个数,接着是 1001 到 2000 之间,然后是 2001 到 3000 之间,以此类推,高斯开始探索这个在旁人看来毫无乐趣的素数列表.
高斯发现,隨着数值增大,素数出现的频率会逐渐降低,遵循“反对数”定律.虽然高斯的素数分布定理并没有算出素数数目的精确值,但他给出了一个非常好的近似值.例如,根据素数定理预测在 1000000 到 1001000 之间存在 72 个素数,而正确结果是 75,误差在 4% 左右.由此,他提出一个猜想: π(x)≈x/lnx,其中 π(x)为不大于 x 的素数个数.也就说当 x 趋近无限时,有下式成立:.
而在这个猜想提出一个世纪之后,这个称之为素数定理(prime number theorem)才得到了证明.
随着素数计数范围越来越大,估计值与真实值的相对误差将趋近于 0.悬赏百万奖金、位列当今数学界七大难题之一的黎曼猜想(Riemann hypothesis),也描述了高斯定理估算的精确程度.
二、对素数末位数字的分析
素数定理和黎曼猜想已经得到了人们的广泛关注,但它们在早期,都是从枯燥的素数表数据分析开始的.现在,我们获取数据的方式都来自于计算机程序的运算,不再需要手算筛选,但数学家们仍在寻找研究素数的新模式.除了 2 和 5 之外,所有素数都以 1,3,7 或 9 结尾.19 世纪,人们发现这几个末位数字在素数中存在相同的出现频率.换句话说,如果你计数到 100 万,25%的素数末位为 1,25% 末位为 3,25% 末位为 7,25% 末位为 9.
除了 2 和 5 之外,所有素数都以 1,3,7 或 9 结尾.19 世纪,人们发现这几个末位数字在素数中存在相同的出现频率.末位为1,3,7,9的素数出现的频率
几年前,斯坦福大学的数论学家莱姆克·奥利弗(Lemke Oliver) 和坎南·桑德拉贾恩(Kannan Soundararajan)在实验中观察素数及下一个相邻素数的末位数字规律,意外发现了一个问题.例如,23 之后的素数是 29,它们的末位数字是前 3 后 9.那么,相邻两个素数的末位数字,是前 3 后 9 常见,还是前 3 后 7 常见呢?
数论学家们预计这些数据会存在一些差异,但实验结果远超出预期.将相邻素数末位数字对按照间距不同进行分组,譬如,23 与 29 间距为 6.结果发现,像 23 和 29 这样前 3 后 9 的素数对的占比,超过先 7 后 3 的素数对占比,尽管这两种相邻素数对的间距都6.虽然数学家们很快给出了一种较为可信的解释,但是,当研究连续素数时,大部分的数学家还局限在分析数据进而寻找合理解释的阶段,距离揭示真相的唯一标准——数学上的证明,似乎还需要很长一段路要走.
当时挪威国王为朗兰兹颁奖,致敬这项最新的科研成果.素数,可以说是数学领域中最庞大、最古老的数集,数学家们历经 2300 年的努力一直在不断探索它的奥秘.那么是什么吸引无数杰出的数学家,数千年来前仆后继地投身于素数研究中?
一、寻找素数的历程
为了研究素数,数学家们利用素数筛选算法,将正整数进行筛选,并将仅剩的素数保留下来.在 19 世纪,用试除法来筛选获得了数百万以内的素数列表.当然,现代计算机可以在不到一秒钟的时间内找出数十亿以内的素数,但所用筛法的核心思想 2000 年来从未改变.
公元前 300 年,亚历山大里亚的数学家欧几里得描述到:“素数是只能用 1 来计数的数.”这意味着素数不能被除了 1 以外的任何小于自身的数整除.并且为了保证整数的唯一分解,数学家们并不把 1 看作素数.此外,欧几里得还证明了素数的个数是无限的、没有穷尽.
公元前 200 左右,古希腊数学家埃拉托斯特尼(Eratosthenes)提出了素数的快速筛选法,这是一种简单且古老的筛法,用来找出一定范围内所有的素数.
埃拉托斯特尼素数筛法的思路是这样的:首先,留下 2 ,把 2 的倍数都划掉;2 后面第一个没划去的数是 3 ,留下 3 ,把 3 的倍数都划掉;然后留下 5 ,把 5 的倍数都划掉;再留下 7 ,把 7 的倍数都划掉.如此这般,将最小的四个质数——2,3,5,7——的倍数依次筛掉.此时,下一个未被筛掉 11 的平方已经大于 100,所以停止.这样在 2 到 100 之间的整数只执行这 4 次筛选,最终只留下了素数集合.
从 1 ~ 100 之间的数字中筛除 2, 3, 5 和 7 的倍数,留下就是素数再通过8次筛选,可以分离出 400 以内的全部素数.通过 168 次筛选,可以分离出 100 万以内的全部素数.这便是埃氏筛法的强大之处.
为素数制表的早期代表人物是英国数学家约翰·佩尔(John Pell),他致力于将有用的数字制成表格.其研究动力来源于对古希腊数学家丟番图(Diophantos) 所提出的古老算术问题的研究热情,还来自于对数学真理进行系统整合的个人追求.由于他的不懈努力,在 18 世纪早期 10 万以内的素数得以广泛传播.截止 1800 年,各种独立的研究项目列出了百万以内的全部素数.
为了将这项繁琐的筛选工作自动化,德国数学家卡尔·弗里德里希·兴登堡 (Carl Friedrich Hindenburg)使用一种可调节的滑块,一次性排除整张纸上的所有倍数.另一种技术含量低却高效的方法是使用模板来定位特定素数的倍数.到19世纪中叶,奥地利数学家雅各布·库利克(Jacob Kulik)开展了一个项目:找出 1 亿以内的所有素数.但直至库利克逝世,这些工作还没有完成,不过已经找出来的素数填满了4212页表格.
如果不是"数学王子"高斯(Carl Friedrich Gauss)决定对素数自身进行分析整理,这样一套“大数据”的结果可能也仅限于用作素数参考表.
17 世纪,对数表的诞生大大推动了天文、航海的蓬勃发展.一本作为给高斯生日礼物的对数工具书后附录了一张300万以内的素数表,这个在旁人看起来无实际用途的表格却激发了他的强烈兴趣.他开始着手进行数据分析统计工作.
他每次以 1000 个数为一组,分别计数这一范围内素数的个数.先计数 1000 以内素数的个数,接着是 1001 到 2000 之间,然后是 2001 到 3000 之间,以此类推,高斯开始探索这个在旁人看来毫无乐趣的素数列表.
高斯发现,隨着数值增大,素数出现的频率会逐渐降低,遵循“反对数”定律.虽然高斯的素数分布定理并没有算出素数数目的精确值,但他给出了一个非常好的近似值.例如,根据素数定理预测在 1000000 到 1001000 之间存在 72 个素数,而正确结果是 75,误差在 4% 左右.由此,他提出一个猜想: π(x)≈x/lnx,其中 π(x)为不大于 x 的素数个数.也就说当 x 趋近无限时,有下式成立:.
而在这个猜想提出一个世纪之后,这个称之为素数定理(prime number theorem)才得到了证明.
随着素数计数范围越来越大,估计值与真实值的相对误差将趋近于 0.悬赏百万奖金、位列当今数学界七大难题之一的黎曼猜想(Riemann hypothesis),也描述了高斯定理估算的精确程度.
二、对素数末位数字的分析
素数定理和黎曼猜想已经得到了人们的广泛关注,但它们在早期,都是从枯燥的素数表数据分析开始的.现在,我们获取数据的方式都来自于计算机程序的运算,不再需要手算筛选,但数学家们仍在寻找研究素数的新模式.除了 2 和 5 之外,所有素数都以 1,3,7 或 9 结尾.19 世纪,人们发现这几个末位数字在素数中存在相同的出现频率.换句话说,如果你计数到 100 万,25%的素数末位为 1,25% 末位为 3,25% 末位为 7,25% 末位为 9.
除了 2 和 5 之外,所有素数都以 1,3,7 或 9 结尾.19 世纪,人们发现这几个末位数字在素数中存在相同的出现频率.末位为1,3,7,9的素数出现的频率
几年前,斯坦福大学的数论学家莱姆克·奥利弗(Lemke Oliver) 和坎南·桑德拉贾恩(Kannan Soundararajan)在实验中观察素数及下一个相邻素数的末位数字规律,意外发现了一个问题.例如,23 之后的素数是 29,它们的末位数字是前 3 后 9.那么,相邻两个素数的末位数字,是前 3 后 9 常见,还是前 3 后 7 常见呢?
数论学家们预计这些数据会存在一些差异,但实验结果远超出预期.将相邻素数末位数字对按照间距不同进行分组,譬如,23 与 29 间距为 6.结果发现,像 23 和 29 这样前 3 后 9 的素数对的占比,超过先 7 后 3 的素数对占比,尽管这两种相邻素数对的间距都6.虽然数学家们很快给出了一种较为可信的解释,但是,当研究连续素数时,大部分的数学家还局限在分析数据进而寻找合理解释的阶段,距离揭示真相的唯一标准——数学上的证明,似乎还需要很长一段路要走.