提出了正整数密度分布概念并进行了初步研究,将其应用于埃氏筛法的“筛余截首”步骤作用分析,得出了素数密度
崔蕴华
95899部队,北京
收稿日期:2018年4月17日;录用日期:2018年5月1日;发布日期:2018年5月10日
提出了正整数密度分布概念并进行了初步研究,将其应用于埃氏筛法的“筛余截首”步骤作用分析,得出了素数密度 0 . 9 9 9 0 3 5 9 1 ⋯ l n n < D < 1 . 0 0 4 8 9 4 2 6 ⋯ l n n 的结论。尚未完成素数密度 D = 1 l n n 的证明,但提出了完成证明的思路和逼近结论的方法,期待认同这一思路的数学家继续研究并提出权威论证。素数密度是素数分布和所有素数猜想的基础,大多数素数问题可据此解决。
关键词 :正整数,素数密度,素数分布,埃氏筛法,渐近级数,素数定理,孪生素数猜想,哥德巴赫猜想
Copyright © 2018 by author and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
为研究素数密度和素数分布,作者曾在中文杂志《前沿科学》2016年第2期发表论文《素数分布研究的一种新思路》 [
余周期内全部筛余数的筛除率和对其中任一筛余数的筛除概率均为 d = 1 p ,避免了因素数之间公倍数引
起的重复筛除,简称“纯净筛除”。2) { 2 , 3 , ⋯ , p 0 , p } 筛剩余(简称p筛剩余)形成以 p 2 + 1 为起点,以
C = ∏ p p 为周期的移位周期重构,简称“周期重构”。3) p筛以概率1固定筛除p2点,从而截取p0筛剩余周期 C = ∏ 1 < p ≤ p 0 p 之首 ( p 0 2 , p 2 ) ,确认区间 ( p 0 2 , p 2 ) 的生成素数,简称“筛余截首”。
基于步骤1),步骤2),论文证明了 2 , 3 , ⋯ , p n ≤ n 筛除剩余在其周期 C = ∏ 1 < p ≤ n p 内平均密度
D ^ = ∏ 1 < p ≤ n ( 1 − 1 p ) = 1 e c 2 ln n = 1 0.89053620 ⋯ ln n (1.1)
式中,c为欧拉常数,e为自然对数的底。
逻辑的结论是:n邻域素数平均密度D必定在 D ^ 基础上,由“筛余截首”决定。“筛余截首”以概率1固定筛除p2而不是以概率 1 p 筛除p2,p2点的筛除概率比其它点增加了 1 − 1 p ,由此必然减小筛余周期前端密度,使区间 ( p 0 2 , p 2 ) 内素数平均密度低于 C = ∏ 1 < p ≤ n p 筛除剩余周期内剩余数的平均密度。
为讨论“筛余截首”对素数密度的影响,正整数m的密度分布成为必须直面的问题,首先对此进行概念研究。
定义2.1 (正整数在自然数列中的密度分布):正整数m在自然数列 { N } = 0 , 1 , 2 , ⋯ , m , ⋯ , n , ⋯ 中,m存在或被删除对m邻域和 { N } 全域密度影响程度在 { N } 全部元素上的分配函数 f ( n ; m ) (n为自变量,m为参变量),称m在 { N } 上的密度分布函数。正整数m在自然数列 { N } 中的密度分布函数是以n为自变量,以m为参变量的伽玛(Gama)函数
f ( n ; m ) = n m m ! e n (2.1)
对应的累积密度函数是
F ( n ; m ) = 1 − ( 1 + n + n 2 2 ! + ⋯ + n m m ! ) e − n (2.2)
称对 f ( n ; m ) 在其主要作用域上对应的均匀分布函数为正整数m在自然数列中的等效均匀密度分布。
定义说明: f ( n ; m ) 满足以下基本要求
1) m的密度函数 f ( n ; m ) 在 { N } 全域上的总和
∑ n = 0 ∞ f ( n ; m ) = 1 (2.3)
与概率密度函数同形异义。
2) m为 f ( n ; m ) 均值与密度最大值,对应于概率密度函数的数学期望和众值,邻域在概率密度函数中应起主要作用。 f ( n ; m ) 应为一个以m为均值和最大值的双向平滑的曲线,向0方向应以较快速率下降并交于0点,向+¥方向应以较快速率下降并一直拖尾到+¥,因此, f ( n ; m ) 应符合伽玛分布。
伽玛分布的一般表达式为 [
f ( n ; α , β ) = 1 α ! β α + 1 ⋅ n α ⋅ e − n β (2.4)
对应的积累密度函数为
F ( n ; m ) = 1 − ( 1 + n β + 1 2 ! ( n β ) 2 + ⋯ + 1 α ! ( n β ) α ) ⋅ e − n β (2.5)
使n满足众数的充要条件是 d f d n = 0 ,即
α n α − 1 ⋅ e − n β − n α β ⋅ e − n β = 0
解得 α β = n ,设 n = m 时满足众数条件,即
α β = m (2.6)
n = m 同时应为 f ( n ) 的均值,即
α β = m (2.7)
将(2.6) (2.7)联立,解得
{ α = m β = 1
将此结果代入(2.4)即得(2.1),代入(2.5)即得(2.2)。
3) 随着m的加大, f ( n ; m ) 应逐步逼近以m为中心、左右对称的正态分布,但向+¥方向的无限拖尾永远不会消失, f ( n ; m ) 永不等同正态分布。因此, f ( n ; m ) 在区间 ( 0 , m ] 的累级分布 f ( n ; m ) | 0 m 应逐步趋于0.5−,在区间 ( m , + ∞ ) 的累级分布 f ( n ; m ) | m + ∞ 应逐步趋于0.5+。
f ( n ; m ) 是自然数全域上的函数,与正整数及其累积即阶乘密切相关,这个定义反映了邻域与全域的关系。
猜想2.2:全体正整数的密度分布对同一自然数的总和为1,记作
∑ m = 1 ∞ f ( n ; m ) = 1 (2.8)
由此使数轴上全体正整数布满时,数轴上任何位置的密度为1,删去某一正整数对数轴上任何位置密度均有影响,但影响的分布服从被删去正整数的密度分布,全体正整数被删去后,数轴上任何位置密度均为0。由此建立数轴上正整数密度分布的加性运算规则,表为
f ( n ) = ∑ m ( n ; m ) (2.9)
式中,n为任意选择的一个自然数,m为全体正整数。
设想此猜想可通过对式(2.1)的函数分析证明。
推论2.3 (正整数在自然数列中的等效均匀密度分布命题):
正整数m在自然数列 { N } 中的等效均匀密度分布函数表为以n为自变量,以m为参变量的函数
f ( n ; m ) = 1 2 m + k (2.10)
式中 2 m + k 为m密度分布的等效作用域,k为位于区间
k min = 3 < k < k max = 4 (2.11)
的确定常数,数的性质和具体值待进一步研究仿真确定,本文称k为素数常数。
证明:先分析等效均匀分布的前提条件。 m → ∞ 时,伽玛分布无限趋近但永不等同左右完全对称的正态分布, m → 1 时具有与
时,
1) 由于
为更有针对性,对m为小素数平方数的几种情况(任意情况趋势相同),令
计算仿真表明:k由小变大时,
k | |||||
---|---|---|---|---|---|
2 | 0.37116306 | 0.59958426 | 1.61542008 | 0.02925268 | |
3 | 0.61373234 | 1.65353831 | 0.01510460 | ||
4 | 0.62123655 | 1.67375640 | 0.00760039 | ||
5 | 0.62509676 | 1.68415671 | 0.00374018 | ||
2 | 0.41259175 | 0.58241284 | 1.41159594 | 0.00499541 | |
3 | 0.58464267 | 1.41700038 | 0.00276558 | ||
4 | 0.58590332 | 1.42005583 | 0.00150493 | ||
5 | 0.58734804 | 1.42355742 | 8.06020279E−4 | ||
2 | 0.44707858 | 0.55289643 | 1.23668736 | 2.49895233E−5 | |
3 | 0.55290684 | 1.23671066 | 1.45743969E−5 | ||
4 | 0.55291298 | 1.23672440 | 8.43101530E−6 | ||
5 | 0.55291658 | 1.23673243 | 4.83888054E−6 | ||
2 | 0.46210439 | 0.53789559 | 1.16401317 | 1.17845007E−8 | |
3 | 0.53789560 | 1.16401318 | 6.99721276E−9 | ||
4 | 4.13577076E−9 | ||||
5 | 2.43355878E−9 | ||||
2 | 0.47584719 | 0.52415281 | 1.101514987 | 1.96004431E−18 | |
3 | 1.17817781E−18 | ||||
4 | 7.06805819E−19 | ||||
5 | 4.23194937E−19 |
表1. 伽玛累积分布部分计算结果
已可看出
满足要求。
忽略拖尾积累密度
推论2.3证毕。
在一定条件下,正整数的伽玛密度分布函数可用等效均匀分布来等效。
猜想3.1 (素数平均密度):n邻域素数平均密度
式中,
式(3.1) n小时D不准确;n较大时D比较准确;
证明:文献 [
当n很大时(
式中p表示全部素数。
分析“筛余截首”作用。“筛余截首”是在p0筛除剩余周期前端以概率1固定筛除相邻素数p2,由此确认
对以概率1固定筛除p2,其中概率
由式(2.1),p2的密度分布函数是以n为自变量,以p2为参变量的伽玛函数
考虑到:1) p相邻素数间平均间隔为
由此使相邻被删除p2的伽玛密度分布函数适用于等效均匀分布,引式(2.10),可用
再将这一降密作用嵌入到表示p筛降密作用的式(3.3)中,随之一起递推,形成加性降密因子
等效表为
令素数特征数
即
由此得
相应地
引式(2.11)
式(3.8)对应表为
对ρ判敛,取
随p增大,序列
实际上,相邻p2的等效作用域
当n很大时,对
即
仿真到
即
由此确定当
对
猜想3.1证毕。
需要说明:对由小到大的素数,等效作用域由小变大,相同的常数k对伽玛分布的截尾效应由大变小,在等效作用域定义下以均匀分布表示伽玛分布的理想程度由小变大,都反应了素数由小变大时粒度由大变小的事实。
D的不准确性源于:在素数特征数
正整数在自然数列的密度分布概念及“筛余截首”中正整数p2对筛除剩余周期前端密度的影响,是素数密度成立的关键。正整数的伽玛密度分布和等效均匀分布,以及筛除p2的降密作用,看来都是合理的。核心
的问题,一是正整数在自然数列的伽玛密度分布
限于作者水平和高精度计算条件,不能对此深入研究。真诚地希望数学界和各界批评指正,开展专题理论研究和高精度仿真计算,完成正整数密度分布的概念研究和猜想的证明。期待数学界的权威论证,向所有提出批评和做出研究的朋友、老师和专家表示衷心感谢。
推论3.2 (
映射式(3.15)就是由线性筛除剩余通往非线性素数的桥梁,它直接源于埃氏筛法的“纯净筛除”、“周期重构”和“筛余截首”三步骤,素数密度直接源于埃氏筛法的素数生成机制。
推论3.3 (筛除剩余周期内前端密度):设有以p0为基础的连续p0筛、p筛和
推论3.4 (素数分布的分形结构与混沌性态):埃氏筛法的“纯净筛除”、“周期重构”和“筛余截首”,由简单机制生成了复杂性态。1) 在形成
由于互质素数的“纯净筛除”和“周期重构”,已经产生了筛除剩余数的轨道不可预测性。2) 随着素数由小到大,“筛余截首”中连续p2筛除的自相似的有效作用域形成
不过,由于
文献 [
文献 [
式中r为渐近级数的最佳截断
从而得出了与素数定理一致的更加精细的表示。
借助筛除概率式(4.1)、素数密度式(3.1)、
作者在中文杂志《前沿科学》2016年第4期发表的论文《素数分布研究新思路的若干应用》 [
青年高级工程师王炜华博士、汤宏伟、王远和李军博士完成了初稿英译和仿真计算,崔雁巍完成了文档整理和校对,在此表示衷心感谢。衷心感谢爱妻邢纪荣和家人的理解、支持和关爱。
崔蕴华. 正整数密度分布与素数密度 Integer Density Distribution and Prime Density[J]. 理论数学, 2018, 08(03): 193-202. https://doi.org/10.12677/PM.2018.83024