所有数字的乘法(2 个数字之间)python
multiplication of all numbers (between 2 numbers) python
我正在解决一个问题( problem I asked before and can be found here 的扩展)要求我计算两个数字之间的数字乘法,然后计算幂:
我的第一个方法很简单:
n0=n+1
n1=n0+1
while n1<=(p-1):
n0=n1%p*n0%p
n1+=1
print p-pow(n0,(p-2),p)
constraints:
1 < P <= 2*10^9 , a prime number
1 <= N <= 2*10^9
Abs(N-P) <= 1000
这里我的代码计算 n(<=1000) 个连续数字的乘法
但是当约束变为
0 < N < 4×10^18
1 < P < 4×10^18, a prime number
Abs(N-P) < 10^4
对于这些约束,我的解决方案很慢并且超过了时间限制。我搜索了各种改进代码的方法。我发现了一个很棒的算法,它可以在 O(loglog nM(nlogn))
时间内计算阶乘,其中 M
是两个数字相乘的时间复杂度。
该算法首先计算素数,然后计算 n!然后最后将它们全部相乘(你可以在 here 上看到更多)。但是,如果我在我的问题中实施这个解决方案,我认为它不会有帮助,因为约束太大,无法在相当长的时间内计算所有素数本身,而且我只需要找到最多 10**4
个连续数字的乘法。所以我放弃了这个想法,开始寻找乘法。
我发现 python 乘法足够快,它使用 'Karatsuba algorithm' 并且实现 Schönhage–Strassen 算法是不明智的(因为我首先想到实现它)
除非至少有 10,000 个数字(因为只有它才能执行 karatsuba)。
而且内置的 pow()
也非常快(this file 的第 1426 行显示了实现 math.pow 的 Python 代码,但基本上可以归结为它调用可能具有该函数的高度优化版本的标准 C 库)以在我的约束范围内计算幂。
现在我想不出任何其他方法来提高我的代码的时间复杂度。有人可以帮我找到关于时间限制的优化或完全不同且更好的解决方案。
我正在解决的问题是here。
[编辑] Stirling's formula 说对于大的 N
你可以用日志来近似 N!
计算机:
N! % p =~ exp((N* ln(N) - N)) % p
对于较小的数字,保留阶乘以获得更高的精度。
一个简单的 *2 加速可以来自将代码更改为:
n0=n+1
for n1 in range(n0+1,p):
n0 = (n0 * n1)%p
return p-pow(n0,(p-2),p)
每次迭代只进行一次取模运算。
预计算阶乘可以使速度额外提高 10 倍。
您乘以从 n+1 到 p-1 的所有值,这与乘以 -1 到 n+1-p 相同。所以你可以预先计算一个数组 A[x] 等于 -1*-2...*-x 的乘积并使用这个预先计算的值而不是循环。
(请注意,您需要保持此预计算数组的完整整数精度,因为在预计算期间您不知道将使用哪个质数。)
预计算代码为:
t=1
A=[1]
for y in range(1,10**4+1):
A.append(t)
t*=-y
然后为每个案例计算:
return 0 if n>=p else p-pow(A[p-n]%p,(p-2),p)
我正在解决一个问题(
我的第一个方法很简单:
n0=n+1
n1=n0+1
while n1<=(p-1):
n0=n1%p*n0%p
n1+=1
print p-pow(n0,(p-2),p)
constraints:
1 < P <= 2*10^9 , a prime number
1 <= N <= 2*10^9
Abs(N-P) <= 1000
这里我的代码计算 n(<=1000) 个连续数字的乘法
但是当约束变为
0 < N < 4×10^18
1 < P < 4×10^18, a prime number
Abs(N-P) < 10^4
对于这些约束,我的解决方案很慢并且超过了时间限制。我搜索了各种改进代码的方法。我发现了一个很棒的算法,它可以在 O(loglog nM(nlogn))
时间内计算阶乘,其中 M
是两个数字相乘的时间复杂度。
该算法首先计算素数,然后计算 n!然后最后将它们全部相乘(你可以在 here 上看到更多)。但是,如果我在我的问题中实施这个解决方案,我认为它不会有帮助,因为约束太大,无法在相当长的时间内计算所有素数本身,而且我只需要找到最多 10**4
个连续数字的乘法。所以我放弃了这个想法,开始寻找乘法。
我发现 python 乘法足够快,它使用 'Karatsuba algorithm' 并且实现 Schönhage–Strassen 算法是不明智的(因为我首先想到实现它) 除非至少有 10,000 个数字(因为只有它才能执行 karatsuba)。
而且内置的 pow()
也非常快(this file 的第 1426 行显示了实现 math.pow 的 Python 代码,但基本上可以归结为它调用可能具有该函数的高度优化版本的标准 C 库)以在我的约束范围内计算幂。
现在我想不出任何其他方法来提高我的代码的时间复杂度。有人可以帮我找到关于时间限制的优化或完全不同且更好的解决方案。
我正在解决的问题是here。
[编辑] Stirling's formula 说对于大的 N
你可以用日志来近似 N!
计算机:
N! % p =~ exp((N* ln(N) - N)) % p
对于较小的数字,保留阶乘以获得更高的精度。
一个简单的 *2 加速可以来自将代码更改为:
n0=n+1
for n1 in range(n0+1,p):
n0 = (n0 * n1)%p
return p-pow(n0,(p-2),p)
每次迭代只进行一次取模运算。
预计算阶乘可以使速度额外提高 10 倍。 您乘以从 n+1 到 p-1 的所有值,这与乘以 -1 到 n+1-p 相同。所以你可以预先计算一个数组 A[x] 等于 -1*-2...*-x 的乘积并使用这个预先计算的值而不是循环。
(请注意,您需要保持此预计算数组的完整整数精度,因为在预计算期间您不知道将使用哪个质数。)
预计算代码为:
t=1
A=[1]
for y in range(1,10**4+1):
A.append(t)
t*=-y
然后为每个案例计算:
return 0 if n>=p else p-pow(A[p-n]%p,(p-2),p)