快速将产品解析为 python 中的单项式?

Parsing a product into monomials in python fast?

我有一个 m 形式的单项式,我想将它解析为一个具有指数的表达式。

m = "n0*n0"     
Sympy(n0)
parse_expr(n0*n0)

这给了我以下正确的输出:

n0**2

问题是我在数据框列中有数百万个这样的单项式和数千个参数,现在我对它们进行应用以解析它们,这需要永远。有更好的解决方案吗? eval 要求我给 n0 一个值我不想评估我只是想把这样的单项式变成一个简洁的表示。

isympy 会话中:

In [38]: parse_expr("n0*n0")
Out[38]: 
  2
n₀ 

In [39]: type(_)
Out[39]: sympy.core.power.Pow

解析需要一个字符串,一个 returns 一个 sympy 表达式。

这不是一个特别快的操作:

In [40]: timeit parse_expr("n0*n0")
524 µs ± 79.5 ns per loop (mean ± std. dev. of 7 runs, 1000 loops each)

将其与简单的字符串替换进行比较:

In [42]: "n0*n0".replace("*n0","**2")
Out[42]: 'n0**2'

In [43]: timeit "n0*n0".replace("*n0","**2")
118 ns ± 1.04 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)

这是我第一次看到有人试图将 sympypandas 一起使用。人们确实尝试将它与 numpy 一起使用,但结果往往令人困惑。通常 sympy.lambdify 是从 sympy 表达式创建 numpy 函数的唯一可靠方法。 sympy 适合做代数数学,但我无法想象它对大型数据帧有用。