计算浮点余数的最佳方法

Question

问题

remainder函数的计算成本是多少，是否有特定的指令在特定情况下以便宜的方式计算它？

描述

我需要将一个数学变量x变换到I=[-0.5的范围内； 0.5) 从 R=[-2; 2).虽然 x 不是 I 的元素，然后 x 移向 I 通过对 x 的值重复加或减 1。 x 在我的代码中用 double x 表示。对于此 I 和 R 值，我需要这种转换的最快方法，但更宽的 R 范围可以是也很有趣。

思路与速度对比

我被建议使用的功能是以下描述的简单实现：

void shift_to_I(double& x) // version 1
{
    while (x < -0.5)
            x += 1;

    while (x >= 0.5)
            x -= 1;
}

不仅出于速度方面的考虑，而且出于代码质量的考虑，我正在考虑使用 c++11 中引入的 <cmath> 中的 remainder。使用 remainder 代码缩短为

void shift_to_I(double& x) // version 2
{
    x = remainder(x,1);
}

我不得不意识到它比我架构上的原始功能慢（Intel i7 whatever with VC++）。我相信有一个专门用于此目的的指令，但编译器不知道它或者它不存在。对于更宽的 R 间隔（在我的体系结构中它大约是 [-25; 25)），第二个版本会更快，但我也需要一个对于窄间隔也很快的代码。也欢迎 clang 和 gcc 特定解决方案。

Answer 1

这个问题取决于编译器和实现。

例如，在我的 GCC 8.3 机器上：

没有 -ffast-math, std::remainder translates into a call to this function:

double __remainder(double x, double y)
{
    if (((__builtin_expect (y == 0.0, 0) && ! isnan(x)) || (__builtin_expect(isinf(x), 0) && ! isnan(y))) && _LIB_VERSION != _IEEE_)
        return __kernel_standard(x, y, 28);
    return __ieee754_remainder(x, y);
}

与 __ieee754_remainder 看起来像 this:

double __ieee754_remainder(double x, double y)
{
    double z, d, xx;
    int4 kx, ky, n, nn, n1, m1, l;
    mynumber u, t, w = {{0, 0}}, v = {{0, 0}}, ww = {{0, 0}}, r;
    u.x = x;
    t.x = y;
    kx = u.i[HIGH_HALF] & 0x7fffffff; /* no sign  for x*/
    t.i[HIGH_HALF] &= 0x7fffffff;     /*no sign for y */
    ky = t.i[HIGH_HALF];
    /*------ |x| < 2^1023  and   2^-970 < |y| < 2^1024 ------------------*/
    if (kx < 0x7fe00000 && ky < 0x7ff00000 && ky >= 0x03500000)
    {
        SET_RESTORE_ROUND_NOEX(FE_TONEAREST);
        if (kx + 0x00100000 < ky)
            return x;
        if ((kx - 0x01500000) < ky)
        {
            z = x / t.x;
            v.i[HIGH_HALF] = t.i[HIGH_HALF];
            d = (z + big.x) - big.x;
            xx = (x - d * v.x) - d * (t.x - v.x);
            if (d - z != 0.5 && d - z != -0.5)
                return (xx != 0) ? xx : ((x > 0) ? ZERO.x : nZERO.x);
            else
            {
                if (fabs(xx) > 0.5 * t.x)
                    return (z > d) ? xx - t.x : xx + t.x;
                else
                    return xx;
            }
        } /*    (kx<(ky+0x01500000))         */
        else
        {
            r.x = 1.0 / t.x;
            n = t.i[HIGH_HALF];
            nn = (n & 0x7ff00000) + 0x01400000;
            w.i[HIGH_HALF] = n;
            ww.x = t.x - w.x;
            l = (kx - nn) & 0xfff00000;
            n1 = ww.i[HIGH_HALF];
            m1 = r.i[HIGH_HALF];
            while (l > 0)
            {
                r.i[HIGH_HALF] = m1 - l;
                z = u.x * r.x;
                w.i[HIGH_HALF] = n + l;
                ww.i[HIGH_HALF] = (n1) ? n1 + l : n1;
                d = (z + big.x) - big.x;
                u.x = (u.x - d * w.x) - d * ww.x;
                l = (u.i[HIGH_HALF] & 0x7ff00000) - nn;
            }
            r.i[HIGH_HALF] = m1;
            w.i[HIGH_HALF] = n;
            ww.i[HIGH_HALF] = n1;
            z = u.x * r.x;
            d = (z + big.x) - big.x;
            u.x = (u.x - d * w.x) - d * ww.x;
            if (fabs(u.x) < 0.5 * t.x)
                return (u.x != 0) ? u.x : ((x > 0) ? ZERO.x : nZERO.x);
                else if (fabs(u.x) > 0.5 * t.x)
                return (d > z) ? u.x + t.x : u.x - t.x;
            else
            {
                z = u.x / t.x;
                d = (z + big.x) - big.x;
                return ((u.x - d * w.x) - d * ww.x);
            }
        }
    } /*   (kx<0x7fe00000&&ky<0x7ff00000&&ky>=0x03500000)     */
    else
    {
        if (kx < 0x7fe00000 && ky < 0x7ff00000 && (ky > 0 || t.i[LOW_HALF] != 0))
        {
            y = fabs(y) * t128.x;
            z = __ieee754_remainder(x, y) * t128.x;
            z = __ieee754_remainder(z, y) * tm128.x;
            return z;
        }
        else
        {
            if ((kx & 0x7ff00000) == 0x7fe00000 && ky < 0x7ff00000 &&
                (ky > 0 || t.i[LOW_HALF] != 0))
            {
                y = fabs(y);
                z = 2.0 * __ieee754_remainder(0.5 * x, y);
                d = fabs(z);
                if (d <= fabs(d - y))
                    return z;
                else if (d == y)
                    return 0.0 * x;
                else
                    return (z > 0) ? z - y : z + y;
            }
            else /* if x is too big */
            {
                if (ky == 0 && t.i[LOW_HALF] == 0) /* y = 0 */
                    return (x * y) / (x * y);
                else if (kx >= 0x7ff00000    /* x not finite */
                         || (ky > 0x7ff00000 /* y is NaN */
                                || (ky == 0x7ff00000 && t.i[LOW_HALF] != 0)))
                    return (x * y) / (x * y);
                else
                    return x;
            }
        }
    }
}

远不是一条机器指令。

和-ffast-math，使用了单个fprem1汇编指令。

计算浮点余数的最佳方法

Best way calculating remainder on floating points

c++

optimization

cmath

c++11

问题

描述

思路与速度对比