C++ 有人可以帮我优化这段代码吗?

C++ Can someone help me optimize this code?

我正在尝试在大边界上执行循环卷积有人可以帮助我将其优化为 运行 更快吗?我正在尝试 cconv 以发出大量样本的信号。下采样不是一种选择。

#include <iostream>
#include <time.h> /* clock_t, clock, CLOCKS_PER_SEC */
#include <math.h> /* sqrt */
using namespace std;

void fillarray(double* x, int N)
{
    for (int i = 0; i < N; i++)
        x[i] = i + 1;
}

void circcon(double* x, double* y, double* u, int N)
{
    for (int m = 0; m < N; ++m)
        for (int n = 0; n < N; ++n) {
            if ((m - n) < 0)
                u[m] += x[n] * y[m - n + N];
            else
                u[m] += x[n] * y[m - n];
        }
}

int main(void)
{
    int N = 447650;
    double* x = new double[N];
    double* y = new double[N];
    double* u = new double[N];
    clock_t t;
    t = clock();

    fillarray(x, N);
    fillarray(y, N);

    for (int i = 0; i < N; i++)
        u[i] = 0.0;

    circcon(x, y, u, N);
    t = clock() - t;
    printf("It took me %d clicks (%f seconds).\n", t, ((float)t) / CLOCKS_PER_SEC);
    return 0;
}

这取决于您需要提高多少性能...

首先,我会制作大小为 2Ny,第二部分是第一部分的副本,这样就可以简单地编写 u[m] += x[n]*y[m-n+N]; 而不是 if 语句 if((m-n) < 0) u[m] += x[n]*y[m-n+N]; else u[m] += x[n]*y[m-n]; .

然后,你可以尝试让它成为多线程,寻求相关教程。有很多。

考虑使用 SIMD 指令,尽管我相信如今编译器在足够简单的情况下会自动使用它们。

但是,最好的解决方案是找到 FFT(快速傅里叶变换)的实现。然后你可以在 O(n log n) 操作而不是 O(n^2) 中完成卷积。我只是用谷歌搜索并找到了一个图书馆:

http://www.alglib.net/fasttransforms/convolution.php

编辑:如果你有 matlab - 他们已经有很长时间的 FFT 了。