C++ 有人可以帮我优化这段代码吗?
C++ Can someone help me optimize this code?
我正在尝试在大边界上执行循环卷积有人可以帮助我将其优化为 运行 更快吗?我正在尝试 cconv 以发出大量样本的信号。下采样不是一种选择。
#include <iostream>
#include <time.h> /* clock_t, clock, CLOCKS_PER_SEC */
#include <math.h> /* sqrt */
using namespace std;
void fillarray(double* x, int N)
{
for (int i = 0; i < N; i++)
x[i] = i + 1;
}
void circcon(double* x, double* y, double* u, int N)
{
for (int m = 0; m < N; ++m)
for (int n = 0; n < N; ++n) {
if ((m - n) < 0)
u[m] += x[n] * y[m - n + N];
else
u[m] += x[n] * y[m - n];
}
}
int main(void)
{
int N = 447650;
double* x = new double[N];
double* y = new double[N];
double* u = new double[N];
clock_t t;
t = clock();
fillarray(x, N);
fillarray(y, N);
for (int i = 0; i < N; i++)
u[i] = 0.0;
circcon(x, y, u, N);
t = clock() - t;
printf("It took me %d clicks (%f seconds).\n", t, ((float)t) / CLOCKS_PER_SEC);
return 0;
}
这取决于您需要提高多少性能...
首先,我会制作大小为 2N
的 y
,第二部分是第一部分的副本,这样就可以简单地编写 u[m] += x[n]*y[m-n+N];
而不是 if 语句 if((m-n) < 0) u[m] += x[n]*y[m-n+N]; else u[m] += x[n]*y[m-n];
.
然后,你可以尝试让它成为多线程,寻求相关教程。有很多。
考虑使用 SIMD 指令,尽管我相信如今编译器在足够简单的情况下会自动使用它们。
但是,最好的解决方案是找到 FFT(快速傅里叶变换)的实现。然后你可以在 O(n log n) 操作而不是 O(n^2) 中完成卷积。我只是用谷歌搜索并找到了一个图书馆:
http://www.alglib.net/fasttransforms/convolution.php
编辑:如果你有 matlab - 他们已经有很长时间的 FFT 了。
我正在尝试在大边界上执行循环卷积有人可以帮助我将其优化为 运行 更快吗?我正在尝试 cconv 以发出大量样本的信号。下采样不是一种选择。
#include <iostream>
#include <time.h> /* clock_t, clock, CLOCKS_PER_SEC */
#include <math.h> /* sqrt */
using namespace std;
void fillarray(double* x, int N)
{
for (int i = 0; i < N; i++)
x[i] = i + 1;
}
void circcon(double* x, double* y, double* u, int N)
{
for (int m = 0; m < N; ++m)
for (int n = 0; n < N; ++n) {
if ((m - n) < 0)
u[m] += x[n] * y[m - n + N];
else
u[m] += x[n] * y[m - n];
}
}
int main(void)
{
int N = 447650;
double* x = new double[N];
double* y = new double[N];
double* u = new double[N];
clock_t t;
t = clock();
fillarray(x, N);
fillarray(y, N);
for (int i = 0; i < N; i++)
u[i] = 0.0;
circcon(x, y, u, N);
t = clock() - t;
printf("It took me %d clicks (%f seconds).\n", t, ((float)t) / CLOCKS_PER_SEC);
return 0;
}
这取决于您需要提高多少性能...
首先,我会制作大小为 2N
的 y
,第二部分是第一部分的副本,这样就可以简单地编写 u[m] += x[n]*y[m-n+N];
而不是 if 语句 if((m-n) < 0) u[m] += x[n]*y[m-n+N]; else u[m] += x[n]*y[m-n];
.
然后,你可以尝试让它成为多线程,寻求相关教程。有很多。
考虑使用 SIMD 指令,尽管我相信如今编译器在足够简单的情况下会自动使用它们。
但是,最好的解决方案是找到 FFT(快速傅里叶变换)的实现。然后你可以在 O(n log n) 操作而不是 O(n^2) 中完成卷积。我只是用谷歌搜索并找到了一个图书馆:
http://www.alglib.net/fasttransforms/convolution.php
编辑:如果你有 matlab - 他们已经有很长时间的 FFT 了。