并行化一个函数

Parallelising a function

我正在尝试对此函数实现并行性,我希望它采用尽可能多的线程,并将结果写入文件。

结果需要以递增的顺序写入文件,因此第一个结果需要先写入第二个,依此类推。

keyGen 函数只是整数 m 的 MD5,用作每个链的起点。 Reduction32 是一个缩减函数,它采用前 8 个字节添加 t 和 returns 该值。当链到达其端点时,它被存储在二进制文件中。

有没有聪明的方法来实现这种并行?在不搞乱端点存储顺序的情况下?

void tableGenerator32(uint32_t * text){
    int mMax = 33554432, lMax = 236;
    int m, t, i;
    uint16_t * temp;
    uint16_t * key, ep[2];
    uint32_t tp;
    FILE * write_ptr;
    write_ptr = fopen("table32bits.bin", "wb");
    for(m = 0; m < mMax ; m++){
        key = keyGen(m);
        for (t = 0; t < lMax; t++){
            keyschedule(key);
            temp = kasumi_enc(text);
            tp = reduction32(t,temp);
            temp[0]=tp>>16;
            temp[1]=tp;
            for(i=0; i < 8; i++){
                key[i]=temp[i%2];
            }
        }
        for(i=0;i<2;i++)
            ep[i] = key[i];

        fwrite(ep,sizeof(ep),1,write_ptr);
    }
    fclose(write_ptr);
}

在不面临并发问题的情况下并行化上述函数的最佳方法是创建与您希望使用的线程一样多的内存流,然后将任务分成几部分,比如如果您有 4 个线程,

  • 一个线程执行任务从 0 到 mMax / 4
  • 一个线程执行任务从 mMax / 4 到 (mMax / 4) * 2
  • 一个线程执行任务从 (mMax / 4) * 2 到 (mMax / 4) * 3
  • 一个线程执行任务从(mMax / 4) * 3到(mMax / 4) * 4

然后连接结果流并将它们写入文件。