使用互斥量的 Pthread 同步未正确同步单词

Pthread synchronization using mutex not syncing words properly

该程序的目标是使用多线程逐字复制用户输入的字符串。每个线程每四个字复制一次,例如第一个线程复制第一个和第五个字,第二个线程复制第二个和第六个字,等等。我对互斥锁做了很多研究,我相信我已经正确实现了互斥锁然而,该字符串在打印时仍然是乱七八糟的废话。有人可以阐明线程不同步的原因吗?

#include <stdio.h>
#include <pthread.h>
#include <string.h>
#include <stdlib.h>

void *processString(void *);

char msg1[100];
char msg2[100];
char * reg;
char * token;
char * tokens[10];
pthread_mutex_t lock = PTHREAD_MUTEX_INITIALIZER;
pthread_cond_t = PTHREAD_COND_INITIALIZER;

int main(){
    int i = 0, j;
    pthread_t workers[4];

    printf("Please input a string of words separated by whitespace characters: \n");
    scanf("%99[^\n]", msg1); //take in a full string including whitespace characters

    //tokenize string into individual words
    token = strtok(msg1, " ");  
    while(token != NULL){
        tokens[i] = (char *) malloc (sizeof(token));
        tokens[i] = token;
        token = strtok(NULL, " ");
        i++;
    }

    for(j = 0; j < 4; j++){
        if(pthread_create(&workers[j], NULL, processString, (void *) j))
            printf("Error creating pthreads");
    }

    for(i = 0; i < 4; i++){
        pthread_join(workers[i], NULL);
    }
    pthread_mutex_destroy(&lock);

    printf("%s\n", msg2);

    return 0;
}

//each thread copies every fourth word
void *processString(void *ptr){
    int j = (int) ptr, i = 0;

    pthread_mutex_lock(&lock);

    while(tokens[i * 4 + j] != NULL){   
        reg = (char *) malloc (sizeof(tokens[i * 4 + j]));
        reg = tokens[i * 4 + j];
        strcat(msg2, reg);
        strcat(msg2, " ");
        i++;
    }

    pthread_mutex_unlock(&lock);
    return NULL;
}

正如@EOF 在评论中所写,互斥体提供 互斥。它们防止多个协作线程并发 运行ning,但它们本身并不提供对这些线程获取它们的顺序的任何控制。此外,正如我自己在评论中所述,互斥 do 提供互斥:如果一个线程持有互斥,则其他线程将无法获取该互斥,也不会继续尝试执行所以,直到那个互斥体被释放。

没有直接提供线程轮流的原生同步对象。毕竟,这通常不是您希望线程执行的操作。你可以用信号量来安排它,但是当你添加更多的线程时,它很快就会变得混乱。一个非常干净的解决方案涉及使用共享全局变量来指示轮到哪个线程 运行。对该变量的访问必须受到互斥量的保护,因为所有涉及的线程都必须读写它,但这样做有一个问题:如果当前持有互斥量的线程不是轮到 运行?

有可能所有线程循环,不断获取互斥量,测试变量,然后继续或释放互斥量。不幸的是,这样一个繁忙的等待往往表现得很差,而且一般来说,你不能确信在执行的任何给定点上可以取得进展的线程将设法在有限的时间内获得互斥量。

这就是 condition variables 的用武之地。条件变量是一个同步对象,它允许任意数量的线程挂起 activity 直到满足某个条件(根据另一个未挂起的判断)线。使用这样的工具可以避免耗尽性能的忙等待,并且在您的情况下,它可以帮助确保您的所有线程都有机会在有限的时间内达到 运行 。条件变量的通用每线程使用模型如下:

  1. 获取保护共享变量的互斥体,判断是否可以继续
  2. 测试我是否可以继续。如果是,跳到第 5 步。
  3. 我现在无法继续。对条件变量执行等待。
  4. 我从等待中醒来;返回第 2 步。
  5. 做我需要做的工作。
  6. 广播信号以唤醒所有等待条件变量的线程。
  7. 释放互斥。

可能会有变体,但我建议您不要改变它,除非您确切地知道为什么要这样做,以及为什么您想到的变体是安全的。另请注意,当线程对与给定互斥量相关联的条件变量执行等待时,它会在等待时自动释放该互斥量,并在从等待返回之前重新获取它。这允许其他线程同时进行,特别是等待相同的条件变量。

因为它适用于您的问题,您希望线程测试的共享状态是上述变量,它指示轮到哪个线程,并且您希望线程等待的条件是它已成为轮到不同的线程(但这隐含在您使用条件变量的方式中;条件变量本身是通用的)。另请注意,这意味着每个线程在向其他线程发出信号之前必须完成的部分工作是更新轮到哪个线程。由于每个线程可能需要多次轮流,因此您需要将整个过程包装在一个循环中。