bsearch 不搜索传递给它的整个数组

bsearch not searching entire array passed to it

我在搜索时遇到了问题。我很确定我已经将问题隔离到 bsearch 接受的字节数参数。数据数组是一个拼字字典,我 100% 确定整个字典已加载到内存中,但是当我使用 bsearch 来尝试查找某个特定单词是否在字典中,它仅适用于 'wontedly' 之前的单词,即使字典的最后一个单词是 'zzz' 所以一些以 'w' 'x' 开头的单词无法找到 'y' 和 'z'。就好像 bsearch 函数看不到数组的末尾,即使它在那里。另一件值得注意的事情是,在我的比较函数中,我打印出 bsearch 传递给它的内容以查看正在比较的单词,并且在第一次比较时,bsearch 似乎没有发送类似于 [=19 的中间值=],相反,它从 'lodge' 开始,这不是字典中的中间词。 16 个字节是我输入的数字,通过反复试验似乎有效。问题是我不知道数组中每个元素的长度是多少,或者至少我认为这是问题所在。

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <string.h>

#define LEN 128


 int search(const void *usr_word,const void *words);

struct data_t {
    int nval;       /* current number of values in array */
    int max;        /* allocated number of values */
    char **data;        /* the data array */
};

enum {INIT = 1, GROW = 2};

int main(void)
{
    FILE *fp = fopen("scrabble.txt", "r");
    assert(fp);
    char *usr_word = NULL;
    char buf[LEN];
    int i = 0;
    char number[LEN];
    char* item = NULL;


    struct data_t *data = malloc(sizeof(struct data_t));
    data->nval = INIT;
    data->max = INIT;
    data->data = NULL;
    while (fgets(buf, LEN, fp)) {
            if (data->data == NULL) {
                    data->data = malloc(strlen(buf) - 1);
                    assert(data->data);
            }
            else if (data->nval > data->max) {
                    data->data = realloc(data->data, GROW * data->max * LEN);
                    assert(data->data);
                    data->max = GROW * data->max;
            }

            data->data[i] = strndup(buf, strlen(buf) - 1);
            i++;
            data->nval++;
    }
    /* overcounted */
    data->nval--;
    printf("Enter word: ");
    fgets(buf, LEN, stdin);
    usr_word = strndup(buf, strlen(buf)-1);

    /*search for word*/
    item = (char *) bsearch(usr_word, data->data[0], data->nval, 16, search);
    if (item != NULL) 
           printf("\n%s is valid\n", item);
    else if (item == NULL)
           printf("\n%s is not valid\n", usr_word);

    return 0;
}

int search(const void *usr_word,const void *words)
{      
 printf("%s | %s | %d\n", (char *)usr_word,(char *)  words, strcmp(usr_word,words));
    return strcmp(usr_word,words);
}

好的,您的代码存在多个问题,所有问题都源于您对结构 data_t.data.

中使用的 char ** 的误解

char ** 是指向指针的指针数组。它无论如何都不是字符串数组。

意思如下:

data->data = malloc(strlen(buf) - 1);

应替换为以下内容:

data->data = malloc(sizeof(char *) * (data->nval));

realloc:

data->data = realloc(data->data, GROW * data->max * LEN);

替换为

data->data = realloc(data->data, GROW * data->max * sizeof(char *));

接下来,bsearch 调用:

item = (char *) bsearch(usr_word, data->data[0], data->nval, 16, search);

替换为:

item = (char **) bsearch(usr_word, data->data, data->nval, sizeof(char*), search);

看看我是如何用 sizeof(char*) 替换 16 的?这是因为 bsearch 应用于 char **,例如char * 的数组,因此,基本的 bsearch 项是 char *。因此,bsearch 的 return 值是 pointer to elementary item, e.g. pointer tochar *, e.g.char **`.

引自手册页:

The bsearch() function returns a pointer to a matching member of the array

接下来是 printf:

printf("\n%s is valid\n", item);

我替换为: printf("\n%s 是 valid\n", *item);

*item 而不是 item 是由于相同的原因 - bsearch returns us 指针指向它找到的内容。我们需要将这个指针解析为实际值。

最后是你的 search:

printf("%s | %s | %d\n", (char *)usr_word,(char *)  words, strcmp(usr_word,words));
return strcmp(usr_word,words);

再次使用正确的指针级别 - 我们有两级,我们需要一级:

printf("%s | %s | %d\n", (char *)usr_word,*(char **)  words, strcmp(usr_word,words));
return strcmp(usr_word,*(char**)words);

为了您的方便,下面是整个有效的程序:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <string.h>

#define LEN 128

int search(const void *usr_word,const void *words);

struct data_t {
    int nval;       /* current number of values in array */
    int max;        /* allocated number of values */
    char **data;        /* the data array */
};

enum {INIT = 1, GROW = 2};

int main(void)
{
FILE *fp = fopen("scrabble.txt", "r");
assert(fp);
char *usr_word = NULL;
char buf[LEN];
int i = 0;
char number[LEN];
char** item = NULL;


struct data_t *data = malloc(sizeof(struct data_t));
data->nval = INIT;
data->max = INIT;
data->data = NULL;
while (fgets(buf, LEN, fp)) {
        if (data->data == NULL) {
                data->data = malloc(sizeof(char *) * (data->nval));
                assert(data->data);
        }
        else if (data->nval > data->max) {
                data->data = realloc(data->data, GROW * data->max * sizeof(char *));
                assert(data->data);
                data->max = GROW * data->max;
        }

        data->data[i] = strndup(buf, strlen(buf) - 1);
        i++;
        data->nval++;
}
/* overcounted */
data->nval--;
printf("Enter word: ");
fgets(buf, LEN, stdin);
usr_word = strndup(buf, strlen(buf)-1);

/*search for word*/
item = (char **) bsearch(usr_word, data->data, data->nval, sizeof(char*), search);
if (item != NULL)
       printf("\n%s is valid\n", *item);
else if (item == NULL)
       printf("\n%s is not valid\n", usr_word);

for(i=0;i<data->nval;++i) free(data->data[i]);
free(data->data);
free(data);
free(usr_word);

return 0;
}

int search(const void *usr_word,const void *words)
{
 printf("%s | %s | %d\n", (char *)usr_word,*(char **)  words,     strcmp(usr_word,words));
    return strcmp(usr_word,*(char**)words);
}