bsearch 不搜索传递给它的整个数组
bsearch not searching entire array passed to it
我在搜索时遇到了问题。我很确定我已经将问题隔离到 bsearch 接受的字节数参数。数据数组是一个拼字字典,我 100% 确定整个字典已加载到内存中,但是当我使用 bsearch 来尝试查找某个特定单词是否在字典中,它仅适用于 'wontedly' 之前的单词,即使字典的最后一个单词是 'zzz' 所以一些以 'w' 'x' 开头的单词无法找到 'y' 和 'z'。就好像 bsearch 函数看不到数组的末尾,即使它在那里。另一件值得注意的事情是,在我的比较函数中,我打印出 bsearch 传递给它的内容以查看正在比较的单词,并且在第一次比较时,bsearch 似乎没有发送类似于 [=19 的中间值=],相反,它从 'lodge' 开始,这不是字典中的中间词。 16 个字节是我输入的数字,通过反复试验似乎有效。问题是我不知道数组中每个元素的长度是多少,或者至少我认为这是问题所在。
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <string.h>
#define LEN 128
int search(const void *usr_word,const void *words);
struct data_t {
int nval; /* current number of values in array */
int max; /* allocated number of values */
char **data; /* the data array */
};
enum {INIT = 1, GROW = 2};
int main(void)
{
FILE *fp = fopen("scrabble.txt", "r");
assert(fp);
char *usr_word = NULL;
char buf[LEN];
int i = 0;
char number[LEN];
char* item = NULL;
struct data_t *data = malloc(sizeof(struct data_t));
data->nval = INIT;
data->max = INIT;
data->data = NULL;
while (fgets(buf, LEN, fp)) {
if (data->data == NULL) {
data->data = malloc(strlen(buf) - 1);
assert(data->data);
}
else if (data->nval > data->max) {
data->data = realloc(data->data, GROW * data->max * LEN);
assert(data->data);
data->max = GROW * data->max;
}
data->data[i] = strndup(buf, strlen(buf) - 1);
i++;
data->nval++;
}
/* overcounted */
data->nval--;
printf("Enter word: ");
fgets(buf, LEN, stdin);
usr_word = strndup(buf, strlen(buf)-1);
/*search for word*/
item = (char *) bsearch(usr_word, data->data[0], data->nval, 16, search);
if (item != NULL)
printf("\n%s is valid\n", item);
else if (item == NULL)
printf("\n%s is not valid\n", usr_word);
return 0;
}
int search(const void *usr_word,const void *words)
{
printf("%s | %s | %d\n", (char *)usr_word,(char *) words, strcmp(usr_word,words));
return strcmp(usr_word,words);
}
好的,您的代码存在多个问题,所有问题都源于您对结构 data_t.data.
中使用的 char **
的误解
char **
是指向指针的指针数组。它无论如何都不是字符串数组。
意思如下:
data->data = malloc(strlen(buf) - 1);
应替换为以下内容:
data->data = malloc(sizeof(char *) * (data->nval));
同realloc
:
data->data = realloc(data->data, GROW * data->max * LEN);
替换为
data->data = realloc(data->data, GROW * data->max * sizeof(char *));
接下来,bsearch 调用:
item = (char *) bsearch(usr_word, data->data[0], data->nval, 16, search);
替换为:
item = (char **) bsearch(usr_word, data->data, data->nval, sizeof(char*), search);
看看我是如何用 sizeof(char*) 替换 16 的?这是因为 bsearch
应用于 char **
,例如char *
的数组,因此,基本的 bsearch 项是 char *
。因此,bsearch
的 return 值是 pointer to elementary item, e.g. pointer to
char *, e.g.
char **`.
引自手册页:
The bsearch() function returns a pointer to a matching member of the array
接下来是 printf:
printf("\n%s is valid\n", item);
我替换为:
printf("\n%s 是 valid\n", *item);
*item
而不是 item
是由于相同的原因 - bsearch returns us 指针指向它找到的内容。我们需要将这个指针解析为实际值。
最后是你的 search
:
printf("%s | %s | %d\n", (char *)usr_word,(char *) words, strcmp(usr_word,words));
return strcmp(usr_word,words);
再次使用正确的指针级别 - 我们有两级,我们需要一级:
printf("%s | %s | %d\n", (char *)usr_word,*(char **) words, strcmp(usr_word,words));
return strcmp(usr_word,*(char**)words);
为了您的方便,下面是整个有效的程序:
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <string.h>
#define LEN 128
int search(const void *usr_word,const void *words);
struct data_t {
int nval; /* current number of values in array */
int max; /* allocated number of values */
char **data; /* the data array */
};
enum {INIT = 1, GROW = 2};
int main(void)
{
FILE *fp = fopen("scrabble.txt", "r");
assert(fp);
char *usr_word = NULL;
char buf[LEN];
int i = 0;
char number[LEN];
char** item = NULL;
struct data_t *data = malloc(sizeof(struct data_t));
data->nval = INIT;
data->max = INIT;
data->data = NULL;
while (fgets(buf, LEN, fp)) {
if (data->data == NULL) {
data->data = malloc(sizeof(char *) * (data->nval));
assert(data->data);
}
else if (data->nval > data->max) {
data->data = realloc(data->data, GROW * data->max * sizeof(char *));
assert(data->data);
data->max = GROW * data->max;
}
data->data[i] = strndup(buf, strlen(buf) - 1);
i++;
data->nval++;
}
/* overcounted */
data->nval--;
printf("Enter word: ");
fgets(buf, LEN, stdin);
usr_word = strndup(buf, strlen(buf)-1);
/*search for word*/
item = (char **) bsearch(usr_word, data->data, data->nval, sizeof(char*), search);
if (item != NULL)
printf("\n%s is valid\n", *item);
else if (item == NULL)
printf("\n%s is not valid\n", usr_word);
for(i=0;i<data->nval;++i) free(data->data[i]);
free(data->data);
free(data);
free(usr_word);
return 0;
}
int search(const void *usr_word,const void *words)
{
printf("%s | %s | %d\n", (char *)usr_word,*(char **) words, strcmp(usr_word,words));
return strcmp(usr_word,*(char**)words);
}
我在搜索时遇到了问题。我很确定我已经将问题隔离到 bsearch 接受的字节数参数。数据数组是一个拼字字典,我 100% 确定整个字典已加载到内存中,但是当我使用 bsearch 来尝试查找某个特定单词是否在字典中,它仅适用于 'wontedly' 之前的单词,即使字典的最后一个单词是 'zzz' 所以一些以 'w' 'x' 开头的单词无法找到 'y' 和 'z'。就好像 bsearch 函数看不到数组的末尾,即使它在那里。另一件值得注意的事情是,在我的比较函数中,我打印出 bsearch 传递给它的内容以查看正在比较的单词,并且在第一次比较时,bsearch 似乎没有发送类似于 [=19 的中间值=],相反,它从 'lodge' 开始,这不是字典中的中间词。 16 个字节是我输入的数字,通过反复试验似乎有效。问题是我不知道数组中每个元素的长度是多少,或者至少我认为这是问题所在。
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <string.h>
#define LEN 128
int search(const void *usr_word,const void *words);
struct data_t {
int nval; /* current number of values in array */
int max; /* allocated number of values */
char **data; /* the data array */
};
enum {INIT = 1, GROW = 2};
int main(void)
{
FILE *fp = fopen("scrabble.txt", "r");
assert(fp);
char *usr_word = NULL;
char buf[LEN];
int i = 0;
char number[LEN];
char* item = NULL;
struct data_t *data = malloc(sizeof(struct data_t));
data->nval = INIT;
data->max = INIT;
data->data = NULL;
while (fgets(buf, LEN, fp)) {
if (data->data == NULL) {
data->data = malloc(strlen(buf) - 1);
assert(data->data);
}
else if (data->nval > data->max) {
data->data = realloc(data->data, GROW * data->max * LEN);
assert(data->data);
data->max = GROW * data->max;
}
data->data[i] = strndup(buf, strlen(buf) - 1);
i++;
data->nval++;
}
/* overcounted */
data->nval--;
printf("Enter word: ");
fgets(buf, LEN, stdin);
usr_word = strndup(buf, strlen(buf)-1);
/*search for word*/
item = (char *) bsearch(usr_word, data->data[0], data->nval, 16, search);
if (item != NULL)
printf("\n%s is valid\n", item);
else if (item == NULL)
printf("\n%s is not valid\n", usr_word);
return 0;
}
int search(const void *usr_word,const void *words)
{
printf("%s | %s | %d\n", (char *)usr_word,(char *) words, strcmp(usr_word,words));
return strcmp(usr_word,words);
}
好的,您的代码存在多个问题,所有问题都源于您对结构 data_t.data.
中使用的char **
的误解
char **
是指向指针的指针数组。它无论如何都不是字符串数组。
意思如下:
data->data = malloc(strlen(buf) - 1);
应替换为以下内容:
data->data = malloc(sizeof(char *) * (data->nval));
同realloc
:
data->data = realloc(data->data, GROW * data->max * LEN);
替换为
data->data = realloc(data->data, GROW * data->max * sizeof(char *));
接下来,bsearch 调用:
item = (char *) bsearch(usr_word, data->data[0], data->nval, 16, search);
替换为:
item = (char **) bsearch(usr_word, data->data, data->nval, sizeof(char*), search);
看看我是如何用 sizeof(char*) 替换 16 的?这是因为 bsearch
应用于 char **
,例如char *
的数组,因此,基本的 bsearch 项是 char *
。因此,bsearch
的 return 值是 pointer to elementary item, e.g. pointer to
char *, e.g.
char **`.
引自手册页:
The bsearch() function returns a pointer to a matching member of the array
接下来是 printf:
printf("\n%s is valid\n", item);
我替换为: printf("\n%s 是 valid\n", *item);
*item
而不是 item
是由于相同的原因 - bsearch returns us 指针指向它找到的内容。我们需要将这个指针解析为实际值。
最后是你的 search
:
printf("%s | %s | %d\n", (char *)usr_word,(char *) words, strcmp(usr_word,words));
return strcmp(usr_word,words);
再次使用正确的指针级别 - 我们有两级,我们需要一级:
printf("%s | %s | %d\n", (char *)usr_word,*(char **) words, strcmp(usr_word,words));
return strcmp(usr_word,*(char**)words);
为了您的方便,下面是整个有效的程序:
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <string.h>
#define LEN 128
int search(const void *usr_word,const void *words);
struct data_t {
int nval; /* current number of values in array */
int max; /* allocated number of values */
char **data; /* the data array */
};
enum {INIT = 1, GROW = 2};
int main(void)
{
FILE *fp = fopen("scrabble.txt", "r");
assert(fp);
char *usr_word = NULL;
char buf[LEN];
int i = 0;
char number[LEN];
char** item = NULL;
struct data_t *data = malloc(sizeof(struct data_t));
data->nval = INIT;
data->max = INIT;
data->data = NULL;
while (fgets(buf, LEN, fp)) {
if (data->data == NULL) {
data->data = malloc(sizeof(char *) * (data->nval));
assert(data->data);
}
else if (data->nval > data->max) {
data->data = realloc(data->data, GROW * data->max * sizeof(char *));
assert(data->data);
data->max = GROW * data->max;
}
data->data[i] = strndup(buf, strlen(buf) - 1);
i++;
data->nval++;
}
/* overcounted */
data->nval--;
printf("Enter word: ");
fgets(buf, LEN, stdin);
usr_word = strndup(buf, strlen(buf)-1);
/*search for word*/
item = (char **) bsearch(usr_word, data->data, data->nval, sizeof(char*), search);
if (item != NULL)
printf("\n%s is valid\n", *item);
else if (item == NULL)
printf("\n%s is not valid\n", usr_word);
for(i=0;i<data->nval;++i) free(data->data[i]);
free(data->data);
free(data);
free(usr_word);
return 0;
}
int search(const void *usr_word,const void *words)
{
printf("%s | %s | %d\n", (char *)usr_word,*(char **) words, strcmp(usr_word,words));
return strcmp(usr_word,*(char**)words);
}