我的哈希表中的指针损坏或我遗漏了什么?
Broken Pointer in My HashTable or I'm Missing Something?
这是我的代码,
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
typedef struct DF
{
char str[101];
int D;
struct DF *next;
} DF;
DF *df[5];
int hash (char str[])
{
int sum=0, len=strlen (str);
for (int x=0; x<len; x++) sum+=str[x];
return sum%5;
}
DF* ND (char str[])
{
DF *node=(DF*) malloc (sizeof (DF));
strcpy (node->str, str); node->D=1;
node->next=NULL;
return node;
}
void add (char str[])
{
int idx=hash (str);
if (df[idx])
{
DF *temp=df[idx];
while (temp) temp=temp->next;
temp=ND (str);
}
else df[idx]=ND (str);
}
int main (void)
{
char str1[]="The"; add (str1);
char str2[]="App"; add (str2);
if (df[4])
{
printf ("[4] %s", df[4]->str);
DF *temp=df[4]->next;
while (temp)
{
printf (" -> %s", temp->str);
temp=temp->next;
}
puts ("");
}
return 0;
}
请注意void add (char[])
,为什么输出不是[4] The -> App
?即使我将 DF *temp=df[idx];
更改为 DF *temp=df[idx]->next;
也没有任何区别。但是如果我把它的功能改成这个,
void add (char str[])
{
int idx=hash (str);
if (df[idx])
{
DF *temp=df[idx];
while (temp->next) temp=temp->next;
temp->next=ND (str);
}
else df[idx]=ND (str);
}
它打印出[4] The -> App
。那么,这两种算法有什么区别?
第一种方式:
temp=ND (str);
只是分配一个局部变量,所以它对函数外部没有影响,因为你有内存泄漏(但列表没有修改,元素没有添加)
但在第二种方式中:
temp->next=ND (str);
修改链表
要工作你可以修改第一种方法来做:
void add (char str[])
{
int idx=hash (str);
if (df[idx])
{
DF **temp=&df[idx];
while (*temp) temp=&(*temp)->next;
*temp=ND (str);
}
else df[idx]=ND (str);
}
但这很复杂,除非你想删除 if
:
void add (char str[])
{
DF ** temp=&df[hash(str)];
while (*temp)
temp=&(*temp)->next;
*temp=ND (str);
}
注意在同义词列表的末尾添加一个新的单元格是没有用的,你没有全局顺序,你可以直接这样做:
void add (char str[])
{
DF * temp=ND (str);
int idx=hash (str);
temp->next = df[idx];
df[idx] = temp;
}
在ND :
strcpy (node->str, str); node->D=1;
是危险的,因为str可能太长而无法保存在node->str
中,你可以使用strncpy
反向操作,当要保存的字符串很小时,你就失忆了。
如何不对字段 str 使用数组,而是使用 char*
并复制字符串(例如 strdup
)?
在hash中你遍历字符串两次,你不需要计算strlen并且可以使用
for (int x=0; str[x] != 0; x++) sum+=str[x];
这是我的代码,
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
typedef struct DF
{
char str[101];
int D;
struct DF *next;
} DF;
DF *df[5];
int hash (char str[])
{
int sum=0, len=strlen (str);
for (int x=0; x<len; x++) sum+=str[x];
return sum%5;
}
DF* ND (char str[])
{
DF *node=(DF*) malloc (sizeof (DF));
strcpy (node->str, str); node->D=1;
node->next=NULL;
return node;
}
void add (char str[])
{
int idx=hash (str);
if (df[idx])
{
DF *temp=df[idx];
while (temp) temp=temp->next;
temp=ND (str);
}
else df[idx]=ND (str);
}
int main (void)
{
char str1[]="The"; add (str1);
char str2[]="App"; add (str2);
if (df[4])
{
printf ("[4] %s", df[4]->str);
DF *temp=df[4]->next;
while (temp)
{
printf (" -> %s", temp->str);
temp=temp->next;
}
puts ("");
}
return 0;
}
请注意void add (char[])
,为什么输出不是[4] The -> App
?即使我将 DF *temp=df[idx];
更改为 DF *temp=df[idx]->next;
也没有任何区别。但是如果我把它的功能改成这个,
void add (char str[])
{
int idx=hash (str);
if (df[idx])
{
DF *temp=df[idx];
while (temp->next) temp=temp->next;
temp->next=ND (str);
}
else df[idx]=ND (str);
}
它打印出[4] The -> App
。那么,这两种算法有什么区别?
第一种方式:
temp=ND (str);
只是分配一个局部变量,所以它对函数外部没有影响,因为你有内存泄漏(但列表没有修改,元素没有添加)
但在第二种方式中:
temp->next=ND (str);
修改链表
要工作你可以修改第一种方法来做:
void add (char str[])
{
int idx=hash (str);
if (df[idx])
{
DF **temp=&df[idx];
while (*temp) temp=&(*temp)->next;
*temp=ND (str);
}
else df[idx]=ND (str);
}
但这很复杂,除非你想删除 if
:
void add (char str[])
{
DF ** temp=&df[hash(str)];
while (*temp)
temp=&(*temp)->next;
*temp=ND (str);
}
注意在同义词列表的末尾添加一个新的单元格是没有用的,你没有全局顺序,你可以直接这样做:
void add (char str[])
{
DF * temp=ND (str);
int idx=hash (str);
temp->next = df[idx];
df[idx] = temp;
}
在ND :
strcpy (node->str, str); node->D=1;
是危险的,因为str可能太长而无法保存在node->str
中,你可以使用strncpy
反向操作,当要保存的字符串很小时,你就失忆了。
如何不对字段 str 使用数组,而是使用 char*
并复制字符串(例如 strdup
)?
在hash中你遍历字符串两次,你不需要计算strlen并且可以使用
for (int x=0; str[x] != 0; x++) sum+=str[x];