C 编程:从文件中读取数据,动态分配内存,将内容放入结构数组

C Programming: Reading data from a file, dynamically allocating memory, placing contents in struct array

这是我在 Whosebug 上的第一个 post。我是一名学习 C 的 CS 学生,我遇到了一些我正在处理的问题。另外,我应该说我知道的很少,所以如果我放在这里的任何东西被认为是愚蠢或无知的,那绝对不是我的本意

我知道还有其他 post 与此类似,但是到目前为止,我觉得我已经尝试进行了很多修改,但都以相同的结果结束。

我得到一个文本文件,其中每一行都包含 studentName(tab)gpa。文件总大小未知,这个我必须使用动态内存分配。

文本文件格式示例

Jordan  4.0
Bhupesh 2.51

程序的一般步骤

为了避免尴尬,我将省略许多细节,但我将对我正在努力处理的过程进行高级概述:

 1.) Create dynamic memory array to hold struct for each line
 2.) Start looping through file
 3.) check the current size of the array to see if reallocation is necessary
 4.) Create dynamic array to hold name
 5.) Place name and gpa into struct
 6.) rinse & repeat

最后,最后一件事。当达到我最初分配的内存限制并且程序尝试从堆中重新分配更多内存时会发生错误。

Screenshot of error being thrown in clion debugger

我的代码如下所示:

#define EXIT_CODE_FAIL 1
#define ROW_COUNT 10
#define BUFFER_SIZE 255
#define VALID_ARG_COUNT 2

struct Student {
    float gpa;
    char * name;
};

// read the file, pack contents into struct array
struct Student * readFileContents(char *filename, int *rowCounter) {

    // setup for loop
    int maxDataSize = ROW_COUNT;
    float currentStudentGpa = 0;
    char studentNameBuffer[BUFFER_SIZE];

    // initial structArray pre-loop
    struct Student * structArray = calloc(maxDataSize, sizeof(*structArray));

    FILE *pFile = fopen(filename, "r");
    validateOpenFile(pFile);


    // loop through, get contents, of eaach line, place them in struct
    while (fscanf(pFile, "%s\t%f", studentNameBuffer, &currentStudentGpa) > 0) {
        structArray = checkArraySizeIncrease(*rowCounter, &maxDataSize, &structArray);
        structArray->name = trimStringFromBuffer(studentNameBuffer);
        structArray->gpa = currentStudentGpa;
        (*rowCounter)++, structArray++;
    }

    fclose(pFile);

    return structArray;
}

// resize array if needed
struct Student * checkArraySizeIncrease(int rowCount, int * maxDataSize, struct Student ** structArray) {

    if (rowCount == *maxDataSize) {
        *maxDataSize += ROW_COUNT;
        
        **// line below is where the error occurs** 
        struct Student * newStructArray = realloc(*structArray, *maxDataSize * sizeof(*newStructArray));
        validateMalloc(newStructArray);

        return newStructArray;
    }
    return *structArray;
}

// resize string from initial data buffer
char *trimStringFromBuffer(char *dataBuffer) {

    char *string = (char *) calloc(strlen(dataBuffer), sizeof(char));
    validateMalloc(string);
    strcpy(string, dataBuffer);

    return string;
}


再次,如果有人问过类似的问题,我深表歉意,但请注意,我已经尝试了我在堆栈溢出时发现的大部分建议,但都没有成功(我很清楚这是我的结果C 的编程技能水平很差)。

我现在将立即为我的强制性“第一个 post on Whosebug”烘焙做好准备。干杯!

我认为您的问题与计算 realloc 的大小有关。与其使用 sizeof(*newStructArray),你真的不应该使用你的指针类型的大小吗?我会写成 realloc(*structArray, *maxDataSize * sizeof(struct Student *))

这里还有很多我永远不会做的其他事情 - 将所有这些变量作为指针传递给 checkArraySizeIncrease 通常不是一个好主意,因为它可以掩盖事情正在发生变化的事实,例如.

为字符串分配缓冲区时出现问题

char *string = (char *) calloc(strlen(dataBuffer), sizeof(char));

应该是:

char *string = (char *) calloc(1 + strlen(dataBuffer), sizeof(char));

因为 C 字符串在末尾需要额外的 0 字节。 没有它,下面的操作:

strcpy(string, dataBuffer);

可能会损坏缓冲区后的数据,可能会弄乱 malloc() 元数据。

您正在重复使用 structArray 作为数组 指向 current 元素的指针。这行不通。我们需要 两个 个变量。

有许多与动态数组相关的“松散”变量。定义一个 struct(例如下面的 dynarr_t)来包含它们并只传递 struct 指针会更清晰。

当您复制字符串时,您必须分配 strlen + 1 [ 而不是 只是 strlen]。但是,整个函数执行 strdup 已经执行的操作。

我尝试尽可能多地保存,但我不得不稍微重构代码以合并所有必要的更改。

通过将 sizeof(*structArray) 传递给 arrnew 函数,这允许该结构用于任意大小的数组元素。

无论如何,这是代码:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

#define sysfault(_fmt...) \
    do { \
        printf(_fmt); \
        exit(1); \
    } while (0)

#define EXIT_CODE_FAIL 1
#define ROW_COUNT 10
#define BUFFER_SIZE 255
#define VALID_ARG_COUNT 2

struct Student {
    float gpa;
    char *name;
};

// general dynamic array control
typedef struct {
    void *base;                         // base address
    size_t size;                        // bytes in array element
    size_t count;                       // current number of used entries
    size_t max;                         // maximum number of entries
    size_t grow;                        // number of entries to grow
} dynarr_t;

// arrfind -- return pointer to array element
void *
arrfind(dynarr_t *arr,size_t idx)
{
    void *ptr;

    ptr = arr->base;
    idx *= arr->size;
    ptr += idx;

    return ptr;
}

// arrnew -- create new array control
dynarr_t *
arrnew(size_t siz,size_t grow)
// siz -- sizeof of array element
// grow -- number of elements to grow
{
    dynarr_t *arr;

    arr = calloc(1,sizeof(*arr));
    if (arr == NULL)
        sysfault("arrnew: calloc fail -- %s\n",strerror(errno));

    arr->size = siz;
    arr->grow = grow;

    return arr;
}

// arrgrow -- grow array [if necessary]
// RETURNS: pointer to element to fill
void *
arrgrow(dynarr_t *arr)
{
    void *ptr;

    // grow array if necessary
    // NOTE: use of a separate "max" from "count" reduces the number of realloc
    // calls
    if (arr->count >= arr->max) {
        arr->max += arr->grow;
        arr->base = realloc(arr->base,arr->size * arr->max);
        if (arr->base == NULL)
            sysfault("arrgrow: realloc failure -- %s\n",strerror(errno));
    }

    // point to current element
    ptr = arrfind(arr,arr->count);

    // advance count of elements
    ++arr->count;

    return ptr;
}

// arrtrim -- trim array to actual number of elements used
void
arrtrim(dynarr_t *arr)
{

    arr->base = realloc(arr->base,arr->size * arr->count);
    if (arr->base == NULL)
        sysfault("arrtrim: realloc failure -- %s\n",strerror(errno));

    arr->max = arr->count;
}

void
validateMalloc(void *ptr)
{

    if (ptr == NULL) {
        perror("validateMalloc");
        exit(1);
    }
}

void
validateOpenFile(FILE *ptr)
{

    if (ptr == NULL) {
        perror("validateOpenFile");
        exit(1);
    }
}

// resize string from initial data buffer
char *
trimStringFromBuffer(char *dataBuffer)
{

#if 0
#if 0
    char *string = calloc(1,strlen(dataBuffer));
#else
    char *string = calloc(1,strlen(dataBuffer) + 1);
#endif
    validateMalloc(string);
    strcpy(string, dataBuffer);
#else
    char *string = strdup(dataBuffer);
    validateMalloc(string);
#endif

    return string;
}

// read the file, pack contents into struct array
dynarr_t *
readFileContents(char *filename)
{
    dynarr_t *arr;

    // setup for loop
    float currentStudentGpa = 0;
    char studentNameBuffer[BUFFER_SIZE];
    struct Student *structArray;

    arr = arrnew(sizeof(*structArray),10);

    FILE *pFile = fopen(filename, "r");
    validateOpenFile(pFile);

    // loop through, get contents, of eaach line, place them in struct
    while (fscanf(pFile, "%s\t%f", studentNameBuffer, &currentStudentGpa) > 0) {
        structArray = arrgrow(arr);
        structArray->name = trimStringFromBuffer(studentNameBuffer);
        structArray->gpa = currentStudentGpa;
    }

    fclose(pFile);

    arrtrim(arr);

    return arr;
}