通过 fgets 从 txt 文件中检索到的文本的某些部分在 c 中丢失了
some parts of the text retrieved from txt file via fgets got lost in c
我正在通过 fgets 读取一个名为 "dictionary.txt" 的文件并打印出来,但是当我 运行 程序时,"dictionary.txt" 的标题文本的 10% 丢失了。
我怀疑是不是缓冲区的大小太小了,但是把MAX_INT改大也没有用。
#include <stdio.h>
#include<string.h>
#define MAX_INT 50000
void main() {
FILE *fp;
char* inp = (char*)malloc(sizeof(char)*MAX_INT);
int i;
int isKorean = 0;
char* buffer[MAX_INT];
char* ptr = (char*)malloc(sizeof(char)*MAX_INT);
if (fp = fopen("C://Users//user//Desktop//dictionary.txt", "r")) {
while (fgets(buffer, sizeof(buffer), fp)) {
ptr = strtok(buffer, "/"); //a line is looking like this : Umberto/영어("English" written in Korean)
for (i = 0; i < strlen(ptr); i++) {
if ((ptr[i] & 0x80) == 0x80) isKorean = 1; //check whether it's korean
if (!isKorean) printf("%c", ptr[i]); //if it's not korean, then print one byte
else {
printf("%c%c", ptr[i], ptr[i + 1]); //if it's korean, then print two bytes
i++;
}
isKorean = 0;
printf("\n");
}
ptr = strtok(NULL, " ");
printf("tagger:%s\n", ptr); //print the POS tagger of the word(it's in dictionary)
}
fclose(fp);
}
}
好的,我找到答案了。
通过在 "ptr = strtok(NULL, " 之后添加下面的 ");"刚刚工作。我还必须对标记器部分做一些事情,因为它也是用韩语写的。
ptr = strtok(NULL, " ");
for (i = 0; i < strlen(ptr); i++) {
printf("%c%c", ptr[i], ptr[i + 1]); //if it's korean, then print two bytes
i++;
}
函数 fgets 具有以下同步:
char *
fgets(char * restrict str, int size, FILE * restrict stream);
那么为什么要把buffer做成指针数组呢?
char buffer[MAX_INT]
正是我们所需要的。
以及以下声明:
if (fp = fopen("/Users/weiyang/code/txt", "r"))
不安全,赋值后最好加括号
我正在通过 fgets 读取一个名为 "dictionary.txt" 的文件并打印出来,但是当我 运行 程序时,"dictionary.txt" 的标题文本的 10% 丢失了。
我怀疑是不是缓冲区的大小太小了,但是把MAX_INT改大也没有用。
#include <stdio.h>
#include<string.h>
#define MAX_INT 50000
void main() {
FILE *fp;
char* inp = (char*)malloc(sizeof(char)*MAX_INT);
int i;
int isKorean = 0;
char* buffer[MAX_INT];
char* ptr = (char*)malloc(sizeof(char)*MAX_INT);
if (fp = fopen("C://Users//user//Desktop//dictionary.txt", "r")) {
while (fgets(buffer, sizeof(buffer), fp)) {
ptr = strtok(buffer, "/"); //a line is looking like this : Umberto/영어("English" written in Korean)
for (i = 0; i < strlen(ptr); i++) {
if ((ptr[i] & 0x80) == 0x80) isKorean = 1; //check whether it's korean
if (!isKorean) printf("%c", ptr[i]); //if it's not korean, then print one byte
else {
printf("%c%c", ptr[i], ptr[i + 1]); //if it's korean, then print two bytes
i++;
}
isKorean = 0;
printf("\n");
}
ptr = strtok(NULL, " ");
printf("tagger:%s\n", ptr); //print the POS tagger of the word(it's in dictionary)
}
fclose(fp);
}
}
好的,我找到答案了。
通过在 "ptr = strtok(NULL, " 之后添加下面的 ");"刚刚工作。我还必须对标记器部分做一些事情,因为它也是用韩语写的。
ptr = strtok(NULL, " ");
for (i = 0; i < strlen(ptr); i++) {
printf("%c%c", ptr[i], ptr[i + 1]); //if it's korean, then print two bytes
i++;
}
函数 fgets 具有以下同步:
char *
fgets(char * restrict str, int size, FILE * restrict stream);
那么为什么要把buffer做成指针数组呢?
char buffer[MAX_INT]
正是我们所需要的。
以及以下声明:
if (fp = fopen("/Users/weiyang/code/txt", "r"))
不安全,赋值后最好加括号