二进制文件读取错误,是字节序问题还是文件读取问题?
Binary file reading error, Is it an endian issue or a file reading issue?
目前我正在研究一个简单的 c VM 的启动,它将二进制文件读入 "memory" 数组,然后获取解码并评估给定的指令。目前我陷入了如何正确地将这个二进制文件读入内存以便能够读取以供以后在基于 2 或 4 个字节的解码和分离中使用。我的输入与我在下面得到的输出不匹配,我不确定这是字节序问题还是我没有正确地将文件读入内存。
MAIN.c
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#define MAXMEM 1024
unsigned memory[MAXMEM];
int loads(char *filename)
{
File *file = fopen(filename, "rb");
return fread(memory, sizeof *memory, MAXMEM, file);
}
int main(int argc, char **argv){
if(argc <= 1){
printf("No file Found\n");
return -1;
}
char *filename = argv[1];
loads(filename);
printf("%04x\n", *memory);
}
INPUT.BIN(数据来自 运行 od -x --endian=big input.bin | head -5
)
00000000 b10a b200 1123
当前输出
b20ab1
期望输出
either b10a b200 1123
or b1 0a b2 00 11 23
显示问题全在这句话:
printf("%04x\n", *memory);
首先使用表示您想要显示的格式的格式字符串。也许:
"%02x %02x %02x x\n"
建议代码如下:
- 干净地编译
- 执行所需的功能
- 正确处理 I.O 错误
- 不包括头文件那些内容没有用到
现在,建议的代码:
#include <stdio.h>
//#include <string.h>
#include <stdlib.h> // exit(), EXIT_FAILURE
#define MAXMEM 1024
char memory[MAXMEM];
size_t loads(char *filename)
{
FILE *file = fopen(filename, "rb");
if( !file )
{
perror( "fopen for read failed" );
exit( EXIT_FAILURE );
}
return fread(memory, sizeof *memory, MAXMEM, file);
}
int main(int argc, char **argv){
if( argc != 2 )
{
fprintf( stderr, "USAGE: %s inputFileName\n", argv[0] );
exit( EXIT_FAILURE );
}
char *filename = argv[1];
size_t fileSize = loads(filename);
printf( "File Size: %zu\n", fileSize );
printf("%02x %02x %02x %02x\n",
memory[0],
memory[1],
memory[2],
memory[3]);
}
当 运行 针对同一个源文件导致:
File Size: 701
23 69 6e 63
注意:23 69 6e 63
是 #inc
的十六进制值
我将内存修改为 char
类型。如果你想保留它 unsigned
然后注意一个 32 位无符号包含 8 个半字节,所以调用 printf()
的格式字符串应该是 %08x
对于每个要显示的无符号值
目前我正在研究一个简单的 c VM 的启动,它将二进制文件读入 "memory" 数组,然后获取解码并评估给定的指令。目前我陷入了如何正确地将这个二进制文件读入内存以便能够读取以供以后在基于 2 或 4 个字节的解码和分离中使用。我的输入与我在下面得到的输出不匹配,我不确定这是字节序问题还是我没有正确地将文件读入内存。
MAIN.c
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#define MAXMEM 1024
unsigned memory[MAXMEM];
int loads(char *filename)
{
File *file = fopen(filename, "rb");
return fread(memory, sizeof *memory, MAXMEM, file);
}
int main(int argc, char **argv){
if(argc <= 1){
printf("No file Found\n");
return -1;
}
char *filename = argv[1];
loads(filename);
printf("%04x\n", *memory);
}
INPUT.BIN(数据来自 运行 od -x --endian=big input.bin | head -5
)
00000000 b10a b200 1123
当前输出
b20ab1
期望输出
either b10a b200 1123
or b1 0a b2 00 11 23
显示问题全在这句话:
printf("%04x\n", *memory);
首先使用表示您想要显示的格式的格式字符串。也许:
"%02x %02x %02x x\n"
建议代码如下:
- 干净地编译
- 执行所需的功能
- 正确处理 I.O 错误
- 不包括头文件那些内容没有用到
现在,建议的代码:
#include <stdio.h>
//#include <string.h>
#include <stdlib.h> // exit(), EXIT_FAILURE
#define MAXMEM 1024
char memory[MAXMEM];
size_t loads(char *filename)
{
FILE *file = fopen(filename, "rb");
if( !file )
{
perror( "fopen for read failed" );
exit( EXIT_FAILURE );
}
return fread(memory, sizeof *memory, MAXMEM, file);
}
int main(int argc, char **argv){
if( argc != 2 )
{
fprintf( stderr, "USAGE: %s inputFileName\n", argv[0] );
exit( EXIT_FAILURE );
}
char *filename = argv[1];
size_t fileSize = loads(filename);
printf( "File Size: %zu\n", fileSize );
printf("%02x %02x %02x %02x\n",
memory[0],
memory[1],
memory[2],
memory[3]);
}
当 运行 针对同一个源文件导致:
File Size: 701
23 69 6e 63
注意:23 69 6e 63
是 #inc
我将内存修改为 char
类型。如果你想保留它 unsigned
然后注意一个 32 位无符号包含 8 个半字节,所以调用 printf()
的格式字符串应该是 %08x
对于每个要显示的无符号值