从文件中删除所有非 utf-8 字符且终端无输出
Remove all non utf-8 characters from file with no output in terminal
我是新 Ubuntu 用户,处理一个非常大的文件,其中包含一些可以安全跳过的非 utf8 字符。我发现了另一个堆栈溢出问题 How to remove non UTF-8 characters from text file,它提供了一种使用命令
删除这些字符的方法
iconv -f utf-8 -t utf-8 -c file.txt
但是考虑到我文件的大小,这会输出每一行,这会花费太多时间。我不太熟悉 Ubuntu 命令,所以如果有人可以指导我修改该命令以抑制输出,我将不胜感激
使用 shell 重定向将转换输出到新文件:
iconv -f utf-8 -t utf-8 -c file.txt > new-file.txt
然后检查新文件的结尾:
tail new-file.txt
检查顶部:
head new-file.txt
您可以将输出重定向到一个新文件,而不是在终端上打印每一行:
iconv -f utf-8 -t utf-8 -c file.txt > output.txt
我是新 Ubuntu 用户,处理一个非常大的文件,其中包含一些可以安全跳过的非 utf8 字符。我发现了另一个堆栈溢出问题 How to remove non UTF-8 characters from text file,它提供了一种使用命令
删除这些字符的方法iconv -f utf-8 -t utf-8 -c file.txt
但是考虑到我文件的大小,这会输出每一行,这会花费太多时间。我不太熟悉 Ubuntu 命令,所以如果有人可以指导我修改该命令以抑制输出,我将不胜感激
使用 shell 重定向将转换输出到新文件:
iconv -f utf-8 -t utf-8 -c file.txt > new-file.txt
然后检查新文件的结尾:
tail new-file.txt
检查顶部:
head new-file.txt
您可以将输出重定向到一个新文件,而不是在终端上打印每一行:
iconv -f utf-8 -t utf-8 -c file.txt > output.txt