如何从我无法在 xslt 中处理的 us-ascii 文档中删除不可见的 'hex c' 字符
How to strip invisible 'hex c' character from us-ascii document that I cannot process in xslt
我正在阅读 us-ascii 文档并尝试解析为 XML
<xsl:analyze-string select="unparsed-text($filename,'us-ascii')" regex="{$regex_clp}">
但是我遇到了错误
XTDE1190: The unparsed-text file contains a character that is illegal in XML (line=51 column=2 value=hex c)
为了识别这个字符,我对所有可见字符进行了查找和替换
和新行,我在文档中留下了一个空白字符,导致在执行 xslt 脚本时在不同位置出现相同的错误。
XTDE1190: The unparsed-text file contains a character that is illegal in XML (line=1 column=2 value=hex c)
当我将这个 'hex c' 复制并粘贴到一个 java 应用程序中试图剥离它,然后尝试使用退格键删除它时,它并没有删除,而是我可以按下退格键多次,光标保持在我粘贴的 'hex c' 旁边的相同位置。
我已经在此处上传了具有 'hex c' 字符的文件
https://drive.google.com/file/d/1e0hkfraiSz39QEPV_zWn0ujyYcQknSCD/view?usp=sharing
知道这个字符是什么以及如何从文件中删除这个字符吗?
问候
康特
好的,所以在我创建这个问题时将文本文件发布到 google 之后,我下载了 out.txt 只是为了让它在从 [=21= 上传和下载后仍然有同样的问题].
然而这次我在文本文件中看到了一堆符号。我将它们复制到 OxygenXML 中查找并替换以查看这些是 \f form feed
找到并替换为\f,问题解决
\f 标识(换页,0x0C)。
问候
康特
我正在阅读 us-ascii 文档并尝试解析为 XML
<xsl:analyze-string select="unparsed-text($filename,'us-ascii')" regex="{$regex_clp}">
但是我遇到了错误
XTDE1190: The unparsed-text file contains a character that is illegal in XML (line=51 column=2 value=hex c)
为了识别这个字符,我对所有可见字符进行了查找和替换 和新行,我在文档中留下了一个空白字符,导致在执行 xslt 脚本时在不同位置出现相同的错误。
XTDE1190: The unparsed-text file contains a character that is illegal in XML (line=1 column=2 value=hex c)
当我将这个 'hex c' 复制并粘贴到一个 java 应用程序中试图剥离它,然后尝试使用退格键删除它时,它并没有删除,而是我可以按下退格键多次,光标保持在我粘贴的 'hex c' 旁边的相同位置。
我已经在此处上传了具有 'hex c' 字符的文件 https://drive.google.com/file/d/1e0hkfraiSz39QEPV_zWn0ujyYcQknSCD/view?usp=sharing
知道这个字符是什么以及如何从文件中删除这个字符吗?
问候 康特
好的,所以在我创建这个问题时将文本文件发布到 google 之后,我下载了 out.txt 只是为了让它在从 [=21= 上传和下载后仍然有同样的问题].
然而这次我在文本文件中看到了一堆符号。我将它们复制到 OxygenXML 中查找并替换以查看这些是 \f form feed
找到并替换为\f,问题解决
\f 标识(换页,0x0C)。
问候 康特