如何在 .dic 文件中使用包含特殊字符 (ü) 的单词?(Python)
How can I use a word that contains a special character(ü) in a .dic file?(Python)
我正在尝试使用翻译的 LIWC 词典对文本进行分类。但是我正在使用的库($pip install liwc)无法解析包含特殊土耳其语字符的单词,例如“ü”。
这是我用于测试目的的 .dic 文件。
%
4 sad
19 health
%
terketmek 4
kürtaj 19
因此,当我尝试解析“kabul terketmek naber yawru a asit kürtaj yapabilmek”这句话时。它不对单词“kürtaj”进行分类,因为它包含“ü”。
我试图自己解决它,但我发现我正在使用的库在读取我提供的 .dic 文件中的行时会像这样解析“kürtaj”这个词。
所以,这可能就是图书馆不对“kürtaj”一词进行分类的原因,因为它在翻译中丢失了:)
提前致谢!
我刚刚尝试将 encoding='utf8'
作为参数添加到 open
函数中,它读取文件并且有效。
我正在尝试使用翻译的 LIWC 词典对文本进行分类。但是我正在使用的库($pip install liwc)无法解析包含特殊土耳其语字符的单词,例如“ü”。
这是我用于测试目的的 .dic 文件。
%
4 sad
19 health
%
terketmek 4
kürtaj 19
因此,当我尝试解析“kabul terketmek naber yawru a asit kürtaj yapabilmek”这句话时。它不对单词“kürtaj”进行分类,因为它包含“ü”。
我试图自己解决它,但我发现我正在使用的库在读取我提供的 .dic 文件中的行时会像这样解析“kürtaj”这个词。
所以,这可能就是图书馆不对“kürtaj”一词进行分类的原因,因为它在翻译中丢失了:)
提前致谢!
我刚刚尝试将 encoding='utf8'
作为参数添加到 open
函数中,它读取文件并且有效。