Virtuoso 十进制分隔符

Virtuoso decimal separator

我有一些 .ttl 文件,其中包含双精度数和浮点数,并以 .(点)作为小数点分隔符。

加载到 OpenLink Virtuoso v07.20.3213 时是否可以将小数点分隔符更改为 ,(逗号)?

如果 CSV 文件结构与默认 CSV 文件设置不同,加载程序将查找与 CSV 文件同名且文件扩展名为 .cfg 的配置文件。此文件应包含类似于以下参数的参数,指示 CSV 文件的结构:

[csv]
csv-delimiter=<delimiter char>
csv-quote=<quote char>
header=<zero based header offset>
offset=<zero based data offset>
  • 不可见的 "tab" 和 "space" 分隔符应由这些名称指定,不带引号。
  • 其他分隔符(逗号、句号等)只需输入即可。
  • "Smart"首尾不同的引号(包括但不限于« »‹ ›“ ”‘ ’)为目前不支持。

例子

考虑加载一个 gzip 压缩的 CSV 文件,csv-example.csv.gz,non-default CSV 结构如下:

'Southern North Island wood availability forecast for the period
2008-2040'       'Table 14: Wood availability and average clearfell age
for other species in Eastern Southern North Island'      'Year
ending' 'Recoverable volume'    'Average age' 'December'    '(000 m3
i.b.)'  '(years)' 2006  0   0 2007  0   0 2008  48  49 2009 45  46
...

在这个例子中

  • header 在第三行,#2 带有 zero-base
  • 数据从第五行开始,#4 带有 zero-base
  • 分隔符是制表符
  • 引号字符是 single-quote 或撇号

加载此文件需要创建配置文件,csv-example.cfg,包含以下条目:

[csv]
csv-delimiter=tab
csv-quote='
header=2
offset=4

More Info..

Turtle relies on XML Schema Datatypes,其中唯一有效的小数分隔符是点。

这些值的后续(重新)表示可能因语言环境而异(这可能会将小数点分隔符更改为逗号 and/or 添加千位分隔符),但这似乎是一个不同的问题...

(请注意,在撰写本文时,v07.20.3213 版本比较老;建议所有用户更新到当前的 v7.20.3217 或更高版本,无论是 Open Source or Commercial 版本。)

(ObDisclaimer:我为 OpenLink Software, producer of Virtuoso 工作。)