Kafka 连接 - 文件脉冲 - 'xml attribute' 提取
Kafka connect - file pulse - 'xml attribute' extraction
我正在尝试使用文件脉冲连接器读取 XML 文件。
我是 Kafka/Kafka Connect/XML 处理的新手
对于像下面这样的文件,我想保留数据 "unit" 和 "string1", "string2" ].
目前,默认情况下,处理后的有效载荷会丢弃它们。
<?xml version="1.0" encoding="UTF-8"?>
<data>
<someField>someValue</someField>
<anotherField-I-Forced-the-type-to-Array>
<value unit="string1">123</value>
<value unit="string2">456</value>
</anotherField-I-Forced-the-type-to-Array>
<lastField>lastValue</lastField>
</data>
是否已经存在某种配置?
我没有在文档中找到配置 https://streamthoughts.github.io/kafka-connect-file-pulse/docs/developer-guide/file-readers/
如果已经有解决方案,请帮助并给出一些例子。
目前我得到了这个负载。可以看到unit
和它的值string1
,string2
都没有了
"anotherField-I-Forced-the-type-to-Array": [
{
"value": [
"123",
"456"
]
}
],
ps。我使用的版本是 1.5.2 从这里下载的 zip https://github.com/streamthoughts/kafka-connect-file-pulse/releases
好奇,基于这篇文章:https://medium.com/streamthoughts/streaming-data-into-kafka-s01-e02-loading-xml-file-21b5e69c645
播放列表确实有 'name' 属性,并且没有丢失。
<playlist name="BestOfStarWars">
仅供参考,这个问题现在很快就在 1.5.3 版本中修复了
我正在尝试使用文件脉冲连接器读取 XML 文件。 我是 Kafka/Kafka Connect/XML 处理的新手
对于像下面这样的文件,我想保留数据 "unit" 和 "string1", "string2" ]. 目前,默认情况下,处理后的有效载荷会丢弃它们。
<?xml version="1.0" encoding="UTF-8"?>
<data>
<someField>someValue</someField>
<anotherField-I-Forced-the-type-to-Array>
<value unit="string1">123</value>
<value unit="string2">456</value>
</anotherField-I-Forced-the-type-to-Array>
<lastField>lastValue</lastField>
</data>
是否已经存在某种配置? 我没有在文档中找到配置 https://streamthoughts.github.io/kafka-connect-file-pulse/docs/developer-guide/file-readers/
如果已经有解决方案,请帮助并给出一些例子。
目前我得到了这个负载。可以看到unit
和它的值string1
,string2
都没有了
"anotherField-I-Forced-the-type-to-Array": [
{
"value": [
"123",
"456"
]
}
],
ps。我使用的版本是 1.5.2 从这里下载的 zip https://github.com/streamthoughts/kafka-connect-file-pulse/releases
好奇,基于这篇文章:https://medium.com/streamthoughts/streaming-data-into-kafka-s01-e02-loading-xml-file-21b5e69c645
播放列表确实有 'name' 属性,并且没有丢失。
<playlist name="BestOfStarWars">
仅供参考,这个问题现在很快就在 1.5.3 版本中修复了