Kafka 连接 - 文件脉冲 - 'xml attribute' 提取

Kafka connect - file pulse - 'xml attribute' extraction

我正在尝试使用文件脉冲连接器读取 XML 文件。 我是 Kafka/Kafka Connect/XML 处理的新手

对于像下面这样的文件,我想保留数据 "unit""string1", "string2" ]. 目前,默认情况下,处理后的有效载荷会丢弃它们。

<?xml version="1.0" encoding="UTF-8"?>
<data>
    <someField>someValue</someField>
    <anotherField-I-Forced-the-type-to-Array>
        <value unit="string1">123</value>
        <value unit="string2">456</value>
    </anotherField-I-Forced-the-type-to-Array>
    <lastField>lastValue</lastField>
</data>

是否已经存在某种配置? 我没有在文档中找到配置 https://streamthoughts.github.io/kafka-connect-file-pulse/docs/developer-guide/file-readers/

如果已经有解决方案,请帮助并给出一些例子。

目前我得到了这个负载。可以看到unit和它的值string1string2都没有了

"anotherField-I-Forced-the-type-to-Array": [
{
  "value": [
    "123",
    "456"
  ]
}
],

ps。我使用的版本是 1.5.2 从这里下载的 zip https://github.com/streamthoughts/kafka-connect-file-pulse/releases

好奇,基于这篇文章:https://medium.com/streamthoughts/streaming-data-into-kafka-s01-e02-loading-xml-file-21b5e69c645 播放列表确实有 'name' 属性,并且没有丢失。 <playlist name="BestOfStarWars">

仅供参考,这个问题现在很快就在 1.5.3 版本中修复了