正在解析 plist xml
Parsing plist xml
如何以这种愚蠢的格式解析 xml:
<key>KEY1</key><string>VALUE OF KEY1</string>
<key>KEY2</key><string>VALUE OF KEY2</string>
<key>KEY3</key><integer>42</integer>
<key>KEY3</key><array>
<integer>1</integer>
<integer>2</integer>
</array>
如果所有值都具有相同的类型(例如字符串),解析将非常简单。但在我的例子中,每个值都可以是字符串、数据、整数、布尔值、数组或字典。
这个xml看起来很像json,但不幸的是格式是固定的,我不能改变它。我更喜欢没有任何外部包的解决方案。
使用 encoding/xml
提供的较低级别的解析接口,它允许您迭代 XML 流中的单个标记(例如 "start element"、"end element" 等).
参见 encoding/xml
的 Decoder
类型的 Token()
方法。
由于数据结构不好,不能修改格式,所以不能使用xml.Unmarshal,所以可以通过新建一个Decoder来处理XML个元素,然后遍历标记并使用 DecodeElement 将它们一一处理。在我下面的示例代码中,它将所有内容都放在地图中。代码也在github here...
package main
import (
"encoding/xml"
"strings"
"fmt"
)
type PlistArray struct {
Integer []int `xml:"integer"`
}
const in = "<key>KEY1</key><string>VALUE OF KEY1</string><key>KEY2</key><string>VALUE OF KEY2</string><key>KEY3</key><integer>42</integer><key>KEY3</key><array><integer>1</integer><integer>2</integer></array>"
func main() {
result := map[string]interface{}{}
dec := xml.NewDecoder(strings.NewReader(in))
dec.Strict = false
var workingKey string
for {
token, _ := dec.Token()
if token == nil {
break
}
switch start := token.(type) {
case xml.StartElement:
fmt.Printf("startElement = %+v\n", start)
switch start.Name.Local {
case "key":
var k string
err := dec.DecodeElement(&k, &start)
if err != nil {
fmt.Println(err.Error())
}
workingKey = k
case "string":
var s string
err := dec.DecodeElement(&s, &start)
if err != nil {
fmt.Println(err.Error())
}
result[workingKey] = s
workingKey = ""
case "integer":
var i int
err := dec.DecodeElement(&i, &start)
if err != nil {
fmt.Println(err.Error())
}
result[workingKey] = i
workingKey = ""
case "array":
var ai PlistArray
err := dec.DecodeElement(&ai, &start)
if err != nil {
fmt.Println(err.Error())
}
result[workingKey] = ai
workingKey = ""
default:
fmt.Errorf("Unrecognized token")
}
}
}
fmt.Printf("%+v", result)
}
如何以这种愚蠢的格式解析 xml:
<key>KEY1</key><string>VALUE OF KEY1</string>
<key>KEY2</key><string>VALUE OF KEY2</string>
<key>KEY3</key><integer>42</integer>
<key>KEY3</key><array>
<integer>1</integer>
<integer>2</integer>
</array>
如果所有值都具有相同的类型(例如字符串),解析将非常简单。但在我的例子中,每个值都可以是字符串、数据、整数、布尔值、数组或字典。
这个xml看起来很像json,但不幸的是格式是固定的,我不能改变它。我更喜欢没有任何外部包的解决方案。
使用 encoding/xml
提供的较低级别的解析接口,它允许您迭代 XML 流中的单个标记(例如 "start element"、"end element" 等).
参见 encoding/xml
的 Decoder
类型的 Token()
方法。
由于数据结构不好,不能修改格式,所以不能使用xml.Unmarshal,所以可以通过新建一个Decoder来处理XML个元素,然后遍历标记并使用 DecodeElement 将它们一一处理。在我下面的示例代码中,它将所有内容都放在地图中。代码也在github here...
package main
import (
"encoding/xml"
"strings"
"fmt"
)
type PlistArray struct {
Integer []int `xml:"integer"`
}
const in = "<key>KEY1</key><string>VALUE OF KEY1</string><key>KEY2</key><string>VALUE OF KEY2</string><key>KEY3</key><integer>42</integer><key>KEY3</key><array><integer>1</integer><integer>2</integer></array>"
func main() {
result := map[string]interface{}{}
dec := xml.NewDecoder(strings.NewReader(in))
dec.Strict = false
var workingKey string
for {
token, _ := dec.Token()
if token == nil {
break
}
switch start := token.(type) {
case xml.StartElement:
fmt.Printf("startElement = %+v\n", start)
switch start.Name.Local {
case "key":
var k string
err := dec.DecodeElement(&k, &start)
if err != nil {
fmt.Println(err.Error())
}
workingKey = k
case "string":
var s string
err := dec.DecodeElement(&s, &start)
if err != nil {
fmt.Println(err.Error())
}
result[workingKey] = s
workingKey = ""
case "integer":
var i int
err := dec.DecodeElement(&i, &start)
if err != nil {
fmt.Println(err.Error())
}
result[workingKey] = i
workingKey = ""
case "array":
var ai PlistArray
err := dec.DecodeElement(&ai, &start)
if err != nil {
fmt.Println(err.Error())
}
result[workingKey] = ai
workingKey = ""
default:
fmt.Errorf("Unrecognized token")
}
}
}
fmt.Printf("%+v", result)
}