美文网首页
在机器学习中如何处理xml格式数据

在机器学习中如何处理xml格式数据

作者: 崔吉龙 | 来源:发表于2019-03-08 11:10 被阅读0次

问题描述

在机器学习中,经常会抓去web网页,然后把网页信息转化为格式化的数据,今天我们就学习如何处理xml格式的数据。

原始数据

输入的数据文件 XMLData.xml

<MyDataset>
    <Record>
        <Number>1</Number>
        <String>First</String>
        <Boolean>True</Boolean>
    </Record>
    <Record>
        <Number>2</Number>
        <String>Second</String>
        <Boolean>False</Boolean>
    </Record>
    <Record>
        <Number>3</Number>
        <String>Third</String>
        <Boolean>False</Boolean>
    </Record>
</MyDataset>

导入函数库

from lxml import objectify

使用函数库

这里为了方便我们使用了本地的xml文件。

xml = objectify.parse(open('XMLData.xml'))
root=xml.getroot()
for obj in root.getchildren()
    print(obj.getchildren())  # list  

输出

[1, 'First', 'True']
[2, 'Second', 'False']
[3, 'Third', 'False']

相关文章

网友评论

      本文标题:在机器学习中如何处理xml格式数据

      本文链接:https://www.haomeiwen.com/subject/ebureqtx.html