问题描述
我们在机器学习中往往把从网络上抓取的xml文件,转化为简单的格式化文件,从而更容易使用,我们应该如何操作呢?
导入函数库
from lxml import objectify
import pandas as pd
读取结构化的数据
datalist = []
xml = objectify.parse(open("XMLData.xml"))
root = xml.getroot()
for child in root.getchildren()
str = []
for obj in child.getchildren():
str.append(obj.text)
datalist.append(str)
把list转化为DataFrame数据结构
构建一个DataFrame数据库
df = pd.DataFrame(columns=(['Number','String','Boolean']))












网友评论