Pergunta sobre xml, pandas, dataframe, python – XML para o dataframe do pandas

5

Eu tenho um arquivo XML com milhares de linhas como:

<Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">WORD</Word>

Eu quero convertê-lo (todos os atributos) parapandas dataframe. Para fazer isso eu poderia percorrer o arquivo usando uma sopa bonita e inserir os valores linha por linha ou criar listas para serem inseridas como colunas. No entanto, gostaria de saber se existe uma maneira mais pythonic de realizar o que eu descrevi. Agradeço antecipadamente.

Exemplo de código:

x1list=[]
x2list=[]

for word in soup.page.findAll('word'):
    x1list.append(int(word['x1']))
    x2list.append(int(word['x2']))
df=DataFrame({'x1':x1list,'x2':x2list})
Mostre-nos o seu código. eumiro
@eumiro: adicionou um exemplo de código ... root

Sua resposta

1   a resposta
3

Tente isto:

DataFrame.from_records([(int(word['x1']), int(word['x2']))
                        for word in soup.page.findAll('word')],
                       columns=('x1', 'x2'))
Obrigado. Eu vou tentar. root

Perguntas relacionadas