Pregunta sobre python, dataframe, pandas, xml – XML a pandas dataframe

5

Tengo un archivo XML con miles de líneas como:

<Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">WORD</Word>

Quiero convertirlo (todos sus atributos) apandas dataframe. Para hacer eso, pude recorrer el archivo usando una hermosa sopa e insertar los valores fila por fila o crear listas para insertarlas como columnas. Sin embargo, me gustaría saber si hay una forma más pitónica de lograr lo que describí. Gracias de antemano.

Ejemplo de código:

x1list=[]
x2list=[]

for word in soup.page.findAll('word'):
    x1list.append(int(word['x1']))
    x2list.append(int(word['x2']))
df=DataFrame({'x1':x1list,'x2':x2list})
@eumiro: agregó un ejemplo de código ... root
Muéstranos tu código. eumiro

Tu respuesta

1   la respuesta
3

Prueba esto:

DataFrame.from_records([(int(word['x1']), int(word['x2']))
                        for word in soup.page.findAll('word')],
                       columns=('x1', 'x2'))
Gracias. Voy a darle una oportunidad. root

Preguntas relacionadas