Jump to content

Programa para extrair números de HTML


tiagocunha888

Recommended Posts

Diariamente utilizo um software no meu trabalho que me cria um ficheiro htm, onde algures tem este codigo:

<td class="variable bordertop">Tempo Estimado: 06:04:13</td>

o que eu pretendo é criar um programa que me vá buscar esse tempo estimado a esse ficheiro html, para eu depois conseguir trabalhar esse numero. (somar com outros números de outros ficheiros por ex.)

não sei que linguagem devo usar, acredito que existam várias opções. obrigado.

Link to comment
Share on other sites

Podes experimentar XPath, que te dá uma linguagem relativamente abstracta para seleccionares elementos de um conteúdo XML, e deve haver bibliotecas que suportam XPath na generalidade das linguagens de programação.  Não sei se funcionará a 100%, visto que o HTML não é necessariamente XML válido.

Em Python, costumo usar a biblioteca Beautiful Soup quando preciso de manipular conteúdo HTML.  E o Python é provavelmente uma boa linguagem para este tipo de problemas simples. 

Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
×
×
  • Create New...

Important Information

By using this site you accept our Terms of Use and Privacy Policy. We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.