Jump to content

XHTML Parser


JoaoRodrigues

Recommended Posts

O google conhece 😛

http://www.google.pt/search?q=python%20html%20parser

Mas seguindo a dica do triton, se o xhtml validar então tambem valida como xml logo um parser de xml funciona. Mas atenção, tem que ser um parser de xml genérico e não um parser de alguns sabores de xml.

Mas o DOM é mesmo a tecnologia mais cool na minha opiniao. Verifica a validação das paginas primeiro e depois espeta-lhe com o DOM que isso funciona que é um mimo.

Link to comment
Share on other sites

Basicamente tu estás à procura de uma peça de software que te peque numa estrutura xhtml e te a transforme numa estrutura de dados que possas usar. Por exemplo um array, um dicionario ( python ) uma árvore, etc.

O DOM é isso mesmo. O DOM é utilizado pelos browsers e é suposto ser compativel com todos, os browsers o que fazem é:

pegam no xhtml, parsam-no para uma estrutura em árvore. e depois começam a transformar cada elemento nos respectivos elementos gráficos e/ou comportamentos de forma a que tu os possas ver.

Para perceberes isto melhor instala o DOM inspector no firefox e vasculha por entre o DOM de uma página.

Depois de o teres instalado, experiemntado e percebido, aconselho a usares antes o firebug que é mais intuitivo que o dom inspector.

Com estas ferramentas vais poder ver uma página da mesma forma que um browser as vê: uma àrvore.

Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
×
×
  • Create New...

Important Information

By using this site you accept our Terms of Use and Privacy Policy. We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.