• Revista PROGRAMAR: Já está disponível a edição #53 da revista programar. Faz já o download aqui!

mellony

Obter conteúdo de uma página HTML do IE

7 mensagens neste tópico

off topic:

Com o Python é possivel por exemplo fazer um programa que tranferisse texto do Internet explorer e o "desse" a um programa em C?

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

off topic:

Com o Python é possivel por exemplo fazer um programa que tranferisse texto do Internet explorer e o "desse" a um programa em C?

O Internet Explorer representa páginas HTML. Não faz sentido comunicar com o IE para obter o código HTML. Podes simplesmente obter o código HTML através do Python.

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

Eu não quero o codigo fonte de uma pagina, quero apenas o texto...

Serie então possivel fazer um programa em C que abrisse o Internet explorer num endereço web já predefinido e que copiase o texto dessa pagina para o propio programa?

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

Eu não quero o codigo fonte de uma pagina, quero apenas o texto...

Serie então possivel fazer um programa em C que abrisse o Internet explorer num endereço web já predefinido e que copiase o texto dessa pagina para o propio programa?

O texto de uma página está presente no seu código-fonte. Mais um vez vez, como disse o triton, a solução não passa por abrir o IE, passa sim por obter o código-fonte directamente e filtrar o que queres retirar. E sim, é possível fazer isso com C.

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

Então se eu quiser o conteudo duma pagina web, sou mesmo obrigado a filtrar apartir do html...fazer isso não é muito complicado pois não?

suponho que seja ler o que está dentro de <p>"    "</p>  mas fazer isso na prátca nao sei se é facil xD

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites
fazer isso não é muito complicado pois não?

Complicado?

Se só precisas do texto, isto é suficiente:

$ lynx --dump www.example.com > example.txt

$ cat example.txt
   You have reached this web page by typing "example.com", "example.net",
   or "example.org" into your web browser.

   These domain names are reserved for use in documentation and are not
   available for registration. See [1]RFC 2606, Section 3.

References

   1. http://www.rfc-editor.org/rfc/rfc2606.txt

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

Crie uma conta ou ligue-se para comentar

Só membros podem comentar

Criar nova conta

Registe para ter uma conta na nossa comunidade. É fácil!


Registar nova conta

Entra

Já tem conta? Inicie sessão aqui.


Entrar Agora