Ir para o conteúdo
a13293

html...

Mensagens Recomendadas

a13293    0
a13293

pessoal estou a fazer um programa e faz download de um determinado link... mas depois quero ficar so com o texto(corpo principal da site..) , quero eliminar tudo  o resto..

algum me pode ajudar ja vi algumas coisas mas ainda nao consegui o que queria..

obrigado..

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites
Preatorian    0
Preatorian

Procura usar Regexp para tirar oq ue tiver entre <body e </body> (o primeiro convem estar aberto).

Ou entao procura manualmente :D

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites
Gust    0
Gust

Manualmente é muito fácil...

corpo = todo[todo.find("<body>"):todo.find("</body>")]

onde corpo é a variável onde vai ficar armazenada a parte que queres e todo o código da pagina.

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites
djthyrax    11
djthyrax

Manualmente é muito fácil...

corpo = todo[todo.find("<body>"):todo.find("</body>")]

onde corpo é a variável onde vai ficar armazenada a parte que queres e todo o código da pagina.

Aconselho a procurar a por <body e não <body>

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites
Gust    0
Gust

Manualmente é muito fácil...

corpo = todo[todo.find("<body>"):todo.find("</body>")]

onde corpo é a variável onde vai ficar armazenada a parte que queres e todo o código da pagina.

Aconselho a procurar a por <body e não <body>

Não entendo... Porque que sugeres que se procure por "<body".

Eu esqueci-me de dizer mas esta técnica tem uma grande falha. No caso do termo de procura estar escrito na pagina, pode cortar cedo demais.

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites
djthyrax    11
djthyrax

Não entendo... Porque que sugeres que se procure por "<body".

Porque pode lá estar <body bgcolor="#FFFFFF"> por exemplo :P

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

Crie uma conta ou ligue-se para comentar

Só membros podem comentar

Criar nova conta

Registe para ter uma conta na nossa comunidade. É fácil!

Registar nova conta

Entra

Já tem conta? Inicie sessão aqui.

Entrar Agora


×

Aviso Sobre Cookies

Ao usar este site você aceita os nossos Termos de Uso e Política de Privacidade