Ir para o conteúdo
  • Revista PROGRAMAR: Já está disponível a edição #59 da revista programar. Faz já o download aqui!

joaocasta

Crawl Conteúdo de Blogs em Wordpress

Mensagens Recomendadas

joaocasta    3
joaocasta

Boa tarde. Tudo bem convosco?

Alguém me sabe informar de uma forma de obter conteúdo de blogs wordpress que não tenham RSS Feed?

Obrigado.

Partilhar esta mensagem


Ligação para a mensagem
Partilhar noutros sites
Rui Carlos    330
Rui Carlos

Provavelmente vais ter que fazer parse ao HTML do site. O lado positivo é que se o site usar um tema decente, os artigos do site devem ser identificáveis pela classe hentry, ou seja, é construir um DOM da página, e extrair os elementos com aquela classe. O processo terá que ser repetido para as várias páginas do blog, para se obterem os artigos todos.

Partilhar esta mensagem


Ligação para a mensagem
Partilhar noutros sites

Crie uma conta ou ligue-se para comentar

Só membros podem comentar

Criar nova conta

Registe para ter uma conta na nossa comunidade. É fácil!

Registar nova conta

Entra

Já tem conta? Inicie sessão aqui.

Entrar Agora

×

Aviso Sobre Cookies

Ao usar este site você aceita os nossos Termos de Uso e Política de Privacidade. Este site usa cookies para disponibilizar funcionalidades personalizadas. Para mais informações visite esta página.