Ir para o conteúdo
  • Revista PROGRAMAR: Já está disponível a edição #60 da revista programar. Faz já o download aqui!

joaocasta

Crawl Conteúdo de Blogs em Wordpress

Mensagens Recomendadas

joaocasta

Boa tarde. Tudo bem convosco?

Alguém me sabe informar de uma forma de obter conteúdo de blogs wordpress que não tenham RSS Feed?

Obrigado.

Partilhar esta mensagem


Ligação para a mensagem
Partilhar noutros sites
Rui Carlos

Provavelmente vais ter que fazer parse ao HTML do site. O lado positivo é que se o site usar um tema decente, os artigos do site devem ser identificáveis pela classe hentry, ou seja, é construir um DOM da página, e extrair os elementos com aquela classe. O processo terá que ser repetido para as várias páginas do blog, para se obterem os artigos todos.

Partilhar esta mensagem


Ligação para a mensagem
Partilhar noutros sites

Crie uma conta ou ligue-se para comentar

Só membros podem comentar

Criar nova conta

Registe para ter uma conta na nossa comunidade. É fácil!

Registar nova conta

Entra

Já tem conta? Inicie sessão aqui.

Entrar Agora

×

Aviso Sobre Cookies

Ao usar este site você aceita os nossos Termos de Uso e Política de Privacidade. Este site usa cookies para disponibilizar funcionalidades personalizadas. Para mais informações visite esta página.