Jump to content
  • Revista PROGRAMAR: Já está disponível a edição #60 da revista programar. Faz já o download aqui!

joaocasta

Crawl Conteúdo de Blogs em Wordpress

Recommended Posts

joaocasta

Boa tarde. Tudo bem convosco?

Alguém me sabe informar de uma forma de obter conteúdo de blogs wordpress que não tenham RSS Feed?

Obrigado.

Share this post


Link to post
Share on other sites
Rui Carlos

Provavelmente vais ter que fazer parse ao HTML do site. O lado positivo é que se o site usar um tema decente, os artigos do site devem ser identificáveis pela classe hentry, ou seja, é construir um DOM da página, e extrair os elementos com aquela classe. O processo terá que ser repetido para as várias páginas do blog, para se obterem os artigos todos.

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

×

Important Information

By using this site you accept our Terms of Use and Privacy Policy. We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.