Jump to content
  • Revista PROGRAMAR: Já está disponível a edição #60 da revista programar. Faz já o download aqui!

Sign in to follow this  
sarapintas

leitura de ficheiros TXT, DOC, HTML, PPT

Recommended Posts

sarapintas

Boas tardes, eu estou aqui com um problema num projecto preciso de ler ficheiros do tipo txt, doc, html e ppt. O txt eu sei o problema é o resto, esses documentos apenas vão ter texto (palavras), existe alguns comandos na consola que me possa ajudar a fazer isso ou mesmo do "C"?

cumps

Share this post


Link to post
Share on other sites
M6

O HTML é idêntico ao texto, dado que é texto, podes é ter de o passar por um parser de XML/HTML para extrair alguma informação que queiras de forma estruturada. Ou então à força de expressões regulares, que é uma solução, digamos, menos elegante.

Quanto ao DOC e ao PPT o melhor é arranjares uma lib para lhes acederes, dado que esses formatos são complexos. Procura no Google, de certo deves encontrar umas quantas coisas open source.


10 REM Generation 48K!
20 INPUT "URL:", A$
30 IF A$(1 TO 4) = "HTTP" THEN PRINT "400 Bad Request": GOTO 50
40 PRINT "404 Not Found"
50 PRINT "./M6 @ Portugal a Programar."

 

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this  

×

Important Information

By using this site you accept our Terms of Use and Privacy Policy. We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.