Jump to content

leitura de ficheiros TXT, DOC, HTML, PPT


sarapintas
 Share

Recommended Posts

Boas tardes, eu estou aqui com um problema num projecto preciso de ler ficheiros do tipo txt, doc, html e ppt. O txt eu sei o problema é o resto, esses documentos apenas vão ter texto (palavras), existe alguns comandos na consola que me possa ajudar a fazer isso ou mesmo do "C"?

cumps

Link to comment
Share on other sites

O HTML é idêntico ao texto, dado que é texto, podes é ter de o passar por um parser de XML/HTML para extrair alguma informação que queiras de forma estruturada. Ou então à força de expressões regulares, que é uma solução, digamos, menos elegante.

Quanto ao DOC e ao PPT o melhor é arranjares uma lib para lhes acederes, dado que esses formatos são complexos. Procura no Google, de certo deves encontrar umas quantas coisas open source.

10 REM Generation 48K!
20 INPUT "URL:", A$
30 IF A$(1 TO 4) = "HTTP" THEN PRINT "400 Bad Request": GOTO 50
40 PRINT "404 Not Found"
50 PRINT "./M6 @ Portugal a Programar."

 

Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
 Share

×
×
  • Create New...

Important Information

By using this site you accept our Terms of Use and Privacy Policy. We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.