Jump to content
carlneto

Indexação de PDF, DOCX, RTF,... e demais ficheiros de texto

Recommended Posts

carlneto

Estou a desenvolver uma estrutura de indexação no IDE NetBeans, mas não sei como indexar ficheiros além de txt's (ex.: pdf, doc, xls ou outros que contenham texto), :wallbash: alguém me pode dar uma ajuda?? 

Nota: Tenho uma estrutura de indexação que criei e um método que percorre recursivamente a estrutura de pastas e me devolve os ficheiros a indexar.

Obrigado! :)

Share this post


Link to post
Share on other sites
RubenFelix

Queres apenas indexar os ficheiros para essa estrutura de dados é isso ?

Isso parece-me simples...

Se puderes, mete ai o código que utilizaste para indexar os txt's então para a malta ajudar-te.

Share this post


Link to post
Share on other sites
RubenFelix

Bem, supondo que estás então a fazer um trabalho para EDA no IPT, cá vai um pedaço de código a ver se ajuda xD

if (f1.isFile()){ //Se o ficheiro analisado for um ficheiro(Caso fosse uma pasta, não faria sentido)
   if((f1.getName().endsWith(".docx") || f1.getName().endsWith(".DOCX")){ //Podes por mais extensões pois claro...
   //Fazes um método que chamas aqui para que ele indexe então o ficheiro.
   }
}

Eu resolvi o meu problema assim desta forma. Vê se te ajuda em alguma coisa.

Share this post


Link to post
Share on other sites
carlneto

Obrigado,

Mas o problema da leitura dos ficheiros, mantém-se. Continua a abri-los como se fossem txt's o que leva a uma incorrecta indexação.

Deve haver algum método para descodificar outros tipos de ficheiros.

Help 😲

carlneto

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

×
×
  • Create New...

Important Information

By using this site you accept our Terms of Use and Privacy Policy. We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.