Jump to content

Indexação de PDF, DOCX, RTF,... e demais ficheiros de texto


carlneto
 Share

Recommended Posts

Estou a desenvolver uma estrutura de indexação no IDE NetBeans, mas não sei como indexar ficheiros além de txt's (ex.: pdf, doc, xls ou outros que contenham texto), :wallbash: alguém me pode dar uma ajuda?? 

Nota: Tenho uma estrutura de indexação que criei e um método que percorre recursivamente a estrutura de pastas e me devolve os ficheiros a indexar.

Obrigado! 🙂

Link to comment
Share on other sites

Bem, supondo que estás então a fazer um trabalho para EDA no IPT, cá vai um pedaço de código a ver se ajuda xD

if (f1.isFile()){ //Se o ficheiro analisado for um ficheiro(Caso fosse uma pasta, não faria sentido)
   if((f1.getName().endsWith(".docx") || f1.getName().endsWith(".DOCX")){ //Podes por mais extensões pois claro...
   //Fazes um método que chamas aqui para que ele indexe então o ficheiro.
   }
}

Eu resolvi o meu problema assim desta forma. Vê se te ajuda em alguma coisa.

Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
 Share

×
×
  • Create New...

Important Information

By using this site you accept our Terms of Use and Privacy Policy. We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.