Jump to content

Importar dados web para variavel java


JPN
 Share

Recommended Posts

Boas.

Estou a tentar fazer um programa muito simples que importe de um determinado site por mim definido todo o texto que se encontra nele (do género importar todo o texto que está em www.sapo.pt ou algo do género).

Abri o netbeans e segundo li numa documentação do java tenho este código:

import java.net.*;
import java.io.*;

class ConnectionTest {
    public static void main(String args[]) {
        try {
            URL site = new URL("http://www.sapo.pt/");
            URLConnection ligacao = site.openConnection();
    DataInputStream dis;
    String inputLine;

    dis = new DataInputStream(ligacao.getInputStream());
            while ((inputLine = dis.readLine()) != null) {
                System.out.println(inputLine);
            }
    dis.close();
        } catch (MalformedURLException me) {
            System.out.println("MalformedURLException: " + me);
        } catch (IOException ioe) {
            System.out.println("IOException: " + ioe);
        }
    }
}

Com este código supostamente ele receberia o conteúdo do site e escreveria o mesmo. No entanto quando executo o programa o resultado é:

IOException: java.net.ConnectException: Connection timed out: connect

Isto dever-se-à a estar a utilizar neste momento proxy ou é outro erro qualquer?

Desde já muito obrigado.

Link to comment
Share on other sites

Já testei numa ligação sem proxy e funciona.

Só que neste momento ele retorna o html da página e não o seu texto final. Para retirar os dados que não sejam formatação html talvez a solução passe por ignorar tudo o que esteja dentro de <> correndo o erro de ignorar dados da página (que pode conter <>.

Haverá alguma fora de carregar só o texto sem formatações html ?

Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
 Share

×
×
  • Create New...

Important Information

By using this site you accept our Terms of Use and Privacy Policy. We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.