JPN 0 Denunciar mensagem Publicado 21 de Abril de 2010 Boas. Estou a tentar fazer um programa muito simples que importe de um determinado site por mim definido todo o texto que se encontra nele (do género importar todo o texto que está em www.sapo.pt ou algo do género). Abri o netbeans e segundo li numa documentação do java tenho este código: import java.net.*; import java.io.*; class ConnectionTest { public static void main(String args[]) { try { URL site = new URL("http://www.sapo.pt/"); URLConnection ligacao = site.openConnection(); DataInputStream dis; String inputLine; dis = new DataInputStream(ligacao.getInputStream()); while ((inputLine = dis.readLine()) != null) { System.out.println(inputLine); } dis.close(); } catch (MalformedURLException me) { System.out.println("MalformedURLException: " + me); } catch (IOException ioe) { System.out.println("IOException: " + ioe); } } } Com este código supostamente ele receberia o conteúdo do site e escreveria o mesmo. No entanto quando executo o programa o resultado é: IOException: java.net.ConnectException: Connection timed out: connect Isto dever-se-à a estar a utilizar neste momento proxy ou é outro erro qualquer? Desde já muito obrigado. Partilhar esta mensagem Ligação para a mensagem Partilhar noutros sites
JPN 0 Denunciar mensagem Publicado 22 de Abril de 2010 Já testei numa ligação sem proxy e funciona. Só que neste momento ele retorna o html da página e não o seu texto final. Para retirar os dados que não sejam formatação html talvez a solução passe por ignorar tudo o que esteja dentro de <> correndo o erro de ignorar dados da página (que pode conter <>. Haverá alguma fora de carregar só o texto sem formatações html ? Partilhar esta mensagem Ligação para a mensagem Partilhar noutros sites