• Revista PROGRAMAR: Já está disponível a edição #53 da revista programar. Faz já o download aqui!

midnight2k

ler dados de paginas html para java

5 mensagens neste tópico

boas.

Seria possivel ajudarem me??

Como é que faço para ler dados de html para java?? É que tenho de fazer um projecto a fazer e nunca vi exemplos dissos.. so sei ler dados de ficheiros txt.. sera a logica a mesma?

Agradecia se me pudessem dar algumas dicas de como fazer.

Obrigado.

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

Não sei bem o que queres fazer mas a lógica de ler ficheiros HTML deverá ser a mesma que a de ler ficheiros de texto, até porque ficheiro HTML são ficheiros de texto.

Se o objectivo é retirar informação útil e evitar as tags HTML então ou removes as tags com um parsing básico, removendo os elementos à medida que os vais encontrando e guardando os dados ou usas expressões regulares para aliviar um pouco a quantidade e lógica do código que tens de escrever.

Mas como não explicas melhor o que pretendes não sei se é esta a resposta que queres.

Existem também vários componentes de Swing, todos os que mostram texto se não me engano, que aceitam HTML como texto e apresentam o resultado formatado, por exemplo, uma JTextArea possui métodos para ler um ficheiro HTML e mostrar o ficheiro todo formatado como se estivesses a ver num browser.

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

dados html num ficheiro no disco ou através da web ?

de ficheiros do disco :)

por ex eu tenho a seguinte pagina html com o seguinte codigo

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<title>Texto geral...</title>
</head>
<body>
<p>Texto geral...</p>
<table>
<tr><td>Texto sobre a matriz...</td></tr>
<tr><td>x</td></tr>
<tr><td>y</td></tr>
</table>
<table>
<tr><td>m11</td><td>m12</td><td>...</td><td>m1y</td></tr>
<tr><td>m21</td><td>m22</td><td>...</td><td>m2y</td></tr>
<tr><td>...</td><td>...</td><td>...</td><td>...</td></tr>
<tr><td>mx1</td><td>mx2</td><td>...</td><td>mxy</td></tr>
</table>
</body>
</html>

o que eu quero e' ir buscar so o que esta entre as tags <td> para os arrays.. como e' posssivel fazer isso? sei a logica de ir buscar aos ficheiros .txt mas neste caso penso que nao funciona da mesma maneira :x

alguem me pode elucidar disso?

cumps.

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites
Convidado
Este tópico está fechado a novas respostas.