Jump to content

ler dados de paginas html para java


midnight2k
 Share

Recommended Posts

Não sei bem o que queres fazer mas a lógica de ler ficheiros HTML deverá ser a mesma que a de ler ficheiros de texto, até porque ficheiro HTML são ficheiros de texto.

Se o objectivo é retirar informação útil e evitar as tags HTML então ou removes as tags com um parsing básico, removendo os elementos à medida que os vais encontrando e guardando os dados ou usas expressões regulares para aliviar um pouco a quantidade e lógica do código que tens de escrever.

Mas como não explicas melhor o que pretendes não sei se é esta a resposta que queres.

Existem também vários componentes de Swing, todos os que mostram texto se não me engano, que aceitam HTML como texto e apresentam o resultado formatado, por exemplo, uma JTextArea possui métodos para ler um ficheiro HTML e mostrar o ficheiro todo formatado como se estivesses a ver num browser.

Link to comment
Share on other sites

dados html num ficheiro no disco ou através da web ?

de ficheiros do disco 🙂

por ex eu tenho a seguinte pagina html com o seguinte codigo

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<title>Texto geral...</title>
</head>
<body>
<p>Texto geral...</p>
<table>
<tr><td>Texto sobre a matriz...</td></tr>
<tr><td>x</td></tr>
<tr><td>y</td></tr>
</table>
<table>
<tr><td>m11</td><td>m12</td><td>...</td><td>m1y</td></tr>
<tr><td>m21</td><td>m22</td><td>...</td><td>m2y</td></tr>
<tr><td>...</td><td>...</td><td>...</td><td>...</td></tr>
<tr><td>mx1</td><td>mx2</td><td>...</td><td>mxy</td></tr>
</table>
</body>
</html>

o que eu quero e' ir buscar so o que esta entre as tags <td> para os arrays.. como e' posssivel fazer isso? sei a logica de ir buscar aos ficheiros .txt mas neste caso penso que nao funciona da mesma maneira :x

alguem me pode elucidar disso?

cumps.

Link to comment
Share on other sites

Guest
This topic is now closed to further replies.
 Share

×
×
  • Create New...

Important Information

By using this site you accept our Terms of Use and Privacy Policy. We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.