• Revista PROGRAMAR: Já está disponível a edição #53 da revista programar. Faz já o download aqui!

Ridelight

Google quer digitalizar imprensa escrita dos últimos 200 anos

8 mensagens neste tópico

O motor de busca Google anunciou, esta terça-feira, no seu blogue oficial a intenção de digitalizar, indexar e disponibilizar toda a imprensa escrita dos últimos 200 anos, estando já a preparar acordos com as empresas.

«Durante mais de 200 anos, os acontecimentos de relevo local ou nacional foram transmitidos através de jornais impressos», refere o gigante da Internet.

«O problema é que a maioria desses jornais não estão disponíveis on-line e nós queremos mudar isso», adianta.

A ideia é conseguir que a maior parte das edições de maior número dos jornais de todo o mundo possam ser consultadas no seu formato original.

Para que tal possa acontecer, o Google terá de digitalizar milhões de páginas de centenas de diários, tendo decidido começar a tarefa com os títulos dos Estados Unidos e do Canadá.

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

Sempre a mesma coisa. Vamos lá começar pelos Estados Unidos  :thumbdown:

E porque não começar por outro países, já nem digo por Portugal, mas outros. Bolas lá os Estados Unidos da América  :mad:

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

Sempre a mesma coisa. Vamos lá começar pelos Estados Unidos  :thumbdown:

E porque não começar por outro países, já nem digo por Portugal, mas outros. Bolas lá os Estados Unidos da América  :mad:

É tudo uma questão de mercado...
0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

Eu penso que é uma péssima iniciativa. Aliás, penso que os gajos do google têm a perfeita noção da ilusão que isto é mas querem avançar com isto por motivos de publicidade. Para se manterem sempre com noticias de supostas inovações.

Isto não tem pernas nenhumas para andar. Em primeiro lugar: a razão pela qual não existem arquivos de noticias é por motivos de copyright e afins. É a coisa mais facil do mundo agregar noticias de jornais que tenham sido publicadas online, o problema é que os jornais não querem. Querem uma prova de conceito? Vão ao archive.org, estão lá todos os requisitos técnicos para um arquivo, e porque é que esse arquivo só tem lá coisas de orgãos de comunicação social pequenos, alternativos ou independentes? Porque os outros não autorizam o arquivo do seu conteudo lá.

Em segundo lugar, é tecnicamente inexequível ir pelas páginas de um jornal e fazer OCR de noticias uma a uma. Se for para fazer scaners em formato de imagem então mais vale mesmo estarem parados.

Outra prova de conceito, o google books, foi anunciado exactamente desta forma, com o mesmo aparato e tudo mais, hoje em dia é algum serviço importante? Não. Está-se tudo a cagar para o google books e aquilo não tem conteudo nenhum que se veja.

Como não há duas sem três...

Ainda outra prova de conceito, o serviço de noticias do google. Pelos motivos que já indiquei se procurarem por noticias nacionais (por exemplo) vão encontrar apenas jornais locais cuja importancia é insignificante. São os únicos que ainda deixam o google ir lá buscar o seu conteudo.

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

pedrotuga a digitalização de jornais antigos (e por isso já sem copyright) é importante pois muitos têm certamente alguma relevância (e quem sabe poderão contribuir para a pesquisa Histórica, sociologia, etc). Essa digitalização não só poderá facilitar o acesso, como garantirá que os dados não sejam perdidos para sempre (o papel deteriora-se). Para o "Joe" pode não ter nenhuma importância mas para p.e. as ciências sociais poderá ter bastante.

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

Tens um bom ponto CR_, mas o facto é que a Comissão Europeia quer digitalizar o nosso conteúdo patrimonial e disponibilizá-lo na Internet, mas no entanto é estimado que durante um período de 4 anos vão ser preciso 250 milhões de Euros. E vão ser precisos cerca de 10 anos para que os 80 museus envolvidos finalizem o processo. Portanto estamos a falar de um custo estimado provavelmente à volta dos 700 milhões de Euros. E isto nem sequer contém jornais e revistas, mas apenas material que já faz parte do espólio destes museus.

Existe este link que fala um pouco dos problemas que os museus estão a enfrentar com a decisão da Comissão Europeia http://www.iht.com/articles/2007/10/28/business/LIBRARY29.php.

O que a Google se propõe parece sem dúvida irreal tanto em termos de dinheiro como por questões temporais. Daqui a 10 anos provavelmente nem 1/100 das publicações nos Estados Unidos e Canadá estariam digitalizadas e no entanto os custos já seriam astronómicos. Por outro lado, os copyrights ainda existem mesmo para material antigo. Só não existem para publicações com mais de 50 anos somente se os autores (as editoras, bem visto) originais desapareceram os direitos de copyright não transitaram para quem as comprou ou alienou.

0

Partilhar esta mensagem


Link para a mensagem
Partilhar noutros sites

Crie uma conta ou ligue-se para comentar

Só membros podem comentar

Criar nova conta

Registe para ter uma conta na nossa comunidade. É fácil!


Registar nova conta

Entra

Já tem conta? Inicie sessão aqui.


Entrar Agora