Ir para o conteúdo
  • Revista PROGRAMAR: Já está disponível a edição #60 da revista programar. Faz já o download aqui!

pedrix21

String Parecidas!

Mensagens Recomendadas

pedrix21

Boas pessoal,

Queria saber se existe algum método para verificar NÃO se as strings são iguais mas sim para verificar se são parecidas.

É para fazer um corrector ortográfico.

Ou seja, tipo isto:

Utilizador | dicionário | correcção

msea          mesa          mesa

medsa        mesa          mesa

and            anda          anda

Não sei se me fiz entender...

Obrigado, cumps


@Pedro Lopes

Partilhar esta mensagem


Ligação para a mensagem
Partilhar noutros sites
pedrix21

Usar o algoritmo da "Distância Levenshtein" talvez possa dar não?

Mas penso que só dá para strings com o mesmo tamanho :S


@Pedro Lopes

Partilhar esta mensagem


Ligação para a mensagem
Partilhar noutros sites
Knitter

Depende de quanta precisão necessitas. Uma forma simples e rápida será usar o método de comparação de strings que te devolve um inteiro. Quanto mais pequeno for esse inteiro mais parecidas são as strings. Embora o valor do inteiro possa depender das letras exactas que são diferentes.

Por exemplo, a comparação de mesa com msea ou mesas, pode dar dois inteiros bastante diferentes e mesmo assim as palavras serem relativamente parecidas.

Isto combinado com anagramas pode ser suficiente mas se precisas de algo mais preciso, então terás de usar outro tipo de algoritmos.

Partilhar esta mensagem


Ligação para a mensagem
Partilhar noutros sites
M6

O Edit Distance é um algoritmo muito conhecido e é fácil de encontrar implementações em muitas linguages.

Tens aqui um exemplo: http://www.merriampark.com/ld.htm


10 REM Generation 48K!
20 INPUT "URL:", A$
30 IF A$(1 TO 4) = "HTTP" THEN PRINT "400 Bad Request": GOTO 50
40 PRINT "404 Not Found"
50 PRINT "./M6 @ Portugal a Programar."

 

Partilhar esta mensagem


Ligação para a mensagem
Partilhar noutros sites
M6

(Não te enganaste no link?)

Claramente que sim! :confused:

Já corrigi.


10 REM Generation 48K!
20 INPUT "URL:", A$
30 IF A$(1 TO 4) = "HTTP" THEN PRINT "400 Bad Request": GOTO 50
40 PRINT "404 Not Found"
50 PRINT "./M6 @ Portugal a Programar."

 

Partilhar esta mensagem


Ligação para a mensagem
Partilhar noutros sites

Crie uma conta ou ligue-se para comentar

Só membros podem comentar

Criar nova conta

Registe para ter uma conta na nossa comunidade. É fácil!

Registar nova conta

Entra

Já tem conta? Inicie sessão aqui.

Entrar Agora

×

Aviso Sobre Cookies

Ao usar este site você aceita os nossos Termos de Uso e Política de Privacidade. Este site usa cookies para disponibilizar funcionalidades personalizadas. Para mais informações visite esta página.