Jump to content
  • Revista PROGRAMAR: Já está disponível a edição #60 da revista programar. Faz já o download aqui!

pedrix21

String Parecidas!

Recommended Posts

pedrix21

Boas pessoal,

Queria saber se existe algum método para verificar NÃO se as strings são iguais mas sim para verificar se são parecidas.

É para fazer um corrector ortográfico.

Ou seja, tipo isto:

Utilizador | dicionário | correcção

msea          mesa          mesa

medsa        mesa          mesa

and            anda          anda

Não sei se me fiz entender...

Obrigado, cumps


@Pedro Lopes

Share this post


Link to post
Share on other sites
pedrix21

Usar o algoritmo da "Distância Levenshtein" talvez possa dar não?

Mas penso que só dá para strings com o mesmo tamanho :S


@Pedro Lopes

Share this post


Link to post
Share on other sites
Knitter

Depende de quanta precisão necessitas. Uma forma simples e rápida será usar o método de comparação de strings que te devolve um inteiro. Quanto mais pequeno for esse inteiro mais parecidas são as strings. Embora o valor do inteiro possa depender das letras exactas que são diferentes.

Por exemplo, a comparação de mesa com msea ou mesas, pode dar dois inteiros bastante diferentes e mesmo assim as palavras serem relativamente parecidas.

Isto combinado com anagramas pode ser suficiente mas se precisas de algo mais preciso, então terás de usar outro tipo de algoritmos.

Share this post


Link to post
Share on other sites
pedrix21

Já consegui fazer, obrigado pessoal :D

Fiz com a distância de Levenchtein.


@Pedro Lopes

Share this post


Link to post
Share on other sites
M6

O Edit Distance é um algoritmo muito conhecido e é fácil de encontrar implementações em muitas linguages.

Tens aqui um exemplo: http://www.merriampark.com/ld.htm


10 REM Generation 48K!
20 INPUT "URL:", A$
30 IF A$(1 TO 4) = "HTTP" THEN PRINT "400 Bad Request": GOTO 50
40 PRINT "404 Not Found"
50 PRINT "./M6 @ Portugal a Programar."

 

Share this post


Link to post
Share on other sites
M6

(Não te enganaste no link?)

Claramente que sim! :confused:

Já corrigi.


10 REM Generation 48K!
20 INPUT "URL:", A$
30 IF A$(1 TO 4) = "HTTP" THEN PRINT "400 Bad Request": GOTO 50
40 PRINT "404 Not Found"
50 PRINT "./M6 @ Portugal a Programar."

 

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

×

Important Information

By using this site you accept our Terms of Use and Privacy Policy. We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.