Você ainda não é assinante?

Tempo: 27:02 min

Descrição: A comparação de textos e strings por similaridade é a opção utilizada para lidar com problemas de digitação, conversão de caracteres entre charsets diferentes, linguagens e dialetos utilizados em comunicação na internet. Este pocketvideo discute quais são os problemas de comparação de caracteres e apresenta a técnicas de Fuzzy Matching (comparação por similaridade) para lidar com a definição do que é um string semelhante a outro ou não. A pocketvideo mostra como comparar strings através dos valores retornados pelas medidas de distância Levenshtein, JaroWinkler e LCS implementados em funções na linguagem TSQL e discute aspectos como critério de aceitação, joins e proximidade de strings em relação ao algoritmo empregado pelas medidas de distância utilizadas.