給定兩個文本串 , ,他們的Joro距離定義為:
求 match 的字符數:
分別來自 , 的字符,當他們相同或者距離小於 ,則被認為是 match 的。
比如: =“DIXON”, =“DICKSONX”
中的每壹個字符都會與 中距離 內的字符進行比較。將所有 match 的字符串,需要替調換順序才能匹配的總數除以二就是transpositions的大小 。這裏兩個字符串中匹配的分別是:"DION",“DION",所以 。
另外 =4, =8,
則:
參考:
https://rosettacode.org/wiki/Jaro_distance#Java