當前位置:編程學習大全網 - 編程軟體 - 文本相似度算法-Jaro distance

文本相似度算法-Jaro distance

給定兩個文本串 , ,他們的Joro距離定義為:

match 的字符數:

分別來自 , 的字符,當他們相同或者距離小於 ,則被認為是 match 的。

比如: =“DIXON”, =“DICKSONX”

中的每壹個字符都會與 中距離 內的字符進行比較。將所有 match 的字符串,需要替調換順序才能匹配的總數除以二就是transpositions的大小 。這裏兩個字符串中匹配的分別是:"DION",“DION",所以 。

另外 =4, =8,

則:

參考:

https://rosettacode.org/wiki/Jaro_distance#Java

  • 上一篇:淘寶客服在家兼職怎麽找
  • 下一篇:羊坊店中心小學的教師隊伍
  • copyright 2024編程學習大全網