美文网首页
java 如何计算两个汉字的相似度?如何获得一个汉字的相似汉字?

java 如何计算两个汉字的相似度?如何获得一个汉字的相似汉字?

作者: 老马啸西风2020 | 来源:发表于2023-04-11 17:37 被阅读0次

计算汉字相似度

情景

有时候我们希望计算两个汉字的相似度,比如文本的 OCR 等场景。用于识别纠正。

实现

引入 maven

<dependency>
    <groupId>com.github.houbb</groupId>
    <artifactId>nlp-hanzi-similar</artifactId>
    <version>1.3.0</version>
</dependency>

java 实现

double rate1 = HanziSimilarHelper.similar('末', '未');

返回对应的相似度:

0.9629629629629629

返回一个汉字的相似列表

情景

找到相似的汉字,有很多有趣的场景。

实现

List<String> list = HanziSimilarHelper.similarList('爱');
Assert.assertEquals("[爰, 爯, 受, 爭, 妥, 憂, 李, 爳, 叐, 雙]", list.toString());

开源地址

为了便于大家学习,上述代码已开源

https://github.com/houbb/nlp-hanzi-similar

在线体验

在线体验

拓展阅读

NLP 中文形近字相似度计算思路

中文形近字相似度算法实现,为汉字 NLP 尽一点绵薄之力

当代中国最贵的汉字是什么?

NLP 开源形近字算法补完计划(完结篇)

NLP 开源形近字算法之形近字列表(番外篇)

开源项目在线化 中文繁简体转换/敏感词/拼音/分词/汉字相似度/markdown 目录

相关文章

  • 【日本人不知道的日语】异体假名 古代平假名 变体假名的故事

    日本人不知道的日语1:变体假名顾名思义就是变体,由于汉字发音的相似,同一个发音对应的汉字是很多个,那么这样汉字草书...

  • 汉字的根本

    ——十月汉字板块教学总结 如何让孩子走进汉字的世界,充分体验汉字的图画美和文化意象? 三千个基础汉字,要是一个个结...

  • javascript 如何实现整数转汉字

    title: 如何实现整数转汉字date: 2021-05-20description: 讲一下如何实现整数转汉字...

  • 汉字文化

    从事实来看 汉字是一种语言沟通交流的工具。 或许你可以认识所有汉字,知道怎么发音如何书写。但是这并不代表当汉字排列...

  • 《现代汉语》文字篇 形体第二

    目录 汉字的形体 一、现行汉字的前身 二、现行汉字的形体 三、汉字的演变趋势 汉字的形体 一、现代汉字的前身 汉字...

  • 汉字有哪些特征?练字前了解这些,事半功倍!

    汉字具有独特的魅力,自然具备明显的特征,这里只对如何写好汉字做相关特征的介绍。 1从图中可明显看到汉字由点和线条构...

  • 同音字趣谈

    虽汉字同音字的魅力在《施氏食狮史》等奇文中已经尽显其趣,不过,你还可以发现汉字同音字更多的有趣现象,或字意相近相似...

  • NLP 开源形近字算法补完计划(完结篇)

    前言 所有的故事都有开始,也终将结束。 本文将作为 NLP 汉字相似度的完结篇,为该系列画上一个句号。 起-NLP...

  • 2018-01-19日志

    日语转罗马音网站 网址上有汉字日文有乱码怎么办? nodejs:encodeURI("汉字"); 如何通过酷狗获取...

  • Java 杂论(持续更新中)

    Java支持汉字作为classname char 可以存储汉字 String 是java中的字符串,它继承于Cha...

网友评论

      本文标题:java 如何计算两个汉字的相似度?如何获得一个汉字的相似汉字?

      本文链接:https://www.haomeiwen.com/subject/msngddtx.html