Java 简体繁体 几种处理方式

您所在的位置:网站首页 繁体转换简体字 Java 简体繁体 几种处理方式

Java 简体繁体 几种处理方式

2023-08-21 10:20| 来源: 网络整理| 查看: 265

一)背景

由于这两天领导给香港用户进行系统培训的时候,有用户提到,需要系统中能支持一些关键字简体繁体查询。

简单说,用户输入简体或输入繁体时,都能筛选出简体和繁体的所有数据。

 

优点:数据筛选的多样化

缺点:查询性能可能会稍微慢一点

 

二)ZHConverter

在网上百度了一下,几乎所有的简体繁体转换都是用到了zhconverter的jar,而且很多文章都是靠前排列的,所以着重看了下该方式的实现源码,发现该jar实现的方式可能会存在性能问题。

 

原因一:代码中用了线程同步。

原因二:在使用的时候,需要不断初始化一些类(有些类可以用单例模式)。

所以该方式就被抛弃了。

 

三)opencc4j

该方式比较简单,直接引用jar,然后直接使用。(选用的此方式)

在pom.xml文件中新增以下配置(1.1.0版是目前最新版本):

com.github.houbb opencc4j 1.1.0

 

直接在代码中使用,如下:

// 把繁体转换成简体 String simple = ZhConverterUtil.convertToSimple("歐陽"); // 把简体转换成繁体 String traditional = ZhConverterUtil.convertToTraditional("欧阳");

 

四)自主实施

看了上面两种方式之后,自己也想到了该怎么实现简体繁体转换了,下面只提供思路。

 

第一步:把所有简体和繁体穷举出来,然后分别编写成两个配置文件,可以使用unicode方式配置成键值对的关系,如后缀为properties的文件。

第二步:写一个单例类,该类在项目启动的时候加载一次,可以先把所有简体和繁体配置加载到内存中(文件不会很大),或放置到redis缓存中,使用键值对的方式存储起来。

第三步:调用的时候,把需要转换的字符串分隔,然后自行匹配,最后重新拼接好(可能需要把每一个中文分隔转换成unicode方式去匹配,匹配好之后再重新拼接好)。

 

识别二维码关注个人微信公众号

本章完结,待续,欢迎转载!   本文说明:该文章属于原创,如需转载,请标明文章转载来源!



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3