itext7学习笔记杂谈系列2

您所在的位置:网站首页 ubuntu安装中文字体和中文文件的区别在哪 itext7学习笔记杂谈系列2

itext7学习笔记杂谈系列2

2024-07-08 22:07| 来源: 网络整理| 查看: 265

作者:CuteXiaoKe 微信公众号:CuteXiaoKe

    在本章,我们会讨论如何在itext7中显示中文,或者其他CJK(Chinese/Japan/Koera)等非ASCII码字符遇到的问题,解读font-asian.jar这个包的作用.

1. 字体编码

    如果我们想真正了解字体如何在计算机存储的话,字体文件是些啥的话,还有编码问题,可以参考中文编码 TTF字库之间的关系     顺带一提,查看本机的默认代码页(也就是ANSI),在cmd输入chcp即可查看代码页数字

2. PDF中的CJK字体

    我们可以总结出来,现在市面上流行的字体有三种:

Postscript/Type1 是1985年由Adobe公司提出的一套矢量字体标准,有版权,收费,扩充CJK字体的时候,使用 CID-keyed font 技术,在itext7使用它的话比较麻烦,没错,就它事多Truetype TrueType是1991年由Apple公司与Microsoft公司联合提出另一套矢量字标准OpenType 1995年,Adobe公司和Microsoft公司开始联手开发一种兼容 Type1和TrueType,并且真正支持Unicode的字体,后来在发布的时候,正式命名为OpenType。OpenType可以嵌入Type1 和TrueType,这样就兼有了二者的特点,无论是在屏幕上察看还是打印,质量都非常优秀。

    如果我们在PDF中想要嵌入CJK字体的话,我们使用的itext7或者其他非Adobe软件是不能把CJK嵌入到PDF的,因为许可证保护,详情我们可以看看font-asian-7.x.x.jar中cmap_info.txt的信息:

itext-0-2-1

    在这里,我主要翻译总结一下cmap_info.txt里面的内容(因为里面的一些网址都已经过时了,所以我总结自己网上找的一些资料):

CJK或者CE字体版权归Adobe所有,只能在Adobe Reader等软件中使用iText7不能嵌入CJK或者CE字体,因为会侵犯Adobe版权,例如嵌入CJK字体,可以用其余的PDF查看器查看,这会影响它的利益font-asian.jar里面是有两种文件,一种是cmap文件(编码文件),另一种是.properties文件(与字体程序有关)在Type 1字体中用来描述字体度量(font metrics)是存储在Adobe font metrics (AFM)和Adobe composite font metrics (ACFM) files中的,这些文件是被字体程序所使用的,在itext中把这些信息放在.properties文件中,以key-value这样的形式存储,这样我们就不需要实际字体程序,只需要把字体信息放在itext创建的文件中。 3. itext7嵌入字体 3.1 创建Type 1字体

    我们展开上图的cmap,我们会发现一些字体程序(.properties文件名代表的就是字体程序名),当然我们还需要确定字体程序所支持的编码,以下是常用的adobe公司的字体程序和对应编码:

字体程序编码STSong-LightUniGB-UCS2-HMHei-MediumUniCNS-UCS2-HMSung-LightUniCNS-UCS2-HHeiseiKakuGo-W5UniJIS-UCS2-HHeiseiMin-W3UniJIS-UCS2-HHYGoThic-MediumUniKS-UCS2-HHYSMyeongJo-MediumUniKS-UCS2-H

其余的字体程序对应的编码暂时没查阅到,adobe官网信息不一样了,如果想用特定的字体的话可以到时候查阅

    然后就是创建具体的字体,核心代码如下,假设我们使用STSong-Light创建字体:

...... PdfFont f2 = PdfFontFactory.createFont("STSong-Light", "UniGB-UCS2-H",true); document.add(new Paragraph("hellos你好").setFont(f2)); //表格、list其他方式也是这种方式 ......

如果您曾经使用过itext5,你会发现与itext5的创建字体方式不一样,没关系,我会另写一篇文章来写itex7与itext5在创建字体的时候的不同之处 不同的itext7版本创建PdfFont的API不一样,在本例iText版本为7.0.3,7.1.17-SNAPSHOT的版本请参考iText7高级教程之构建基础块——1.引入字体第5章

    创建完的pdf,我们按crtl+d看字体属性,如图:

itext-0-2-2

    我们可以发现,实际的字体是AdobeSongStd-Light,这是因为我本机安装的时候是选择的简体中文,会自带宋体和黑体的字体程序,在“C:\Program Files (x86)\Adobe\Acrobat Reader DC\Resource\CIDFont”(安装目录)中可以看到我们使用的是CID字体,有两个字体程序:

itext-0-2-3

    假如,我们使用在这个文件夹下没有的字体程序呢?例如HeiseiKakuGo-W5等,我们通过itext7是可以文件,但是打开pdf的时候会弹出这样一个对话框,让我们去下载字体,如图:

itext-0-2-4

3.2 创建其他字体

    嵌入其他字体的时候比较简单了,可以使用自己定义的字体文件,支持ttf文件,也可以使用windows自带的字体文件,如下代码:

PdfFont f2 = PdfFontFactory.createFont("STSong-Light", "UniGB-UCS2-H",true); PdfFont f3 = PdfFontFactory.createFont("C:/Windows/Fonts/simhei.ttf", PdfEncodings.IDENTITY_H,true); //Add paragraph to the document document.add(new Paragraph("hellos你好").setFont(f2)); document.add(new Paragraph("hellos你好").setFont(f3));

    显示效果如下:

itext-0-2-5

PdfEncodings.IDENTITY_H就是Unicode编码,一般ttf文件都是用的这种编码,日后我会详谈

4. 代码样例打包

    我在第一章和第一章实践的基础上,添加了中文输出,请放心下载



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3