Mac 下编码转换

您所在的位置:网站首页 gbk编码和utf8转换 Mac 下编码转换

Mac 下编码转换

2023-08-17 05:10| 来源: 网络整理| 查看: 265

MacBook 如何解决编码转换问题 I.intro

痛点:最近刚换的 macbook-pro,总体使用还是挺流畅的。唯一不太友好的一点就是,有的时候下载的文件或别人传给我的文件经常会出现乱码。当时,心情就不好了,WTF ?! 所以现在写个小博客记录?一下下,免得每次都去找命令,查网页翻。

II.Get Started

 一般说来 Window 上默认是 GBK 编码格式(即国标码GB),正式的名字叫汉字编码字符集(Chinese Internal Code Specification ),它是一种中英混合双字节编码格式,可以识别中文和英文。而苹果的 macOS 系统默认支持的是 UTF-8 编码,也就是 8-bit Unicode Transformation Format, 它是一种针对Unicode的可变长度字符编码,而且最强悍的是,它包含全世界所有的语言,所以它才是真正的 Unicode!!!

III.What’s the difference between GBK and Unicode?

GBK 是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)。GBK编码专门用来解决中文编码的,是双字节的。不论中英文都是双字节的。

UTF-8 编码是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8 节省空间。另外,如果是外国人访问你的GBK网页,需要下载中文语言包支持。访问UTF-8编码的网页则不出现这问题。可以直接访问。

简而言之,如果是开发大型的国际性网站一般都选用 UTF-8 作为编码格式!!!

IV.Invert code from GBK to UTF-8 查看文件编码格式 使用 enca 查看: Psycho@SheepCore Downloads $ enca -L chinese hadoop.txt [out]: Simplified Chinese National Standard; GB2312 Mixed line terminators

如果没有安装 enca 的话, 运行: macOs Psycho@SheepCore Downloads $ brew install enca install enca Linux: Psycho@SheepCore Downloads $ sudo apt-get install enca

编码转换 Method one: $ enca -L language(zh_CN/ us_en) -x UTF-8 filename 其中 x 表示将文件转换其他编码, Psycho@SheepCore $ enca -L zh_CN -x UTF-8 ./hadoop.txt 查看结果: Psycho@SheepCore $ enca -L zh_CN ./hadoop.txt Universal transformation format 8 bits; UTF-8 Mixed line terminators

enca

Method two: Psycho@SheepCore $ iconv -f UTF-8 -t GBK from.txt -o to.txt

enca 可以查看所有 enca 可以转换的所有编码: Psycho@SheepCore Downloads $ enca --list languages all codes here 转换前: 乱码 转换后: no miscode

V.Summary

 问题都是等着我们不断去解决的,别担心! Life is good, stay positive! :) !

 Do what you want to do, be what you want to be!  LOVE && PEACE. ? Happy Coding.



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3