在 Python 中将 Unicode 字符转换为 ASCII 字符串 |
您所在的位置:网站首页 › ascii码转换成中文 › 在 Python 中将 Unicode 字符转换为 ASCII 字符串 |
当前位置:主页 > 学无止境 > 编程语言 > Python >
Python
PHP
Java
Go
TypeScript
C++
Vba
Node.js
C语言
在 Python 中将 Unicode 字符转换为 ASCII 字符串
作者:迹忆客
最近更新:2023/03/24
浏览次数:
Unicode 字符是所有语言字符的全局编码标准。与仅支持每个字符一个字节的 ASCII 不同,Unicode 字符将此功能扩展到 4 个字节,从而使其支持任何语言的更多字符。 本篇文章演示了如何将 Unicode 字符转换为 ASCII 字符串。目标是删除 ASCII 不支持的字符,或将 Unicode 字符替换为其相应的 ASCII 字符。 在 Python 中使用 unicodedata.normalize() 和 encode() 将 Unicode 转换为 ASCII 字符串Python 模块 unicodedata 提供了一种利用 Unicode 和实用程序功能中的字符数据库的方法,这些功能大大简化了对这些字符的访问、过滤和查找。 unicodedata 具有一个名为 normalize()的函数,该函数接受两个参数,即 Unicode 字符串的规范化形式和给定的字符串。 规范化的 Unicode 格式有 4 种类型:NFC,NFKC,NFD 和 NFKD。要了解更多信息,可以使用官方文档来详细了解每种类型。本教程将全程使用 NFKD 规范化形式。 让我们声明一个包含多个 unicode 字符的字符串。 import unicodedata stringVal = u'Här är ett exempel på en svensk mening att ge dig.' print(unicodedata.normalize('NFKD', stringVal).encode('ascii', 'ignore'))调用 normalize() 方法后,将调用链接到函数 encode(),该函数将完成从 Unicode 到 ASCII 的转换。 字符串值之前的 u 字符可帮助 Python 识别字符串值包含 unicode 字符;这样做是出于类型安全的目的。 第一个参数指定转换类型,第二个参数强制执行字符无法转换时应执行的操作。在这种情况下,第二个参数传递 ignore,它将忽略任何无法转换的字符。 输出: b'Har ar ett exempel pa en svensk mening att ge dig.'请注意,原始字符串(ä和å)中的 unicode 字符已被其 ASCII 字符对等体(a)取代。 字符串开头的 b 符号表示该字符串是字节文字,因为在字符串上使用了 encode() 函数。要删除符号和封装字符串的单引号,请在调用 encode() 之后将其链式调用 decode(),以将其重新转换为字符串文字。 print(unicodedata.normalize('NFKD', stringVal).encode('ascii', 'ignore').decode())输出: Har ar ett exempel pa en svensk mening att ge dig.让我们尝试另一个示例,该示例使用 replace 作为 encode() 函数中的第二个参数。 对于此示例,让我们尝试一个字符串,该字符串具有不包含 ASCII 对应字符的字符。 import unicodedata stringVal = u'áæãåāœčćęßßßわた' print(unicodedata.normalize('NFKD', stringVal).encode('ascii', 'replace').decode())此示例字符串中的所有字符均未以 ASCII 进行注册,但可能具有对应的符号。 输出: a??a?a?a??c?c?e??????replace 参数直接将没有 ASCII 对应的字符替换成问号 ? 符号。如果我们在同一字符串上使用 ignore: print(unicodedata.normalize('NFKD', stringVal).encode('ascii', 'ignore').decode())输出将是: aaaacce总之,要将 Unicode 字符转换为 ASCII 字符,请使用 unicodedata 模块中的 normalize() 函数和字符串的内置 encode() 函数。你可以忽略或替换没有 ASCII 对应字符的 Unicode 字符。ignore 选项将删除该字符,而 replace 选项将其替换为问号。 上一篇:在 Python 中检查变量是否为字符串 下一篇:在 Python 中替换字符串中的字符 相关文章 在 Python 中清除控制台发布时间:2023/03/26 浏览次数:72 分类:Python 它演示了如何在 Python 中清除控制台。 在 Python 中运行 Bash 脚本发布时间:2023/03/25 浏览次数:134 分类:Python 本文将简要讨论使用 Python 脚本执行 Bash 脚本的方法。 Python 中的字符串大写发布时间:2023/03/24 浏览次数:64 分类:Python 在 Python 中,可以使用 2 种主要方法将字符串大写,即 upper()和 capitalize()函数。 Python 中的等效 toString()函数发布时间:2023/03/24 浏览次数:85 分类:Python 本教程演示了 Python 中 tostring()函数的等效功能 Python 中的 String Builder 等效发布时间:2023/03/24 浏览次数:81 分类:Python 本教程演示了 Python 中 StringBuilder 类的等效方法 在 Python 中替换字符串中的字符发布时间:2023/03/24 浏览次数:190 分类:Python 本教程演示了如何在 Python 中替换字符串中的字符 在 Python 中检查变量是否为字符串发布时间:2023/03/24 浏览次数:86 分类:Python 本教程演示了如何在 Python 中检查变量是否为字符串 在 Python 中的字符串中查找字符发布时间:2023/03/24 浏览次数:144 分类:Python 本教程演示如何查找字符串中字符的位置 从 Python 中的字符串中提取子字符串发布时间:2023/03/24 浏览次数:168 分类:Python 了解如何在 Python 中从字符串中提取子字符串 转载请发邮件至 [email protected] 进行申请,经作者同意之后,转载请以链接形式注明出处 本文地址: |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |