JavaScript 转义和编码

您所在的位置:网站首页 转义字符十六进制代码 JavaScript 转义和编码

JavaScript 转义和编码

2024-03-19 11:57| 来源: 网络整理| 查看: 265

JavaScript中转义字符的使用

当使用特殊字符(如单引号、双引号、撇号和&符号)时,将使用转义字符(反斜杠)。在字符前放置反斜杠,使其显示。 说起转义字符,大家最先想到的肯定是使用反斜杠,这也是我们最常见的,很多编程语言都支持。 除了反斜杠以外,在前端开发中,还有其他几种转义字符,也是较常见的, 转义字符从字面上讲,就是能够转变字符原本的意义,得到新的字符。常用在特殊字符的显示以及特定的编码环境中。

字符串中的转义

使用反斜杠来表示转义字符时,主要是在字符串中使用。这里就需要了解字符集和编码等知识,具体可见 前端开发中需要搞懂的字符编码。 字符集就是字符的集合,最常见的 :

ASCII字符集 :ASCII的任一个字符都可以被转义,使用的就是反斜杠加上数字编码,特殊的也能使用反斜杠加上字母。 Unicode字符集等:Unicode,也能进行转义,使用则是反斜杠加上码点。由于Unicode包含了ASCII的所有字符,且编码一致,所以都可算编码转义,而现在前端编程所涉及到的已经都是Unicode字符。

一般,反斜杠(\)在字符串中有特殊的含义,用来和后面的字符一起组合表示一些特殊字符,所以又被称为转义符。 反斜杠后面可以跟着的字符大致有以下几种:

字母 三位八进制 x 加上 两位十六进制 Unicode码点 字母

转义字符中最基础的就是:使用反斜杠\加上字母,表示那些无法输入表示特殊含义的字符,常见的有以下几种:

\b 后退键 \f 换页符 \n 换行符 \r 回车键 \t 制表符 \v 垂直制表符

以前在字符串拼接时,就经常使用\n、\t:

console.log("一缕清风\nKen") /* 一缕清风 Ken */

需要注意的是,这些字母是特殊的可应用于转义的字母。 如果是非特殊字母,加上反斜杠,则会忽略反斜杠,很多字符也是同样忽略反斜杠:

console.log('\a'); // a console.log('\"'); // " console.log('\?'); // ? console.log('\\a'); // \a console.log('\\"'); // \" console.log('\\?'); // \? 八进制数字

反斜杠后面跟3位八进制数,就代表一个转义字符:

console.log('\106'); // F console.log('\165'); // u console.log('\251'); // ©

取值范围:000-377,总共也是有256种字符,其中就包含了所有的ASCII码。 八进制和十六进制能转义的字符是一样的,进行进制转换即可。搞懂JavaScript中的进制与进制转换 在JS中,用这两种方式的转义字符是相等的:

console.log('\xA9' === '\251') // true console.log('\200' === '\x80') // true 十六进制数字

十六进制更常用,它的转义规则:\x,\x后跟上2位十六进制数。 因为只有两位,范围是:0x00-0xFF,所以这种方式也只能输出265种字符,其中:

0x00-0x7F 和ASCII码一致 0x80-0x9F 表示控制字符 0xA0-0xFF 表示文字字符 // 0x00-0x7F 和ASCII码一致 // 0x80-0x9F 表示控制字符 // 0xA0-0xFF 表示文字字符 console.log('\x00') console.log('\x7F') console.log('\x80') console.log('\x9F') console.log('\xA0') console.log('\xFF') console.log('\x67') // g console.log('\x75'); // u console.log('\xA9'); // © Unicode码点

提到Unicode,首先需明确的一点,JS中的字符串是基于 Unicode 的 UTF-16 编码方式。 Unicode字符规定了码点和字符平面。 码点使用从 U+0000 到 U+10FFFF 的方位来表示所有的字符。 如果直接使用码点来转义所有的Unicode字符,则使用规则:\u{},\u后跟上1-6位的十六进制:

console.log('\u{A9}') // © console.log('\u{597d}') // 好 console.log('\u{1f604}') // 😄

字符平面又分为基本平面和非基本平面。 其中对于基本平面(65536个字符)的字符,转义规则:\u,\u后跟上4位十六进制数:

console.log('\u00A9'); // © console.log('\u0075'); // u console.log('\u597d'); // 好

对于非基本平面的字符,则要使用UTF-16的码元规则,一般是两个码元:\u\u,\u后各4位十六进制:

console.log('\uD83D\uDE04'); // 😄 console.log('\uD83C\uDF34'); // 🌴

只要获取到字符的Unicode编号码点,即可以通过这种方式转义所有的字符。

正则表达式中的转义

在正则表达式中有许多特殊的符号,起着不同的作用,但如果要匹配这些特殊符号本身,就需要用到转义了。 这里的转义字符也是使用反斜杠,后面跟上需要匹配的符号,即可,如:+ 匹配加号。 在正则表达式中,需要反斜杠转义匹配的字符,一共是12个:

^ . [ $ ( ) | * + ? { \,

这些字符都是正则的特殊字符。

console.log(/5$/.test('5$')); // false console.log(/5\$/.test('5$')); // true

上面代码,$符号加了转义才能匹配成功,否则不匹配。 当使用RegExp方法时,正则参数是字符串,反斜杠\需要2个,因为字符串内会先转义一次:

console.log((new RegExp('5$')).test('5$')); // false console.log((new RegExp('5\$')).test('5$')); // false console.log((new RegExp('5\\$')).test('5$')); // true

上面代码中,只有第三行因为使用了两个反斜杠,才能转义成功,得到正确的值。

HTML中的转义

HTML中转义字符也是较常见的,主要有三种形式的转义。 最常见的是基于实体名称: & 后加上实体名称 再加上分号 ;: 空格 大于号 > > 实体名称转义以前是为了处理html中的特殊的字符显示问题,比如小于号 😄 好 &

基于实体名称转义的字符,也是被包含在Unicode字符集中的,所以也可以使用码点来进行转义。 在HTML中最常用到的转义字符,可见下面整理的表格:

字符名称名称转义码点转义"双引号""&和号&&


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3