html声明charset=“utf |
您所在的位置:网站首页 › 怎么让网站显示中文 › html声明charset=“utf |
1.情景展示
html文件已经声明字符集为UTF-8,但是浏览器访问依旧乱码。 标题和页面内容都是乱码,这是怎么回事? 2.原因分析charset="UTF-8"是让浏览器要用utf-8来解释,而文档的编码格式,是保存时的选择决定的。 也就是说:这个HTML文件保存时的字符集不是UTF-8! 所以,HTML的编码格式不是utf-8却让浏览器以utf-8的格式进行解析,自然会乱码。 但是,事实果真如此吗? 使用notepad++打开该文件,发现文档的字符集就是:utf-8。 这是不是很奇怪? 3.解决方案从网上看到,说是默认编码格式是ANSI,需要改成UTF-8,显然,我的格式现在已经是UTF-8了,为什么还是乱码? 抱着死马当活马医的态度,选中文件--》打开方式选择记事本--》文件另存为:(编码格式已经默认为UTF-8了) 替换原文件。 这个时候,再用notepad++打开该文件,你会发现该文件编码集已经发生了改变: 编码集由UTF-8改为UTF-8-BOM了。 这次再用浏览器访问该网页,中文显示不再乱码了。 4.效果展示 到这就结束了,怎么可能,程序员的探索精神哪里去了? 5.扩展应用 对于已经熟练使用开发工具的人,谁也不会傻到将文档的编码集设置为ANSI的,指定文档编码集的工作已经由开发工具替代了,我们只需要设置一下就好了。 那么,现在来探索一下,使用ANSI编码的html文件,究竟能不能被浏览器正确解析。 第一步:在桌面新建一个文本文档。 双击打开,手敲html模板: 保存之后,修改文件后缀名为html 使用浏览器打开,可以正常显示,不会乱码! 此时的文档编码为:ANSI,可以使用记事本重新打开该html文件--》文件--》另存为: 或者,直接使用notepad++打开该文件,右下角显示的就是:该文件的编码集。 这就可以证明,使用记事本创建的文件,默认的编码集是:ANSI。 第二步:添加uf-8声明,告知浏览器以utf-8格式解析html内容 再次打开浏览器,显示已经乱码了。 这,才是网络上流传的由ANSI编码引起乱码的真相!!! 第三步:将该文件的字符集改为utf-8。 使用记事本打开该文件--》另存为--》字符集指定为UTF-8,保存,替换原文件 使用浏览器再次访问,这就又可以显示正常了。 此时显示正常是因为:文档编码集为UTF-8,浏览器也以UTF-8的字符集来解析html文件。 此时,再用notepad++打开,右下角的字符集也变成了:UTF-8-BOM。 第四步:得出结论。 使用Windows记事本新建的文件,默认字符集是:ANSI,另存为UTF-8格式,其实际格式为带有BOM的utf-8,并不是我们平常开发是指定的(真正意义上的)utf-8! 此时,是不是完事了?没有,继续! 新的问题来了:为什么UTF-8-BOM,浏览器解析不乱码,而UTF-8,浏览器解析就乱码呢? 通过notepad++,将该文件的字符集改为无bom格式的utf-8,也就是真正的utf-8。 修改成功。 保存,再次使用浏览器打开该文件,你会发现:仍然可以正常显示。 是不是很奇怪?为了进一步验证,我们这次再把刚开始的那个html文件由utf-8-bom改成utf-8试试! 结果还是不行,还是会乱码! 结论:我这种情况,估计很少有人碰到,不管它了,就这吧。不过,可以肯定的是: 不管文档的编码集是UTF-8,还是UTF-8-BOM,都不影响浏览器以UTF-8字符集进行正常解析中文! 还想继续深入了解UTF-8与UTF-8(BOM)可以看这篇文章:UTF-8与UTF-8(BOM)区别和一些说明 但是,至于为什么开头的文件使用UTF-8为何会乱码,无从得知! 补充:20191119 如果你使用的是jsp,一定要加上这段代码: 否则jsp转java的时候使用的字符集是iso-8859-1,servlet返回的html文件的字符集也是iso-8859-1,而不是utf-8。如下图所示: 换句话说,虽然将jsp文件的字符集是utf-8,但是tomcat使用java编译时使用的却是iso-8859-1,所以最终响应到浏览器的html的编码集是iso-8859-1; 而我们实际开发的时候字符集是utf-8,所以当页面存在中文的时候就会出现乱码问题。 写在最后哪位大佬如若发现文章存在纰漏之处或需要补充更多内容,欢迎留言!!! 转载至:https://www.cnblogs.com/Marydon20170307/p/11362559.html |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |