HTML 字符编码
简介
网页包含了大量的文字,浏览器必须知道这些文字的编码方法,才能把文字还原出来。
一般情况下,服务器向浏览器发送 HTML 网页文件时,会通过 HTTP 头信息,声明网页的编码方式。
Content-Type: text/html; charset=UTF-8
上面代码中,HTTP 头信息的Content-Type
字段先声明,服务器发送的数据类型是text/html
(即 HTML 网页),然后声明网页的文字编码是UTF-8
。
网页内部也会再用<meta>
标签,再次声明网页的编码。
<meta charset="UTF-8">
字符的数字表示法
网页可以使用不同语言的编码方式,但是最常用的编码是 UTF-8。UTF-8 编码是 Unicode 字符集的一种表达方式。这个字符集的设计目标是包含世界上的所有字符,目前已经收入了十多万个字符。