String 对象
概述
String
对象是 JavaScript 原生提供的三个包装对象之一,用来生成字符串对象。
var s1 = 'abc';
var s2 = new String('abc');
typeof s1 // "string"
typeof s2 // "object"
s2.valueOf() // "abc"
上面代码中,变量s1
是字符串,s2
是对象。由于s2
是字符串对象,s2.valueOf
方法返回的就是它所对应的原始字符串。
字符串对象是一个类似数组的对象(很像数组,但不是数组)。
new String('abc')
// String {0: "a", 1: "b", 2: "c", length: 3}
(new String('abc'))[1] // "b"
上面代码中,字符串abc
对应的字符串对象,有数值键(0
、1
、2
)和length
属性,所以可以像数组那样取值。
除了用作构造函数,String
对象还可以当作工具方法使用,将任意类型的值转为字符串。
String(true) // "true"
String(5) // "5"
上面代码将布尔值true
和数值5
,分别转换为字符串。
静态方法
String.fromCharCode()
String
对象提供的静态方法(即定义在对象本身,而不是定义在对象实例的方法),主要是String.fromCharCode()
。该方法的参数是一个或多个数值,代表 Unicode 码点,返回值是这些码点组成的字符串。
String.fromCharCode() // ""
String.fromCharCode(97) // "a"
String.fromCharCode(104, 101, 108, 108, 111)
// "hello"
上面代码中,String.fromCharCode
方法的参数为空,就返回空字符串;否则,返回参数对应的 Unicode 字符串。
注意,该方法不支持 Unicode 码点大于0xFFFF
的字符,即传入的参数不能大于0xFFFF
(即十进制的 65535)。
String.fromCharCode(0x20BB7)
// "ஷ"
String.fromCharCode(0x20BB7) === String.fromCharCode(0x0BB7)
// true
上面代码中,String.fromCharCode
参数0x20BB7
大于0xFFFF
,导致返回结果出错。0x20BB7
对应的字符是汉字𠮷
,但是返回结果却是另一个字符(码点0x0BB7
)。这是因为String.fromCharCode
发现参数值大于0xFFFF
,就会忽略多出的位(即忽略0x20BB7
里面的2
)。
这种现象的根本原因在于,码点大于0xFFFF
的字符占用四个字节,而 JavaScript 默认支持两个字节的字符。这种情况下,必须把0x20BB7
拆成两个字符表示。
String.fromCharCode(0xD842, 0xDFB7)
// "𠮷"
上面代码中,0x20BB7
拆成两个字符0xD842
和0xDFB7
(即两个两字节字符,合成一个四字节字符),就能得到正确的结果。码点大于0xFFFF
的字符的四字节表示法,由 UTF-16 编码方法决定。
实例属性
String.prototype.length
字符串实例的length
属性返回字符串的长度。
'abc'.length // 3
实例方法
String.prototype.charAt()
charAt
方法返回指定位置的字符,参数是从0
开始编号的位置。
var s = new String('abc');
s.charAt(1) // "b"
s.charAt(s.length - 1) // "c"
这个方法完全可以用数组下标替代。
'abc'.charAt(1) // "b"
'abc'[1] // "b"
如果参数为负数,或大于等于字符串的长度,charAt
返回空字符串。
'abc'.charAt(-1) // ""
'abc'.charAt(3) // ""
String.prototype.charCodeAt()
charCodeAt()
方法返回字符串指定位置的 Unicode 码点(十进制表示),相当于String.fromCharCode()
的逆操作。
'abc'.charCodeAt(1) // 98
上面代码中,abc
的1
号位置的字符是b
,它的 Unicode 码点是98
。
如果没有任何参数,charCodeAt
返回首字符的 Unicode 码点。
'abc'.charCodeAt() // 97
如果参数为负数,或大于等于字符串的长度,charCodeAt
返回NaN
。
'abc'.charCodeAt(-1) // NaN
'abc'.charCodeAt(4) // NaN
注意,charCodeAt
方法返回的 Unicode 码点不会大于65536(0xFFFF),也就是说,只返回两个字节的字符的码点。如果遇到码点大于 65536 的字符(四个字节的字符),必须连续使用两次charCodeAt
,不仅读入charCodeAt(i)
,还要读入charCodeAt(i+1)
,将两个值放在一起,才能得到准确的字符。
String.prototype.concat()
concat
方法用于连接两个字符串,返回一个新字符串,不改变原字符串。
var s1 = 'abc';
var s2 = 'def';
s1.concat(s2) // "abcdef"
s1 // "abc"
该方法可以接受多个参数。
'a'.concat('b', 'c') // "abc"
如果参数不是字符串,concat
方法会将其先转为字符串,然后再连接。
var one = 1;
var two = 2;
var three = '3';
''.concat(one, two, three) // "123"
one + two + three // "33"
上面代码中,concat
方法将参数先转成字符串再连接,所以返回的是一个三个字符的字符串。作为对比,加号运算符在两个运算数都是数值时,不会转换类型,所以返回的是一个两个字符的字符串。