在我们日常开发中,会碰到计算字符串长度的需求,大部分情况下通过字符串的 length
属性能够获得需要的长度。
但是当字符串里的字符不在常用的 65536 个代码点(基本多文种平面,BMP)的时候,情况就复杂了。
比如最大输入长度是 6,但是当我输入 6 个 ??,却提示内容过长了。Why?
我们来执行 console.log(‘??‘.length)
看看,返回值是 2,Why?
原因就是 ?? 不在 BMP 上,它的代码点是 U+1F4A9(十进制表示是 128169)。
那我们如何获得组成 ?? 的 2 个代码点呢?可以参照以下步骤:
0x1F4A9
,转成二进制就是 128169;0x03D
和 0x0A9
;0x03D
加上 0xD800
(固定值)得到 0xD83D
,将 0x0A9
加上 0xDC00
(固定值)得到 0xDCA9
。以上 0xD83D
和 0xDCA9
就是 ?? 的两个代码点,用下面的方法可以验证
"\uD83D\uDCA9" === "\u{1F4A9}"
// true
原文:https://www.cnblogs.com/yinyuxing/p/15089377.html