js处理包含中文的字符串实例

ttx9n · 发表于 2017-10-11 08:48:12

下面小编就为大家带来一篇js处理包含中文的字符串实例。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧

场景：

js中String类型自带的属性length获取的是字符串的字符数目，但是前端经常会需要限制字符串的显示长度，一个中文字符又大概占两个英文小写字符的显示位置，所以中英文混合的情况下用length值来判断显示长度往往并不正确。

常规的解决办法是遍历字符串，中文字符计长度2，非中文字符计长度1，通过新计算出来长度总和来限制字符串的显示长度。看代码↓↓↓

var Tools ={
 //是否包含中文
 hasZh: function(str){
  for(var i = 0;i < str.length; i++)
  {
   if(str.charCodeAt(i) > 255) //如果是汉字，则字符串长度加2
    return true;
   return false;
  }
 },
 //重新计算长度，中文+2，英文+1
 getlen: function(str){
  var strlen = 0;
  for(var i = 0;i < str.length; i++)
  {
   if(str.charCodeAt(i) > 255) //如果是汉字，则字符串长度加2
    strlen += 2;
   else
    strlen++;
  }
  return strlen;
 },
 //限制长度
 limitlen: function(str, len){
  var result = "";
  var strlen = 0;
  for(var i = 0;i < str.length; i++)
  {
   if(str.charCodeAt(i) > 255) //如果是汉字，则字符串长度加2
    strlen += 2;
   else
    strlen++;

   result += str.substr(i,1);

   if(strlen >= len){
    break;
   }
  }
  return result;
 }
}

这种方法的原理是根据中英文的unicode编码范围不同来判断的，中文占2个字节，英文占1个字节，所以中文的unicode编码值肯定大于2^8-1=255。

上述方法可以更严谨一点：就是考虑unicode编码范围，具体的范围可以戳Unicode Table

PS： 汉字的unicode编码范围16进制为4E00-9FA5，10进制则为：19968-40869，即判断中文的准确表达式为：

str.charCodeAt(i)>=19968 && str.charCodeAt(i)<=40869

插一句不太严谨的话，代码不用限制太严谨的范围，毕竟你不知道用户(测试)会输哪些奇怪的东西。

以上这篇js处理包含中文的字符串实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

z835648964 · 发表于 2022-8-20 23:38:20

还有人在不。。。。。。。。。。啊

z80vh · 发表于 2022-11-24 23:52:54

谢谢下载来看看

3t0ukmu · 发表于 2023-1-14 13:49:34

谢谢小Y分享

ppwxcg · 发表于 2023-6-29 18:09:38

看看看看

idy6_yus · 发表于 2023-9-7 16:13:42

看看怎么样再说

lsc54 · 发表于 2023-11-7 19:17:26

啊，数码撒飒飒飒飒

feiyasqhr · 发表于 2024-4-5 19:44:15

天天源码论坛

3pjdk29w · 发表于 2024-4-21 08:03:03

哈哈哈哈哈哈哈

3mfwk4yf · 发表于 2024-5-23 01:21:24

下载来瞧瞧

账号		自动登录	找回密码
密码			立即注册

[JavaScript] js处理包含中文的字符串实例

相关帖子