首页 > 其他 > 详细

如何用正则提取中文字符

时间:2017-01-12 18:30:23      阅读:48      评论:0      收藏:0      [点我收藏+]

标签:简体   使用   pattern   gb2   如何   代码   维数   col   文字   

1.首先得把字符串转成utf-8的格式:

$str = iconv(charset, ‘utf-8‘, $str);//charset为你的字符原来的格式,包括:gb2312(简体中文),big5(繁体中文),utf8

2.使用preg_match_all进行提取:

preg_match_all(‘/[\x{4e00}-\x{9fa5}]+/u‘, $str, $r);
中文在utf8中代码是\u4e00-\u9fa5,但是是十六进制,所以转换成\x,这样得到的$r为二维数组,这个preg_match_all()函数第四个参数还有一个默认的PREG_PATTERN_ORDER,具体可以参考手册

如何用正则提取中文字符

标签:简体   使用   pattern   gb2   如何   代码   维数   col   文字   

原文:http://www.cnblogs.com/feliciashyuan/p/6279200.html

(0)
(0)
   
举报
评论 一句话评论(0
0条  
登录后才能评论!
© 2014 bubuko.com 版权所有 鲁ICP备09046678号-4
打开技术之扣,分享程序人生!
             

鲁公网安备 37021202000002号