您现在的位置是:首页 > 学无止境 > 其他网站首页其他 PHP正则表达式匹配中文及生僻字

PHP正则表达式匹配中文及生僻字

  • 莫愁
  • 其他
  • 2019-09-11
简介php基本汉字的unicode编码匹配在[\x{4e00}-\x{9fa5}]范围,如果要加上一些生僻字,补充汉字,扩展汉字就需要增加匹配的范围。
字数 303

php基本汉字的unicode编码匹配在[\x{4e00}-\x{9fa5}]范围,如果要加上一些生僻字,补充汉字,扩展汉字就需要增加匹配的范围。

php正则匹配代码:

//自动转UTF-8编码 
$str = "鿊"; 
$encode = mb_detect_encoding($str , array("ASCII",'UTF-8',"GB2312","GBK",'BIG5','LATIN1')); 
if($encode != 'UTF-8'){
     $str = mb_convert_encoding($str , 'UTF-8', $encode);
 } 
$res = preg_match("/^([\x{4e00}-\x{9fa5}]|[\x{9fa6}-\x{9fef}]|[\x{3400}-\x{4db5}]|[\x{20000}-\x{2ebe0}]){2,15}$/u", $str ); 
if (!$res) {
     echo "不是中文汉字";
 }


转载: 感谢您对莫愁个人博客网站平台的认可,非常欢迎各位朋友分享到个人站长或者朋友圈,但转载请说明文章出处“来源莫愁个人博客 https://www.mochoublog.com/study/343.html”。

文章评论

    • 评论
    人参与,条评论

技术在线

服务时间

周一至周日 12:00-22:00

关闭下雪
关闭背景特效