您当前的位置：首页 > 网络编程 > php教程

php substr截断汉字乱码解决办法

时间：2015-01-23 来源：西部数据作者：西部数据

在php中substr是用来截取字符的,但是有朋友会发现把它来截英文字母是没有任何问题,但是如果截中文时会出现半个汉字乱码了,下面我来介绍一些解决办法.

substr() 函数返回字符串的一部分。

语法:substr(string,start,length)

实例代码如下:

<?php

echo substr("Hello world!",6);

?>

输出 world!

实例代码如下:echo substr('中国文',1);

结果就是筹码了,后来才知道中文与英文的区别在于内编码了,一个网站这样说到substr函数在截取字符时是按字节来截取的，中文字符在GB2312编码时为2个字节，utf-8编码时为3个字节，所以截取指定长度的字符串时如果截断了汉字，那么返回的结果显示出来便会出现乱码.

解决办法:1、利用mb_substr来截取,代码如下:

<?php

$str = '这样一来我的字符串就不会有乱码^_^';

echo "mb_substr:" . mb_substr($str, 0, 7, 'utf-8');

//结果：这样一来我的字

echo "<br>";

echo "mb_strcut:" . mb_strcut($str, 0, 6, 'utf-8');

//结果：这样

?>

但是如果要使用mb_substr截取我们需要使用使用mbstring扩展库,如果没有权限的朋友我们就可参考下面函数,代码如下:

function msubstr($str, $start, $len) {

  $tmpstr = "";

  $strlen = $start + $len;

  for($i = 0; $i < $strlen; $i++) {

   if(ord(substr($str, $i, 1)) > 0xa0) {

    $tmpstr .= substr($str, $i, 2);

    $i++;

   } else

    $tmpstr .= substr($str, $i, 1);

  }

  return $tmpstr;

}