用户名:
密 码: 记住
您当前的位置:首页 > 网络编程 > php教程

php mb_detect_encoding判断字符串编码方法

时间:2015-01-23  来源:西部数据  作者:西部数据

在php中利用mb_detect_encoding可以判断给我们的字符是那个类型的编码了,从而我们就可以利用inconv进行字符转换了,下面给大家介绍几个例子.

例子,利用mb_detect_encoding()判断字符是否为uft-8编码,代码如下:

  1. $encode = mb_detect_encoding($qarray('GB2312','GBK','UTF-8')); 
  2. echo $encode."<br/>"
  3. if($encode=="GB2312"
  4.     $q = iconv("GBK","UTF-8",$q); 
  5. else if($encode=="GBK"
  6.     $q = iconv("GBK","UTF-8",$q); 
  7. else if($encode=="EUC-CN"
  8.     $q = iconv("GBK","UTF-8",$q); 
  9. else//CP936 
  10.     //$q = iconv("GB2312","UTF-8",$q); 

可是 mb_detect_encoding 存在一个硬伤,经常出现判断不准确的情况,或许这样就可以解决,代码如下:

  1. // 使用 iconv 转换并判断是否等值,效率不高 
  2. function is_utf8 ($str) { 
  3.     if ($str === iconv('UTF-8''UTF-8//IGNORE'$str)) { 
  4.         return 'UTF-8'
  5.     } 
  6. // 多种编码的情况 
  7. function detect_encoding ($str) { 
  8.     foreach (array('GBK''UTF-8'as $v) { 
  9.         if ($str === iconv($v$v . '//IGNORE'$str)) { 
  10.             return $v
  11.         } 
  12.     } 

通过以上方式得到字符串编码信息后,就可以利用 iconv 或 mb_convert_encoding 来转换编码了.

问题:可是当 $keytitle  = '%D0%BE%C6%AC'; 时,检测结果却是UTF-8,这其实不算是bug,我们不应当过于依赖mb_detect_encoding,当字符串较短时,检测结果产生偏差的可能性很大.

解决方法,代码如下:

$encode = mb_detect_encoding($keytitle, array('ASCII','GB2312′,'GBK’,'UTF-8');

来顶一下
返回首页
返回首页
推荐资讯
WiFi太不安全:7岁女孩11分钟内入侵公共网络 WiFi太不安全:7岁女孩11分钟内入侵近期刚刚发布研究说WiFi网络能获得人们手机里多少私人信息,
不服跑个分?人工智能也出现“刷分”乱象 不服跑个分?人工智能也出现“刷分2014年,人工智能领域突然爆发,成为了科研和科技创业的热门
相关文章
栏目更新
栏目热门