中文排名在mysql中是一个比较纠结的问题,由于mysql默认的是uft8数据库编码,所以如果你在未操作的情况下来对中文进行排序是很不理想的,我们可以对数据库或mysql查询进行修改.
解决方法:
1.对于包含中文的字段加上"binary"属性,使之作为二进制比较,例如将"name char(10)"改成"name char(10)binary"。
2.如果你使用源码编译MySQL,可以编译MySQL时使用 --with--charset=gbk 参数,这样MySQL就会直接支持中文查找和排序了(默认的是latin1)。也可以用 extra-charsets=gb2312,gbk 来加入多个字符集
解决方法二:不影响到其它mysql服务器直接在select查询中转换
1、不想改变表定义及默认编码的情况,将字段先转换成gbk编码再排序:
- SELECT * FROM table ORDER BY CONVERT( chinese_field USING gbk ) ;
-
-
- select name from test1 order by convert(name using gb2312) asc;
前提是在安装mysql时安装了gbk字符集,不然会报错:
#1115 - Unknown character set: 'gbk'
在编译源码时加上gbk编码即可,如果已经安装好了,重新编译再安装,重新编译安装一般不会影响mysql的已有设置,包括数据都不会受到影响.
2、直接将字段的字符集改成gbk,然后直接使用order by 排序即可.
mysql 5.x支持某列单独定义字符集.
3、网上也有人说将字段定义加上binary属性也能达到效果,未作测试,不敢评论.
mysql的文档中也提到字符集校对规则:
SELECT * FROM t1 ORDER BY a COLLATE utf8_bin;
结论是:查询的时候,通过convert函数,把查询出来的数据使用的字符集gb2312编码就可以了,然后使用convert之后的中文排序,但是如果真的去把表中字段的字符集改成gb2312,又会涉及到很多编码的问题,页面传值啊,从数据库中存取啊,很麻烦,只要在查询的时候,指定一下字符集,并不是真的把物理字段改成gb2312,很简单. |