首先说明一下,我以前使用PERL,保存文件用DBM数据库,有5万多条记录,每条记录有15个字段,现在想用MYSQL,要把记录导过来.
第一步,将所有的DBM记录导入到了一个文本文件,每个字段之间用TAB分开(就是"t"),每条记录换行结束.
第二步,将数据读入数组,并且打开数据库和定义预处理,代码如下:
- <?php
- $dbline=file("g:/allrecord.txt");
- $collen=array(8,50,80,20,20,30,3,20,1,1,20,35,35,35,2); #表里面每个字段的长度数值
-
- $db=new mysqli('localhost','me','mypass','allrecdb');
- if(mysqli_connect_errno()) {
- echo "Can not connect db!";
- exit;
- }
- $q->query("SET names 'gb2312'");
-
- $q="INSERT INTO customers VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)";
-
- $s=$db->prepare($q); #预定义插入记录
-
-
- ?>
数据库有15个字段,为了方便导入,已经设定全部类型为CHAR,长度从1到100不等,具体等同$collen的数值;并且没有任何字段设置UNIQUE或者PRIMARY KEY,在命令行用INSERT命令插入记录成功,代码如下:
- <?php
- foreach($dbline as $line) {
- $rec=explode("t",trim($line));
-
-
- $rec[$j]=substr($rec[$j],0,$collen[$j]);
- }
- for($i=0;$i<count($rec);$i++) {
- $rec[$i]=strval($rec[$i]);
- }
- $s->bind_param("sssssssssssssss",$rec[0],$rec[1],$rec[2],$rec[3],$rec[4],$rec[5],$rec[6],$rec[7],$rec[8],$rec[9],$rec[10],$rec[11],$rec[12],$rec[13],$rec[14]);
- $s->execute();
- }
- $s->close();
- $db->close();
- ?>
经过几个小时的调试,发现任何字串超过字段长度就不能添加,所以做了如下处理.
1) 先把每个记录的每个字段的长度进行了处理,代码如下:
- for($j=0;$j<count($rec);$j++) {
- $rec[$j]=substr($rec[$j],0,$collen[$j]);
- }
2) 再处理插入,代码如下:
- $s->bind_param("sssssssssssssss",$rec[0],$rec[1],$rec[2],$rec[3],$rec[4],$rec[5],$rec[6],$rec[7],$rec[8],$rec[9],$rec[10],$rec[11],$rec[12],$rec[13],$rec[14]);
- $s->execute();
这样就可以插入记录了.
目前剩下的问题是,任何带有汉字的记录,都不能插入(在命令行可以).
查了资料,在命令行alter database crm character set 'gb2312',在脚本查询前加入$db->query("SET names 'gb2312'")都没用,也没找到my.ini去改default-character-set=gb2312.
难道php5.5暂时不支持中文?
MYSQL太多稀奇古怪的提示,解决不了问题,所有装上了SQLITE,在命令行导入文本记录,发现了问题.
1)某些字段中存在换行符,但是在任何文本编译器中不换行或者不显示。这样会在导入的时候,1行变成2行,列参数自然不对了。
解决方案:用str_replace($line,char(13));把每行内的换行符替换掉,然后把所有记录存入tmp.txt.
2)再进行命令行的导入,代码如下:
- sqlite3>.import tmp.txt customers
- sqlite3>select count(*) from cusomers;
- 57491
显示导入成功,可见,批量导入的时候,一定要处理好那些隐藏的特殊字符,由于时间关系,没有测试MYSQL的情况,晚上有空再确认一下同样方案是否可行. |