服务器上有一个utf8编码的csv文件,经过php下载到本地之后,用excel打开,发现乱码了。原因是这个csv文件没有BOM头。

BOM头是放在UTF-8编码的文件的头部的三个字符(0xEF 0xBB 0xBF,即BOM)占用三个字节,用来标识该文件属于UTF-8编码。

所以在php里面下载utf8编码的csv的时候,需如下方代码所示,添加BOM头:

$downloadUrl = '/home/nemo/firDir/test.csv';
$fileName = 'test.csv';
ini_set('memory_limit', '128M');
header('Content-type: application/octet-stream;charset=utf-8');
header('Content-Disposition: attachment; filename=' . $fileName);
ob_end_clean();
echo chr(0xEF).chr(0xBB).chr(0xBF); // 输出BOM头
readfile($downloadUrl);

因为php不能识别bom头,当需要读取用户上传的文件内容时,也需要删除bom头。

$filePath = '/home/nemo/firDir/test.txt';
$data = file_get_contents($filePath);
$data = trim($data, chr(0xEF) . chr(0xBB) . chr(0xBF));

……
……