相信很多人在使用PHP的过程中都遇到过生成文件乱码的情况,不论是使用 fwrite还是 file_put_contents 写入。 可能你会先尝试从编码入手尝试解决,但最终的结果往往是不理想的,尽管我们都将其转换为了 UTF-8 编码了... 那么究其根本原因是什么呢? 一句话:缺少头部BOM(当然,这里指的肯定不是Js的Bom) BOM既然提到了BOM,那么可能有的同学不太了解这个家伙,这里我简单说一下,老鸟可以跳过。 在 Windows 下用记事本之类的程序将文本文件保存为 UTF-8 格式时,记事本会在文件头前面加上几个不可见的字符( EF BB BF ),就是所谓的 BOM(Byte order Mark) 。 不仅限于 记事本保存的文件,只要在文件的开口包含了 “EF BB BF” 几个不可见的字符(十六进制应该是是 xEFxBBxBF ,用二进制编辑文件可见)。这像是一个约定俗成的东西,当系统看到这玩意的时候,就会觉得你这个文件是 UTF-8 编码的。 这就是为什么当文件没有BOM时,你给用户呈现的文件就可能是乱码的原因了。 PS : 其实你可以将BOM理解成HTML中的charset属性和XML中的encoding属性,就是起一个标识作用。 方案那么如何在 PHP 中输出 BOM 呢? 答案是在所有内容输出之前输出: print(chr(0xEF).chr(0xBB).chr(0xBF)); 当然,如果你是在生成文件,可能是下面两种: fwrite($file, chr(0xEF).chr(0xBB).chr(0xBF)); file_put_contents($file, chr(0xEF).chr(0xBB).chr(0xBF));(责任编辑:最模板) |