2023-12-01 分类: 网站建设
php字符编码转换类,支持ANSI、big、UTF-8、UTF-8+bom相互转换。
四种常见的文本文件编码方式
ANSI 编码:
无文件头(文件编码开头的有效字节)
ANSI编码的字母数字占一个字节,汉字占两个字节
回车换行,单字节,十六进制表示为0d 0a
编码:
文件头,十六进制表示为FF FE
每个字符用两个字节编码
回车,换行,双字节,十六进制表示为000d 000a
大编码:
文件头的十六进制表示为FE FF
后面的编码就是把字符的高位放在前面,低位放在后面,正好是编码的逆过程
回车,换行php转unicode编码,双字节php转unicode编码,十六进制表示为 0d00 0a00
UTF-8 编码:
文件头,十六进制表示为EF bb bF
UTF-8 是一种可变长度的字符编码。数字、字母、回车、换行都用1个字节表示,汉字占3个字节。
回车换行,单字节,十六进制表示为0d 0a
转换原则:先将字符编码转换为UTF-8,再由UTF-8转换为对应的字符编码。
..php
_allow_charset)){ $this->_in_charset = $in_charset; } // 检查输出编码 if(in_array($out_charset, $this->_allow_charset)){ $this->_out_charset = $out_charset; } } /** 转换 * @param String $str 要转换的字符串 * @return String 转换后的字符串 */ public function convert($str){ $str = $this->convToUtf8($str); // 先转为utf8 $str = $this->convFromUtf8($str); // 从utf8转为对应的编码 return $str; } /** 把编码转为UTF-8编码 * @param String $str * @return String */ private function convToUtf8($str){ if($this->_in_charset=='utf-8'){ // 编码已经是utf-8,不用转 return $str; } switch($this->_in_charset){ case 'utf-8bom': $str = substr($str, 3); break; case 'ansi': $str = iconv('GbK', 'UTF-8//IGNORE', $str); break; case 'unicode': $str = iconv('UTF-16le', 'UTF-8//IGNORE', substr($str, 2)); break; case 'unicodebe': $str = iconv('UTF-16be', 'UTF-8//IGNORE', substr($str, 2)); break; default: break; } return $str; } /** 把UTF-8编码转换为输出编码 * @param String $str * @return String */ private function convFromUtf8($str){ if($this->_out_charset=='utf-8'){ // 输出编码已经是utf-8,不用转 return $str; } switch($this->_out_charset){ case 'utf-8bom': $str = "\xef\xbb\xbf".$str; break; case 'ansi': $str = iconv('UTF-8', 'GbK//IGNORE', $str); break; case 'unicode': $str = "\xff\xfe".iconv('UTF-8', 'UTF-16le//IGNORE', $str); break; case 'unicodebe': $str = "\xfe\xff".iconv('UTF-8', 'UTF-16be//IGNORE', $str); break; default: break; } return $str; } } // class end ?>
演示:将 big 转换为 utf-8+bom
convert($str); file_put_contents('response/utf-8bom.txt', $response, true); ?>
源码下载地址:点击查看
以上介绍了pHp字符编码转换类,支持ANSI、big、UTF-8、UTF-8+bom之间的转换,包括内容,希望对pHp教程感兴趣的朋友有所帮助.
免责声明:本文首发于php中文网。转载请注明出处。感谢您的尊重!如果您有任何问题,请联系我们
网页题目:四种常见文本文件编码方式ANSI编码:无文件头(文件编码开头标志性)
当前地址:/news48/297848.html
成都网站建设公司_创新互联,为您提供小程序开发、Google、网站建设、电子商务、面包屑导航、移动网站建设
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联
猜你还喜欢下面的内容