字符串按要求的字符编码来转换有bug怎么办
2021-07-20
详细说明:
——根据需要的字符编码转换字符串
有一个bug,一些生僻字不会被转换。当然,在配置第二个参数的时候,可以稍微弥补一下默认的缺陷,这样转换就不会被截断了。用法如下
("UTF-8","//",$data);
这样,当遇到生词转换失败时,会忽略失败,继续转换后面的内容。
iconv
string iconv ( string $in_charset , string $out_charset , string $str )
第一个参数:内容原的编码
第二个参数:目标编码
第三个参数:要转的字符串
函数返回字符串
php
$instr = ‘测试’;
// GBK转UTF-8
$outstr = iconv(‘GBK’,'UTF-8′,$instr);
?>
返回值
返回转换后的字符串,失败时返回。
详细说明:
为了保证转换的成功率,我们可以使用另一个转换函数
,这个函数效率不高。另外这个功能也可以省略第三个参数来自动识别内容码,但是最好不要使用,影响效率。如果需要注意的话编码转换 php,和参数的顺序是不一样的。注意。
附上两个函数编码转换 php,简单使用:
mb_convert_encoding
string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] )
第一个参数:要处理的字符串
第二个参数:目标编码
第三个参数:内容原编码,它可以是一个 array 也可以是逗号分隔的枚举列表
$instr = '测试';
// GBK转UTF-8
$outstr = mb_convert_encoding($instr,'UTF-8','GBK',);
$str = mb_convert_encoding($instr, "UCS-2LE", "JIS, eucjp-win, sjis-win");
?>
个人建议在遇到转码问题时多保险一些。
——转换一个或多个变量的字符编码
mb_convert_variables ( $to_encoding , $from_encoding , &$vars [, mixed &$... ] )
将变量 vars 的代码从代码转换为代码。
mb_convert_variables() 会拼接变量数组或对象中的字符串来检测编码,因为短字符串的检测往往会失败。因此,不能在一个数组或对象中混合使用编码。
to_encoding 将 string 转换成这个编码。
from_encoding 可以指定为一个 array 或者逗号分隔的 string,它将尝试根据 from-coding 来检测编码。 当省略了 from_encoding,将使用 detect_order。
vars 是要转换的变量的引用。 参数可以接受 String、Array 和 Object 的类型。 mb_convert_variables() 假设所有的参数都具有同样的编码。
额外的 vars。
返回值 :
成功时返回转换前的字符编码,失败时返回 FALSE。
实例:
/* 转换变量 $post1、$post2 编码为内部(internal)编码 */
$interenc = mb_internal_encoding();
$inputenc = mb_convert_variables($interenc, "ASCII,UTF-8,SJIS-win", $post1, $post2);
?>
——设置/获取内部字符编码
mixed mb_internal_encoding ([ string $encoding = mb_internal_encoding() ] )
参数 :
encoding 字符编码名称使用于 HTTP 输入字符编码转换、HTTP 输出字符编码转换、mbstring 模块系列函数字符编码转换的默认编码。
返回值 :
如果设置了 encoding,则成功时返回 TRUE, 或者在失败时返回 FALSE。 In this case, the character encoding for multibyte regex is NOT changed. 如果省略了 encoding,则返回当前的字符编码名称。
/* 设置内部字符编码为 UTF-8 */
mb_internal_encoding("UTF-8");
/* 显示当前的内部字符编码*/
echo mb_internal_encoding();
?>
详细说明:
——检测字符的编码
string mb_detect_encoding ( string $str [, mixed $encoding_list = mb_detect_order() [, bool $strict = false ]] )
检查字符串str的编码。
参数
str 待检查的字符串。
encoding_list 是一个字符编码列表。 编码顺序可以由数组或者逗号分隔的列表字符串指定。
如果省略了 encoding_list 将会使用 detect_order。
strict strict 指定了是否严格地检测编码。 默认是 FALSE。
返回值
检测到的字符编码,或者无法检测指定字符串的编码时返回 FALSE。
当字符串编码未知时对字符串进行编码:
1、不管是什么字符串编码,都会转成gbk
function getSafeStr($str){
$s1 = iconv('utf-8','gbk//IGNORE',$str);
$s0 = iconv('gbk','utf-8//IGNORE',$s1);
if($s0 == $str){
return $s1;
}else{
return $str;
}
}
2、不管是什么字符串编码,都会转为utf-8
function getSafeStr($str){
$s1 = iconv('gbk','utf-8//IGNORE',$str);
$s0 = iconv('utf-8','gbk//IGNORE',$s1);
if($s0 == $str){
return $s1;
}else{
return $str;
}
}
获取字符串编码方式:
function getcode($str)
{
$s1 = iconv('utf-8','gbk//IGNORE',$str);
$s0 = iconv('gbk','utf-8//IGNORE',$s1);
if($s0 == $str){
return 'utf-8';
}else{
return 'gbk';
}
}