php函数substr、mb_substr、mb_strcut截取中文比较 | 易学教程

一、函数说明
    substr、mb_substr、mb_strcut这三个函数都用来截取字符串，所不同的是：substr是最简单的截取，无法适应中文；mb_substr是按字来切分字符串，而mb_strcut是按字节来切分字符串，截取中文都不会产生半个字符的现象。
    这三个函数的前三个参数完全一致，即：
第一个参数是操作对象
第二个参数是截取的起始位置
第三个参数是截取的数量
    mb_substr和mb_strcut还有第四个参数：第四个参数可以根据不同的字符集进行设置

<?php
//对待一个UTF8的中文字符是3个长度
//对待一个gbk的中文字符是2个长度
header("content-Type:text/html;charset=utf-8");
//设置内部编码
mb_internal_encoding('UTF-8');
//测试
$cn_str="钓鱼岛是中国的hehe";
$en_str="this is just a test";
//使用substr
echo substr($cn_str,0,3).'<br/>'; //钓
echo substr($en_str,0,3).'<br/><br/>'; //thi
//使用mbsubstr()
echo "mb_substr-3:".mb_substr($cn_str,0,3).'<br/>'; //钓鱼岛按照字来划分
echo "substr-3:".substr($cn_str,0,3).'<br/>';//钓按照字节来划分
echo "mb_strcut-3:".mb_strcut($cn_str,0,3).'<br/><br/>'; //钓按照字节来划分
echo "mb_substr-4:".mb_substr($cn_str,0,4).'<br/>'; //钓鱼岛按照字来划分
echo "substr-4:".substr($cn_str,0,4).'<br/>'; //钓按照字节来划分(出现乱码)
echo "mb_strcut-4:".mb_strcut($cn_str,0,4).'<br/><br/>'; //钓按照字节来划分(不会出现乱码)
echo strlen($cn_str).'<br/>'; //26
echo mb_strlen($cn_str).'<br/>'; //12
echo iconv_strlen($cn_str).'<br/>';//26
?>

三、结论
substr、mb_strcut表现都不够理想，mb_substr可以正常使用，但前提是要安装php扩展库，否则就要自己写一个适应各种情况的截取函数了。

来源：oschina

链接：https://my.oschina.net/u/1773287/blog/405860

标签

易学教程内所有资源均来自网络或用户发布的内容，如有违反法律规定的内容欢迎反馈！
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!