php 截取中文字符串实现程序
在php中我们截取字符串可以使用自带的函数,但是自带的函数不支持中文截取,如果需要截取中文字符串我们需要现做一些操作,下面我来给各位朋友介绍.
针对GB2312的代码,代码如下:
-
-
-
- function sub_str($str, $start, $len) {
- $tmpstr = "";
- $strlen = $start + $len;
- for($i = 0; $i < $strlen; $i++) {
- if(ord(substr($str, $i, 1)) > 0xa0) {
- $tmpstr .= substr($str, $i, 2);
- $i++;
- } else
- $tmpstr .= substr($str, $i, 1);
- }
- return $tmpstr."...";
- }
针对uft8,代码如下:
- <?php
-
- function utf8substr($str, $from, $len)
- {
- return preg_replace('#^(?:[x00-x7f]|[xc0-xff][x80-xbf]+){0,'.$from.'}'.
- '((?:[x00-x7f]|[xc0-xff][x80-xbf]+){0,'.$len.'}).*#s',
- '$1',$str);
- }
- ?>
上面的方法肯定不实用,因为我希望可以自动识别支持任何编码的字符串截取,后来找到一个还算可以的分享给各位朋友,代码如下:
- <?php
-
-
-
-
-
-
-
-
-
-
-
-
-
- function sysSubStr($String,$Length,$Append = false)
- {
- if (strlen($String) < = $Length )
- {
- return $String;
- }
- else
- {
- $I = 0;
- while ($I < $Length)
- {
- $StringTMP = substr($String,$I,1);
- if ( ord($StringTMP) >=224 )
- {
- $StringTMP = substr($String,$I,3);
- $I = $I + 3;
- }
- elseif( ord($StringTMP) >=192 )
- {
- $StringTMP = substr($String,$I,2);
- $I = $I + 2;
- }
- else
- {
- $I = $I + 1;
- }
- $StringLast[] = $StringTMP;
- }
- $StringLast = implode("",$StringLast);
- if($Append)
- {
- $StringLast .= "...";
- }
- return $StringLast;
- }
- }
- $String = "www.phpfensi.com 走在中国自动化测试的前沿";
- $Length = "18";
- $Append = false;
- echo sysSubStr($String,$Length,$Append);
- ?>