Ⅰ php正則匹配中文字元 排除符號
你指的連續,那麼就要求是兩個以上了:
$reg='/[x80-xff]{2,}/';
這個正則是表示匹配兩個位元組以上的多位元組字元(多位元組字元通常高位為 1)。
Ⅱ PHP正則匹配中文
在PHP里,包含數字、字母、下劃線或中文的正則表達式如下:$pattern = "/[0-9a-zA-Z_\x80-\ff]+/";
Ⅲ php preg_replace()正則匹配漢字,網上搜的都不對啊!
漢字在Unicode中稱作CJK 統一表意符號 (CJK Unified Ideographs),包括U+3400-U+4DBF/U+4E00-U+9FFF/U+20000-U+3FFFD,參見網路【統一碼】。
Ⅳ php正則表達式匹配漢字、字母、數字、下劃線
preg_match("/[a-z]{3,14}/",$content,[可選]$a);這個抄返回布爾值,$a得到的是數組,把匹配到的字元防在$a;
我之能舉這個給你了。。漢字可以網上去查。
還有表達試 去看看 我也記不得了。。
Ⅳ 求一個PHP正則表達式匹配(字母、數字、漢字、下劃線)
<?php
$pat='#^([a-zA-Z]+|[0-9]+|[x{4e00}-x{9fa5}]+)$#u';
$s="你好";
var_mp(preg_match($pat,$s));
Ⅵ PHP的正則表達式中使用中文(並匹配中文)的問題,原串為UTF8
<?php
$str = "中國勢力是(煙消雲散、再轉在、匣介)中國、類別置頂帖(來哦見好就收)、炒肉可示、需要城";
$preg2 = "/中國/sim" ;
preg_match_all($preg2, $str, $strResult, PREG_PATTERN_ORDER);
print_r($strResult);
?>
我的PHP文件是UTF-8編碼,不知道你的$str是從哪裡得到的呢?像上面一樣,我直接給$str賦值,這樣使用 /中國/sim 這個表達式沒有任何問題,會不會是你$str字元串的編碼與頁面編碼不一致呢?
Ⅶ php中正則匹配中文
厲害厲害!受教了~!
Ⅷ PHP正則提取中文部分內容,怎麼實現呀
中文可以用正則表達式進行匹配,但是具體匹配方法與中文的編碼方式有關:
如果是GBK(GB2312、GB1080),那麼中文的編碼范圍是:
x80-xff
如果是UTF-8編碼,那麼中文的編碼范圍是:
u4e00-u9fa5
那麼匹配漢字的正則表達式可以是:
/[x7f-xff]+/
或者
/[u4e00-u9fa5]+/
例子代碼,顯示文件中的所有漢字(GBK編碼):
<?php
$s=file_get_contents('1.txt');
if(preg_match_all('/[x7f-xff]+/',$s,$r)){
for($i=1;$i<count($r[0]);$i++)echo"$i ".$r[0][$i]." ";
}
?>
Ⅸ PHP正則匹配出漢字
html源碼中有兩個「知道」,一個是標題,一個鏈接
我的理解,是連接里的
用(?<=<a[^>]+>)(?=(知[\w&;]+|道[\w&;]*)?</a>)(知[\w&;]+|道[\w&;]*)?
得到的結果是:
知 道 (中間有&-n-b-s-p;)
對這個結果,再用一次replace("",「[^\\u4e00-\\u9fa5]+」,"");就可以得到知道了。
這個我無法一次得到。
我不會php哦,不能寫php代碼了。也不知道對樓主的意思理解的對不。要是有問題,請樓主再描述一下。