UTF.COM.CN

匹配UTF-8汉字的正则表达式

作者:佚名 | 来源:网络 | 添加时间:2007-02-06 14:55:02 | 人气:3390

匹配UTF-8汉字的正则表达式

需要做一个用户注册页面,用户名只允许中文和英文。
根据网上文章,UTF-8用3个字节表示汉字,chr(228)~chr(233),chr(128)~chr(191),chr(128)~chr(191)。
下面的POSIX正则式用来匹配汉字或者英文大小写字母。
用ereg函数测试成功。同时匹配日文汉字,但不匹配日文假名。

$pat = "^(([{$code1}-{$code2}][{$code3}-{$code4}][{$code3}-{$code4}])|[A-Za-z]){4,10}$";

想找O'reilly 的CJKV编码看看,还没找到。
责任编辑:冬天来了
【字号: 】【去论坛讨论】【发表评论】【打印本文】【告诉好友】【关闭窗口
网友评论(评论内容只代表网友观点,与本站立场无关!)

姓名:

验证码: 点击刷新