比较准确完整的中文字符正则校验

时间：2018-11-08 12:04:47 阅读：208 评论：0 收藏：0 [点我收藏+]

网上大多数校验中文的正则都是\u4e00-\u9fa5，经过实际测试，这个正则无法匹配中文标点，如（），。等

仔细研究了unicode的规范，本着尽量宽泛、遵循unicode分类的原则，总结了一套比较准确完整的校验规则：

// http://www.unicode.org/charts/PDF/U2000.pdf 一般标点
// http://www.unicode.org/charts/PDF/U3000.pdf CJK符号和标点
// http://www.unicode.org/charts/PDF/U4E00.pdf CJK统一表意文字
// http://www.unicode.org/charts/PDF/UFF00.pdf 半宽全宽形状
String COMMON_STRING_REGEX = "[\u2000-\u206f\u3000-\u303f\u4e00-\u9fef\uff00-\uffef]*";

比较准确完整的中文字符正则校验

原文：https://www.cnblogs.com/demonbug/p/9928231.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)