正则匹配换行符、英文、非英文（比如中文）

时间：2019-05-20 16:31:01 阅读：104 评论：0 收藏：0 [点我收藏+]

今天在Java中想使用正则表达式来获取一段文本中的任意字符。于是很随意得就写出如下匹配规则：
(.*)
结果运行之后才发现，无法获得换行之后的文本。于是查了一下手册，才发现正则表达式中，“.”(点符号)匹配的是除了换行符“\n”以外的所有字符。同时，手册上还有一句话：要匹配包括 ‘\n‘ 在内的任何字符，请使用像 ‘[.\n]‘ 的模式。于是我将正则表达式的匹配规则修改如下：
([.\n]*)，当然，如果是在java程序中直接写到话，需要改为([.\\n]*)
结果再次运行程序，发现什么内容也取不到了。我百思不得其解，又将其修改为如下规则：
([.|\n]*) 以及 ([\n.]*)
结果还是不行，什么内容都取不到。看来点符号和换行符卯上劲了～
然后上网一查，虽然没有查出上述规则到底是什么地方出问题了，但是查出了一个解决办法，经过一试，果然可以匹配包括换行符在内的任意字符，以下为正确的正则表达式匹配规则：
([\s\S]*)
同时，也可以用 “([\d\D]*)”、“([\w\W]*)” 来表示。

在文本文件里, 这个表达式可以匹配所有的英文
/[ -~]/
这个表达式可以匹配所有的非英文(比如中文)
/[^ -~]/
/是VI里用的. 你在editplus或程序里不需要/

原文：https://www.cnblogs.com/liujinyu/p/10894455.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)