首页 > 其他 > 详细

leetcode题解之正则表达式匹配

时间:2020-06-05 15:30:42      阅读:38      评论:0      收藏:0      [点我收藏+]

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.‘ 和 ‘*‘ 的正则表达式匹配。

‘.‘ 匹配任意单个字符
‘*‘ 匹配零个或多个前面的那一个元素

所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

说明:

  • s 可能为空,且只包含从 a-z 的小写字母。
  • p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *

示例 1:

输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 ‘*‘ 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 ‘a‘。因此,字符串 "aa" 可被视为 ‘a‘ 重复了一次。

示例 3:

输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个(‘*‘)任意字符(‘.‘)。

示例 4:

输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 ‘*‘ 表示零个或多个,这里 ‘c‘ 为 0 个, ‘a‘ 被重复一次。因此可以匹配字符串 "aab"。

示例 5:

输入:
s = "mississippi"
p = "mis*is*p*."
输出: false

方法 1:回溯

想法

如果没有星号(正则表达式中的 * ),问题会很简单——我们只需要从左到右检查匹配串 s 是否能匹配模式串 p 的每一个字符。

当模式串中有星号时,我们需要检查匹配串 s 中的不同后缀,以判断它们是否能匹配模式串剩余的部分。一个直观的解法就是用回溯的方法来体现这种关系。

算法

如果没有星号,我们的代码会像这样:

def match(text, pattern):
    if not pattern: return not text
    first_match = bool(text) and pattern[0] in {text[0], ‘.‘}
    return first_match and match(text[1:], pattern[1:])

如果模式串中有星号,它会出现在第二个位置,即 pattern[1]\text{pattern[1]} 。这种情况下,我们可以直接忽略模式串中这一部分,或者删除匹配串的第一个字符,前提是它能够匹配模式串当前位置字符,即 pattern[0]\text{pattern[0]} 。如果两种操作中有任何一种使得剩下的字符串能匹配,那么初始时,匹配串和模式串就可以被匹配。

class Solution {
    public boolean isMatch(String text, String pattern) {
        if (pattern.isEmpty()) return text.isEmpty();
        boolean first_match = (!text.isEmpty() &&
                               (pattern.charAt(0) == text.charAt(0) || pattern.charAt(0) == ‘.‘));
    <span class="hljs-keyword">if</span> (pattern.length() &gt;= <span class="hljs-number">2</span> &amp;&amp; pattern.charAt(<span class="hljs-number">1</span>) == <span class="hljs-string">‘*‘</span>){
        <span class="hljs-keyword">return</span> (isMatch(text, pattern.substring(<span class="hljs-number">2</span>)) ||
                (first_match &amp;&amp; isMatch(text.substring(<span class="hljs-number">1</span>), pattern)));
    } <span class="hljs-keyword">else</span> {
        <span class="hljs-keyword">return</span> first_match &amp;&amp; isMatch(text.substring(<span class="hljs-number">1</span>), pattern.substring(<span class="hljs-number">1</span>));
    }
}

}


class Solution(object):
def isMatch(self, text, pattern):
if not pattern:
return not text

    first_match = bool(text) <span class="hljs-keyword">and</span> pattern[<span class="hljs-number">0</span>] <span class="hljs-keyword">in</span> {text[<span class="hljs-number">0</span>], <span class="hljs-string">‘.‘</span>}

    <span class="hljs-keyword">if</span> len(pattern) &gt;= <span class="hljs-number">2</span> <span class="hljs-keyword">and</span> pattern[<span class="hljs-number">1</span>] == <span class="hljs-string">‘*‘</span>:
        <span class="hljs-keyword">return</span> (self.isMatch(text, pattern[<span class="hljs-number">2</span>:]) <span class="hljs-keyword">or</span>
                first_match <span class="hljs-keyword">and</span> self.isMatch(text[<span class="hljs-number">1</span>:], pattern))
    <span class="hljs-keyword">else</span>:
        <span class="hljs-keyword">return</span> first_match <span class="hljs-keyword">and</span> self.isMatch(text[<span class="hljs-number">1</span>:], pattern[<span class="hljs-number">1</span>:])

复杂度分析

  • 时间复杂度:用 TTPP 分别表示匹配串和模式串的长度。在最坏情况下,函数 match(text[i:], pattern[2j:]) 会被调用 (i+ji)\binom{i+j}{i} 次,并留下长度为 O(T?i)O(T - i)O(P?2?j)O(P - 2*j) 长度的字符串。因此,总时间为 i=0Tj=0P/2(i+ji)O(T+P?i?2j)\sum_{i = 0}^T \sum_{j = 0}^{P/2} \binom{i+j}{i} O(T+P-i-2j) 。通过本文以外的一些知识,我们可以证明它的时间复杂度为 O((T+P)2T+P2)O\big((T+P)2^{T + \frac{P}{2}}\big)

  • 空间复杂度:对于 match 函数的每一次调用,我们都会产生如上所述的字符串,可能还会产生重复的字符串。如果内存没有被重复利用,那么即使只有总量为 O(T2+P2)O(T^2 + P^2) 个不同的后缀,也会花费总共 O((T+P)2T+P2)O\big((T+P)2^{T + \frac{P}{2}}\big) 的空间。

方法 2: 动态规划

想法

因为题目拥有 最优子结构 ,一个自然的想法是将中间结果保存起来。我们通过用 dp(i,j)\text{dp(i,j)} 表示 text[i:]\text{text[i:]}pattern[j:]\text{pattern[j:]} 是否能匹配。我们可以用更短的字符串匹配问题来表示原本的问题。

算法

我们用 [方法 1] 中同样的回溯方法,除此之外,因为函数 match(text[i:], pattern[j:]) 只会被调用一次,我们用 dp(i, j)\text{dp(i, j)} 来应对剩余相同参数的函数调用,这帮助我们节省了字符串建立操作所需要的时间,也让我们可以将中间结果进行保存。

自顶向下的方法

enum Result {
    TRUE, FALSE
}

class Solution {
Result[][] memo;

<span class="hljs-function"><span class="hljs-keyword">public</span> <span class="hljs-keyword">boolean</span> <span class="hljs-title">isMatch</span><span class="hljs-params">(String text, String pattern)</span> </span>{
    memo = <span class="hljs-keyword">new</span> Result[text.length() + <span class="hljs-number">1</span>][pattern.length() + <span class="hljs-number">1</span>];
    <span class="hljs-keyword">return</span> dp(<span class="hljs-number">0</span>, <span class="hljs-number">0</span>, text, pattern);
}

<span class="hljs-function"><span class="hljs-keyword">public</span> <span class="hljs-keyword">boolean</span> <span class="hljs-title">dp</span><span class="hljs-params">(<span class="hljs-keyword">int</span> i, <span class="hljs-keyword">int</span> j, String text, String pattern)</span> </span>{
    <span class="hljs-keyword">if</span> (memo[i][j] != <span class="hljs-keyword">null</span>) {
        <span class="hljs-keyword">return</span> memo[i][j] == Result.TRUE;
    }
    <span class="hljs-keyword">boolean</span> ans;
    <span class="hljs-keyword">if</span> (j == pattern.length()){
        ans = i == text.length();
    } <span class="hljs-keyword">else</span>{
        <span class="hljs-keyword">boolean</span> first_match = (i &lt; text.length() &amp;&amp;
                               (pattern.charAt(j) == text.charAt(i) ||
                                pattern.charAt(j) == <span class="hljs-string">‘.‘</span>));

        <span class="hljs-keyword">if</span> (j + <span class="hljs-number">1</span> &lt; pattern.length() &amp;&amp; pattern.charAt(j+<span class="hljs-number">1</span>) == <span class="hljs-string">‘*‘</span>){
            ans = (dp(i, j+<span class="hljs-number">2</span>, text, pattern) ||
                   first_match &amp;&amp; dp(i+<span class="hljs-number">1</span>, j, text, pattern));
        } <span class="hljs-keyword">else</span> {
            ans = first_match &amp;&amp; dp(i+<span class="hljs-number">1</span>, j+<span class="hljs-number">1</span>, text, pattern);
        }
    }
    memo[i][j] = ans ? Result.TRUE : Result.FALSE;
    <span class="hljs-keyword">return</span> ans;
}

}


class Solution(object):
def isMatch(self, text, pattern):
memo = {}
def dp(i, j):
if (i, j) not in memo:
if j == len(pattern):
ans = i == len(text)
else:
first_match = i < len(text) and pattern[j] in {text[i], ‘.‘}
if j+1 < len(pattern) and pattern[j+1] == ‘*‘:
ans = dp(i, j+2) or first_match and dp(i+1, j)
else:
ans = first_match and dp(i+1, j+1)

            memo[i, j] = ans
        <span class="hljs-keyword">return</span> memo[i, j]

    <span class="hljs-keyword">return</span> dp(<span class="hljs-number">0</span>, <span class="hljs-number">0</span>)

自底向上的方法

class Solution {
    public boolean isMatch(String text, String pattern) {
        boolean[][] dp = new boolean[text.length() + 1][pattern.length() + 1];
        dp[text.length()][pattern.length()] = true;
    <span class="hljs-keyword">for</span> (<span class="hljs-keyword">int</span> i = text.length(); i &gt;= <span class="hljs-number">0</span>; i--){
        <span class="hljs-keyword">for</span> (<span class="hljs-keyword">int</span> j = pattern.length() - <span class="hljs-number">1</span>; j &gt;= <span class="hljs-number">0</span>; j--){
            <span class="hljs-keyword">boolean</span> first_match = (i &lt; text.length() &amp;&amp;
                                   (pattern.charAt(j) == text.charAt(i) ||
                                    pattern.charAt(j) == <span class="hljs-string">‘.‘</span>));
            <span class="hljs-keyword">if</span> (j + <span class="hljs-number">1</span> &lt; pattern.length() &amp;&amp; pattern.charAt(j+<span class="hljs-number">1</span>) == <span class="hljs-string">‘*‘</span>){
                dp[i][j] = dp[i][j+<span class="hljs-number">2</span>] || first_match &amp;&amp; dp[i+<span class="hljs-number">1</span>][j];
            } <span class="hljs-keyword">else</span> {
                dp[i][j] = first_match &amp;&amp; dp[i+<span class="hljs-number">1</span>][j+<span class="hljs-number">1</span>];
            }
        }
    }
    <span class="hljs-keyword">return</span> dp[<span class="hljs-number">0</span>][<span class="hljs-number">0</span>];
}

}


class Solution(object):
def isMatch(self, text, pattern):
dp = [[False] * (len(pattern) + 1) for _ in range(len(text) + 1)]

    dp[<span class="hljs-number">-1</span>][<span class="hljs-number">-1</span>] = <span class="hljs-literal">True</span>
    <span class="hljs-keyword">for</span> i <span class="hljs-keyword">in</span> range(len(text), <span class="hljs-number">-1</span>, <span class="hljs-number">-1</span>):
        <span class="hljs-keyword">for</span> j <span class="hljs-keyword">in</span> range(len(pattern) - <span class="hljs-number">1</span>, <span class="hljs-number">-1</span>, <span class="hljs-number">-1</span>):
            first_match = i &lt; len(text) <span class="hljs-keyword">and</span> pattern[j] <span class="hljs-keyword">in</span> {text[i], <span class="hljs-string">‘.‘</span>}
            <span class="hljs-keyword">if</span> j+<span class="hljs-number">1</span> &lt; len(pattern) <span class="hljs-keyword">and</span> pattern[j+<span class="hljs-number">1</span>] == <span class="hljs-string">‘*‘</span>:
                dp[i][j] = dp[i][j+<span class="hljs-number">2</span>] <span class="hljs-keyword">or</span> first_match <span class="hljs-keyword">and</span> dp[i+<span class="hljs-number">1</span>][j]
            <span class="hljs-keyword">else</span>:
                dp[i][j] = first_match <span class="hljs-keyword">and</span> dp[i+<span class="hljs-number">1</span>][j+<span class="hljs-number">1</span>]

    <span class="hljs-keyword">return</span> dp[<span class="hljs-number">0</span>][<span class="hljs-number">0</span>]

复杂度分析

  • 时间复杂度:用 TTPP 分别表示匹配串和模式串的长度。对于i=0,...,Ti=0, ... , Tj=0,...,Pj=0, ... , P 每一个 dp(i, j)只会被计算一次,所以后面每次调用都是 O(1)O(1) 的时间。因此,总时间复杂度为 O(TP)O(TP)

  • 空间复杂度:我们用到的空间仅有 O(TP)O(TP) 个 boolean 类型的缓存变量。所以,空间复杂度为 O(TP)O(TP)

leetcode题解之正则表达式匹配

原文:https://www.cnblogs.com/leetcodetijie/p/13049878.html

(0)
(0)
   
举报
评论 一句话评论(0
分享档案
最新文章
教程昨日排行
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!