|
| 1 | +## 题目地址(438. 找到字符串中所有字母异位词) |
| 2 | + |
| 3 | +https://leetcode-cn.com/problems/find-all-anagrams-in-a-string/ |
| 4 | + |
| 5 | +## 题目描述 |
| 6 | + |
| 7 | +``` |
| 8 | +给定一个字符串 s 和一个非空字符串 p,找到 s 中所有是 p 的字母异位词的子串,返回这些子串的起始索引。 |
| 9 | +
|
| 10 | +字符串只包含小写英文字母,并且字符串 s 和 p 的长度都不超过 20100。 |
| 11 | +
|
| 12 | +说明: |
| 13 | +
|
| 14 | +字母异位词指字母相同,但排列不同的字符串。 |
| 15 | +不考虑答案输出的顺序。 |
| 16 | +示例 1: |
| 17 | +
|
| 18 | +输入: |
| 19 | +s: "cbaebabacd" p: "abc" |
| 20 | +
|
| 21 | +输出: |
| 22 | +[0, 6] |
| 23 | +
|
| 24 | +解释: |
| 25 | +起始索引等于 0 的子串是 "cba", 它是 "abc" 的字母异位词。 |
| 26 | +起始索引等于 6 的子串是 "bac", 它是 "abc" 的字母异位词。 |
| 27 | + 示例 2: |
| 28 | +
|
| 29 | +输入: |
| 30 | +s: "abab" p: "ab" |
| 31 | +
|
| 32 | +输出: |
| 33 | +[0, 1, 2] |
| 34 | +
|
| 35 | +解释: |
| 36 | +起始索引等于 0 的子串是 "ab", 它是 "ab" 的字母异位词。 |
| 37 | +起始索引等于 1 的子串是 "ba", 它是 "ab" 的字母异位词。 |
| 38 | +起始索引等于 2 的子串是 "ab", 它是 "ab" 的字母异位词。 |
| 39 | +``` |
| 40 | + |
| 41 | +## 前置知识 |
| 42 | + |
| 43 | +- Sliding Window |
| 44 | +- 哈希表 |
| 45 | + |
| 46 | +## 思路 |
| 47 | + |
| 48 | +> 咳咳,暴力题解俺就不写了哈,因为和昨天基本一致 |
| 49 | +
|
| 50 | +来分析一下,首先题中说找到 s 中所有是 p 的字母异位词的字串,就这句话,就包含了如下两个重要信息: |
| 51 | + |
| 52 | +- 找到符合要求的子串长度都是 p |
| 53 | +- 何为字母异位词?也就是我们不关心 p 这个串的顺序,只关心字母是否出现以及出现的次数,这种问题解决方案一般有两种,一种是利用排序强制顺序,另一种就是用哈希表的方法。 |
| 54 | + |
| 55 | +这么一抽象,是不是和昨天那个题很相似呢?那么问题的关键就是: |
| 56 | + |
| 57 | +- 如何构建滑窗 |
| 58 | +- 如何更新状态,也即如何存储 p 串及更新窗口信息 |
| 59 | + |
| 60 | +针对问题 1 很容易,因为是长度固定为 p 的滑动窗口,而针对如何存储 p 串这个问题,我们可以考虑用桶来装,这个桶既可以用 26 个元素的数组(作用其实也是哈希表)也可以用哈希表 |
| 61 | + |
| 62 | +那么我们解决方案就很明朗了: |
| 63 | + |
| 64 | +- 初始化个滑窗 |
| 65 | +- 不断移动该固定窗口,并用一个 rest 变量来记录剩余待匹配字符的个数 |
| 66 | +- 只要当前窗口符合要求,即把窗口左指针下标添加到结果集合中去。 |
| 67 | + |
| 68 | +## 代码 |
| 69 | + |
| 70 | +代码支持:Java,Python3 |
| 71 | + |
| 72 | +Java Code: |
| 73 | + |
| 74 | +```java |
| 75 | +public List<Integer> findAnagrams(String s, String p) { |
| 76 | + |
| 77 | + List<Integer> res = new LinkedList<>(); |
| 78 | + if (s == null || p == null || s.length() < p.length()) |
| 79 | + return res; |
| 80 | + |
| 81 | + int[] ch = new int[26]; |
| 82 | + //统计p串字符个数 |
| 83 | + for (char c : p.toCharArray()) |
| 84 | + ch[c - 'a']++; |
| 85 | + //把窗口扩成p串的长度 |
| 86 | + int start = 0, end = 0, rest = p.length(); |
| 87 | + for (; end < p.length(); end++) { |
| 88 | + char temp = s.charAt(end); |
| 89 | + ch[temp - 'a']--; |
| 90 | + if (ch[temp - 'a'] >= 0) |
| 91 | + rest--; |
| 92 | + } |
| 93 | + |
| 94 | + if (rest == 0) |
| 95 | + res.add(0); |
| 96 | + //开始一步一步向右移动窗口。 |
| 97 | + while (end < s.length()) { |
| 98 | + //左边的拿出来一个并更新状态 |
| 99 | + char temp = s.charAt(start); |
| 100 | + if (ch[temp - 'a'] >= 0) |
| 101 | + rest++; |
| 102 | + ch[temp - 'a']++; |
| 103 | + start++; |
| 104 | + //右边的拿进来一个并更新状态 |
| 105 | + temp = s.charAt(end); |
| 106 | + ch[temp - 'a']--; |
| 107 | + if (ch[temp - 'a'] >= 0) |
| 108 | + rest--; |
| 109 | + end++; |
| 110 | + // 状态合法就存到结果集合 |
| 111 | + if (rest == 0) |
| 112 | + res.add(start); |
| 113 | + } |
| 114 | + |
| 115 | + return res; |
| 116 | +} |
| 117 | +``` |
| 118 | + |
| 119 | +Python 解法具体做法稍有一点不同,没有使用 rest 变量,而是直接取的哈希表的长度。其中 哈希表的 key 是字符,value 是窗口内字符出现次数。这样当 value 为 0 时,我们移除 key,这样当哈希表容量为 0,说明我们找到了一个异位词。 |
| 120 | + |
| 121 | +Python3 Code: |
| 122 | + |
| 123 | +```py |
| 124 | +class Solution: |
| 125 | + def findAnagrams(self, s: str, p: str) -> List[int]: |
| 126 | + target = collections.Counter(p) |
| 127 | + ans = [] |
| 128 | + for i in range(len(s)): |
| 129 | + if i >= len(p): |
| 130 | + target[s[i - len(p)]] += 1 |
| 131 | + if target[s[i - len(p)]] == 0: |
| 132 | + del target[s[i - len(p)]] |
| 133 | + target[s[i]] -= 1 |
| 134 | + if target[s[i]] == 0: |
| 135 | + del target[s[i]] |
| 136 | + if len(target) == 0: |
| 137 | + ans.append(i - len(p) + 1) |
| 138 | + return ans |
| 139 | +``` |
| 140 | + |
| 141 | +你也可以将窗口封装成一个类进行操作。虽然代码会更长,但是如果你将窗口类看成黑盒,那么逻辑会很简单。 |
| 142 | + |
| 143 | +这里我提供一个 Python3 版本的**封装类解法**。 |
| 144 | + |
| 145 | +```py |
| 146 | +class FrequencyDict: |
| 147 | + def __init__(self, s): |
| 148 | + self.d = collections.Counter() |
| 149 | + for char in s: |
| 150 | + self.increment(char) |
| 151 | + |
| 152 | + def _del_if_zero(self, char): |
| 153 | + if self.d[char] == 0: |
| 154 | + del self.d[char] |
| 155 | + |
| 156 | + def is_empty(self): |
| 157 | + return not self.d |
| 158 | + |
| 159 | + def decrement(self, char): |
| 160 | + self.d[char] -= 1 |
| 161 | + self._del_if_zero(char) |
| 162 | + |
| 163 | + def increment(self, char): |
| 164 | + self.d[char] += 1 |
| 165 | + self._del_if_zero(char) |
| 166 | + |
| 167 | + |
| 168 | +class Solution: |
| 169 | + def findAnagrams(self, s: str, p: str) -> List[int]: |
| 170 | + ans = [] |
| 171 | + |
| 172 | + freq = FrequencyDict(p) |
| 173 | + |
| 174 | + for char in s[:len(p)]: |
| 175 | + freq.decrement(char) |
| 176 | + |
| 177 | + if freq.is_empty(): |
| 178 | + ans.append(0) |
| 179 | + |
| 180 | + for i in range(len(p), len(s)): |
| 181 | + start, end = s[i - len(p)], s[i] |
| 182 | + freq.increment(start) |
| 183 | + freq.decrement(end) |
| 184 | + if freq.is_empty(): |
| 185 | + ans.append(i - len(p) + 1) |
| 186 | + |
| 187 | + return ans |
| 188 | +``` |
| 189 | + |
| 190 | +**复杂度分析** |
| 191 | + |
| 192 | +令 s 的长度为 n。 |
| 193 | + |
| 194 | +- 时间复杂度:$O(n)$ |
| 195 | + |
| 196 | +- 空间复杂度:虽然我们使用了数组(或者哈希表)存储计数信息,但是大小不会超过 26,因此空间复杂度为 $O(1)$。 |
0 commit comments