LeetCode30 与所有单词相关联的字串

LeetCode第30题

问题描述

给定一个字符串 s 和一些长度相同的单词 words。s 中找出可以恰好串联 words 中所有单词的子串的起始位置。

注意子串要与 words 中的单词完全匹配,中间不能有其他字符,但不需要考虑 words 中单词串联的顺序。

示例 1:

1
2
3
4
5
6
输入:
s = "barfoothefoobarman",
words = ["foo","bar"]
输出: [0,9]
解释: 从索引 0 和 9 开始的子串分别是 "barfoor" 和 "foobar" 。
输出的顺序不重要, [9,0] 也是有效答案。

示例 2:

1
2
3
4
输入:
s = "wordgoodstudentgoodword",
words = ["word","student"]
输出: []

解题思路

首先将words转换成字典word_dictkey为单词,value为单词出现的次数。以words所有单词总长度为窗口,截取字符串s,然后再将子串以单词长度进行分割。如果分割出的子串包含于words中,则word_dict计数相应的减1(计数等于0时,移除该单词),否则进行下一窗口截取。如果最后word_dict为空,则表示找到字符串可以用words所有单词完全匹配。

Code

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
class Solution:
def findSubstring(self, s, words):
"""
:type s: str
:type words: List[str]
:rtype: List[int]
"""
res = []

if not words:
return res

if not s:
return res

word_num = len(words)
word_len = len(words[0])
n_word_len = word_len * word_num

# 使用字典记录单词出现的次数 <单词,次数>
word_dict = {}
for word in words:
if word in word_dict:
word_dict[word] += 1
else:
word_dict[word] = 1

d = word_dict.copy()
p = 0
while p + n_word_len <= len(s):
# 取n_word_len长度子串
sub = s[p:p+n_word_len]

# 每隔word_len进行截取,判断word_dict是否包含该子串
for i in range(word_num):
item = sub[i*word_len: (i+1)*word_len]
if item not in d:
break
else:
d[item] -= 1
if d[item] == 0:
del d[item]

# 如果word_dict为空,找到子串
if not d:
res.append(p)

d = word_dict.copy()

p += 1

return res

问题扩展

本题需要匹配的words列表单词长度是相同的,如果不相同了?

比如:

1
2
3
4
5
输入:
s = "barrfothefoobarman",
words = ["fo","barr"]
输出: [0]
解释: 从索引 0 开始的子串为barrfo,可以用words所有单词完全匹配。

基于以上思路,一种方法是修改子串的校验方法,使用逐字比较。代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
class Solution:
def findSubstring(self, s, words):
"""
:type s: str
:type words: List[str]
:rtype: List[int]
"""
res = []

if not words:
return res

if not s:
return res

n_word_len = 0

# 使用字典记录单词出现的次数 <单词,次数>
word_dict = {}
for word in words:
n_word_len += len(word)
if word in word_dict:
word_dict[word] += 1
else:
word_dict[word] = 1

p = 0
while p + n_word_len <= len(s):
# 取n_word_len长度子串
sub = s[p:p + n_word_len]

# 逐字比较
if self.word_cmp(sub, word_dict):
res.append(p)

p += 1

return res

def word_cmp(self, s, word_dict):
if not s and not word_dict:
return True
if not s or not word_dict:
return False
d = word_dict.copy()

i = 1
while i <= len(s):
sub = s[0:i]
if sub not in d:
i += 1
else:
d[sub] -= 1
if d[sub] == 0:
del d[sub]

if self.word_cmp(s[i:], d):
return True
else:
i += 1
return False
感谢你对我的支持,让我继续努力分享有用的技术和知识点