|
1 | 1 | ## 题目地址
|
2 | 2 |
|
3 |
| -## 思路 |
| 3 | +> 和子集问题有点像,但又处处是陷阱 |
4 | 4 |
|
5 |
| -这道题可以说是深度优先搜索,也可以说是回溯法,其实我更倾向于说它用回溯法,因为本题和[90. 子集 II](https://leetcode-cn.com/problems/subsets-ii/)非常像,差别就是[90. 子集 II](https://leetcode-cn.com/problems/subsets-ii/)可以通过排序,在加一个标记数组来达到去重的目的。 |
| 5 | +# 491.递增子序列 |
6 | 6 |
|
7 |
| -去重复的逻辑,关键在于子序列的末尾,如果子序列的末尾重复出现一个元素,那么该序列就是重复的了,如图所示: |
| 7 | +题目链接:https://leetcode-cn.com/problems/increasing-subsequences/ |
| 8 | + |
| 9 | +给定一个整型数组, 你的任务是找到所有该数组的递增子序列,递增子序列的长度至少是2。 |
| 10 | + |
| 11 | +示例: |
| 12 | + |
| 13 | +输入: [4, 6, 7, 7] |
| 14 | +输出: [[4, 6], [4, 7], [4, 6, 7], [4, 6, 7, 7], [6, 7], [6, 7, 7], [7,7], [4,7,7]] |
| 15 | + |
| 16 | +说明: |
| 17 | +* 给定数组的长度不会超过15。 |
| 18 | +* 数组中的整数范围是 [-100,100]。 |
| 19 | +* 给定数组中可能包含重复数字,相等的数字应该被视为递增的一种情况。 |
| 20 | + |
| 21 | + |
| 22 | +# 思路 |
| 23 | + |
| 24 | +这个递增子序列比较像是取有序的子集。而且本题也要求不能有相同的递增子序列。 |
| 25 | + |
| 26 | +这又是子集,又是去重,是不是不由自主的想起了刚刚讲过的[回溯算法:求子集问题(二)](https://mp.weixin.qq.com/s/WJ4JNDRJgsW3eUN72Hh3uQ)。 |
| 27 | + |
| 28 | +就是因为太像了,更要注意差别所在,要不就掉坑里了! |
| 29 | + |
| 30 | +在[回溯算法:求子集问题(二)](https://mp.weixin.qq.com/s/WJ4JNDRJgsW3eUN72Hh3uQ)中我们是通过排序,再加一个标记数组来达到去重的目的。 |
| 31 | + |
| 32 | +而本题求自增子序列,是不能对原数组经行排序的,排完序的数组都是自增子序列了。 |
| 33 | + |
| 34 | +**所以不能使用之前的去重逻辑!** |
| 35 | + |
| 36 | +本题给出的示例,还是一个有序数组 [4, 6, 7, 7],这更容易误导大家按照排序的思路去做了。 |
| 37 | + |
| 38 | +为了有鲜明的对比,我用[4, 7, 6, 7]这个数组来举例,抽象为树形结构如图: |
| 39 | + |
| 40 | +<img src='../pics/491. 递增子序列1.jpg' width=600> </img></div> |
| 41 | + |
| 42 | + |
| 43 | +## 回溯三部曲 |
| 44 | + |
| 45 | +* 递归函数参数 |
| 46 | + |
| 47 | +本题求子序列,很明显一个元素不能重复使用,所以需要startIndex,调整下一层递归的起始位置。 |
| 48 | + |
| 49 | +代码如下: |
| 50 | + |
| 51 | +``` |
| 52 | +vector<vector<int>> result; |
| 53 | +vector<int> path; |
| 54 | +void backtracking(vector<int>& nums, int startIndex) |
| 55 | +``` |
| 56 | + |
| 57 | +* 终止条件 |
| 58 | + |
| 59 | +本题其实类似求子集问题,也是要遍历树形结构找每一个节点,所以和[回溯算法:求子集问题!](https://mp.weixin.qq.com/s/NNRzX-vJ_pjK4qxohd_LtA)一样,可以不加终止条件,startIndex每次都会加1,并不会无限递归。 |
| 60 | + |
| 61 | +但本题收集结果有所不同,题目要求递增子序列大小至少为2,所以代码如下: |
| 62 | + |
| 63 | +``` |
| 64 | +if (path.size() > 1) { |
| 65 | + result.push_back(path); |
| 66 | + // 注意这里不要加return,因为要取树上的所有节点 |
| 67 | +} |
| 68 | +``` |
| 69 | + |
| 70 | +* 单层搜索逻辑 |
8 | 71 |
|
9 | 72 | <img src='../pics/491. 递增子序列1.jpg' width=600> </img></div>
|
10 | 73 |
|
11 |
| -在递归的过程中 `if ((subseq.empty() || nums[i] >= subseq.back()) && uset.find(nums[i]) == uset.end())` 这个判断条件一定要想清楚, 如果子序列为空或者nums[i]>=子序列尾部数值,**同时** 这个nums[i] 不能出现过, 因为一旦出现过就 是一个重复的递增子序列了。 |
| 74 | +在图中可以看出,同层上使用过的元素就不能在使用了,**注意这里和[回溯算法:求子集问题(二)](https://mp.weixin.qq.com/s/WJ4JNDRJgsW3eUN72Hh3uQ)中去重的区别**。 |
| 75 | + |
| 76 | +**本题只要同层重复使用元素,递增子序列就会重复**,而[回溯算法:求子集问题(二)](https://mp.weixin.qq.com/s/WJ4JNDRJgsW3eUN72Hh3uQ)中是排序之后看相邻元素是否重复使用。 |
| 77 | + |
| 78 | + |
| 79 | +还有一种情况就是如果选取的元素小于子序列最后一个元素,那么就不能是递增的,所以也要pass掉。 |
| 80 | + |
| 81 | +那么去重的逻辑代码如下: |
| 82 | + |
| 83 | +``` |
| 84 | +if ((!path.empty() && nums[i] < path.back()) |
| 85 | + || uset.find(nums[i]) != uset.end()) { |
| 86 | + continue; |
| 87 | +} |
| 88 | +``` |
| 89 | +判断`nums[i] < path.back()`之前一定要判断path是否为空,所以是`!path.empty() && nums[i] < path.back()`。 |
| 90 | + |
| 91 | +`uset.find(nums[i]) != uset.end()`判断nums[i]在本层是否使用过。 |
| 92 | + |
| 93 | +那么单层搜索代码如下: |
| 94 | + |
| 95 | +``` |
| 96 | +unordered_set<int> uset; // 使用set来对本层元素进行去重 |
| 97 | +for (int i = startIndex; i < nums.size(); i++) { |
| 98 | + if ((!path.empty() && nums[i] < path.back()) |
| 99 | + || uset.find(nums[i]) != uset.end()) { |
| 100 | + continue; |
| 101 | + } |
| 102 | + uset.insert(nums[i]); // 记录这个元素在本层用过了,本层后面不能再用了 |
| 103 | + path.push_back(nums[i]); |
| 104 | + backtracking(nums, i + 1); |
| 105 | + path.pop_back(); |
| 106 | +} |
| 107 | +``` |
| 108 | + |
| 109 | +**对于已经习惯写回溯的同学,看到递归函数上面的`uset.insert(nums[i]);`,下面却没有对应的pop之类的操作,应该很不习惯吧,哈哈** |
| 110 | + |
| 111 | +**这也是需要注意的点,`unordered_set<int> uset;` 是记录本层元素是否重复使用,新的一层uset都会重新定义(清空),所以要知道uset只负责本层!** |
| 112 | + |
| 113 | + |
| 114 | +最后整体C++代码如下: |
12 | 115 |
|
13 | 116 | ## C++代码
|
14 | 117 |
|
15 | 118 | ```
|
| 119 | +// 版本一 |
16 | 120 | class Solution {
|
17 | 121 | private:
|
18 |
| -void backtracking(vector<int>& nums, vector<vector<int>>& result, vector<int>& subseq, int startIndex) { |
19 |
| - if (subseq.size() > 1) { |
20 |
| - result.push_back(subseq); |
21 |
| - // 注意这里不要加return,因为要取所有的可能 |
22 |
| - } |
23 |
| - unordered_set<int> uset; // 使用set来对尾部元素进行去重 |
24 |
| - for (int i = startIndex; i < nums.size(); i++) { |
25 |
| - if ((subseq.empty() || nums[i] >= subseq.back()) |
26 |
| - && uset.find(nums[i]) == uset.end()) { |
27 |
| - subseq.push_back(nums[i]); |
28 |
| - backtracking(nums, result, subseq, i + 1); |
29 |
| - subseq.pop_back(); |
30 |
| - uset.insert(nums[i]);//在回溯的时候,记录这个元素用过了,后面不能再用了 |
| 122 | + vector<vector<int>> result; |
| 123 | + vector<int> path; |
| 124 | + void backtracking(vector<int>& nums, int startIndex) { |
| 125 | + if (path.size() > 1) { |
| 126 | + result.push_back(path); |
| 127 | + // 注意这里不要加return,要取树上的节点 |
| 128 | + } |
| 129 | + unordered_set<int> uset; // 使用set对本层元素进行去重 |
| 130 | + for (int i = startIndex; i < nums.size(); i++) { |
| 131 | + if ((!path.empty() && nums[i] < path.back()) |
| 132 | + || uset.find(nums[i]) != uset.end()) { |
| 133 | + continue; |
| 134 | + } |
| 135 | + uset.insert(nums[i]); // 记录这个元素在本层用过了,本层后面不能再用了 |
| 136 | + path.push_back(nums[i]); |
| 137 | + backtracking(nums, i + 1); |
| 138 | + path.pop_back(); |
31 | 139 | }
|
32 | 140 | }
|
33 |
| -} |
34 | 141 | public:
|
35 | 142 | vector<vector<int>> findSubsequences(vector<int>& nums) {
|
36 |
| - vector<vector<int>> result; |
37 |
| - vector<int> subseq; |
38 |
| - backtracking(nums, result, subseq, 0); |
| 143 | + result.clear(); |
| 144 | + path.clear(); |
| 145 | + backtracking(nums, 0); |
39 | 146 | return result;
|
40 | 147 | }
|
41 | 148 | };
|
42 | 149 | ```
|
43 | 150 |
|
44 |
| -一位师弟在评论中对代码进行了改进,效率确实高了很多,优化后如图: |
| 151 | +## 优化 |
45 | 152 |
|
46 |
| -<img src='../pics/491. 递增子序列2.png' width=600> </img></div> |
| 153 | +以上代码用我用了`unordered_set<int>`来记录本层元素是否重复使用。 |
47 | 154 |
|
48 |
| -改动的地方主要是将去重的逻辑中把 unordered_set 改成了 数组。 |
| 155 | +**其实用数组来做哈希,效率就高了很多**。 |
49 | 156 |
|
50 |
| -用数组替换unordered_set 确实可以快很多,unordered_set底层符号表也是哈希表,理论上不应该差多少。 |
| 157 | +注意题目中说了,数值范围[-100,100],所以完全可以用数组来做哈希。 |
51 | 158 |
|
52 |
| -估计程序运行的时候对unordered_set 频繁的insert,unordered_set需要做哈希映射(也就是把key通过hash function映射为唯一的哈希值)费了些时间。 |
| 159 | +程序运行的时候对unordered_set 频繁的insert,unordered_set需要做哈希映射(也就是把key通过hash function映射为唯一的哈希值)相对费时间,而且每次重新定义set,insert的时候其底层的符号表也要做相应的扩充,也是费事的。 |
53 | 160 |
|
54 |
| -用数组来做哈希,效率就高了很多,再加上题目中也说了,数值范围[-100,100],所以用数组正合适。 |
55 |
| - |
56 |
| -**这个事实告诉我们,使用哈希法的时候,条件允许的话,能用数组尽量用数组。** |
57 |
| - |
58 |
| -优化后的代码如下: |
| 161 | +那么优化后的代码如下: |
59 | 162 |
|
60 | 163 | ```
|
| 164 | +// 版本二 |
61 | 165 | class Solution {
|
62 | 166 | private:
|
63 |
| -void backtracking(vector<int>& nums, vector<vector<int>>& result, vector<int>& subseq, int startIndex) { |
64 |
| - if (subseq.size() > 1) { |
65 |
| - result.push_back(subseq); |
66 |
| - // 注意这里不要加return,因为要取所有的可能 |
67 |
| - } |
68 |
| - int hash[201] = {0}; // 这里使用数组来进行去重操作,题目说数值范围[-100, 100] |
69 |
| - for (int i = startIndex; i < nums.size(); i++) { |
70 |
| - if ((subseq.empty() || nums[i] >= subseq.back()) |
71 |
| - && hash[nums[i] + 100] == 0) { |
72 |
| - subseq.push_back(nums[i]); |
73 |
| - backtracking(nums, result, subseq, i + 1); |
74 |
| - subseq.pop_back(); |
75 |
| - hash[nums[i]+100] = 1; |
| 167 | + vector<vector<int>> result; |
| 168 | + vector<int> path; |
| 169 | + void backtracking(vector<int>& nums, int startIndex) { |
| 170 | + if (path.size() > 1) { |
| 171 | + result.push_back(path); |
| 172 | + } |
| 173 | + int used[201] = {0}; // 这里使用数组来进行去重操作,题目说数值范围[-100, 100] |
| 174 | + for (int i = startIndex; i < nums.size(); i++) { |
| 175 | + if ((!path.empty() && nums[i] < path.back()) |
| 176 | + || used[nums[i] + 100] == 1) { |
| 177 | + continue; |
| 178 | + } |
| 179 | + used[nums[i] + 100] = 1; // 记录这个元素在本层用过了,本层后面不能再用了 |
| 180 | + path.push_back(nums[i]); |
| 181 | + backtracking(nums, i + 1); |
| 182 | + path.pop_back(); |
76 | 183 | }
|
77 | 184 | }
|
78 |
| -} |
79 | 185 | public:
|
80 | 186 | vector<vector<int>> findSubsequences(vector<int>& nums) {
|
81 |
| - vector<vector<int>> result; |
82 |
| - vector<int> subseq; |
83 |
| - backtracking(nums, result, subseq, 0); |
| 187 | + result.clear(); |
| 188 | + path.clear(); |
| 189 | + backtracking(nums, 0); |
84 | 190 | return result;
|
85 | 191 | }
|
86 | 192 | };
|
87 |
| -
|
88 | 193 | ```
|
| 194 | + |
| 195 | +这份代码在leetcode上提交,要比版本一耗时要好的多。 |
| 196 | + |
| 197 | +**所以正如在[哈希表:总结篇!(每逢总结必经典)](https://mp.weixin.qq.com/s/1s91yXtarL-PkX07BfnwLg)中说的那样,数组,set,map都可以做哈希表,而且数组干的活,map和set都能干,但如何数值范围小的话能用数组尽量用数组**。 |
| 198 | + |
| 199 | + |
| 200 | + |
| 201 | +# 总结 |
| 202 | + |
| 203 | +本题题解清一色都说是深度优先搜索,但我更倾向于说它用回溯法,而且本题我也是完全使用回溯法的逻辑来分析的。 |
| 204 | + |
| 205 | +相信大家在本题中处处都能看到是[回溯算法:求子集问题(二)](https://mp.weixin.qq.com/s/WJ4JNDRJgsW3eUN72Hh3uQ)的身影,但处处又都是陷阱。 |
| 206 | + |
| 207 | +**对于养成思维定式或者套模板套嗨了的同学,这道题起到了很好的警醒作用。更重要的是拓展了大家的思路!** |
| 208 | + |
| 209 | +**就酱,如果感觉「代码随想录」很干货,就帮Carl宣传一波吧!** |
| 210 | + |
| 211 | + |
0 commit comments