经典算法 区间统计种类
区间统计种类
问题描述
给你一个整数数组,给你很多个区间[L,R],对于所有区间,打印区间内有多少个不同的整数。
输入示例
5
1 2 2 1 2
6
1 4
1 5
2 2
2 4
2 3
1 1
输出示例
2
2
1
2
1
1
输入示例
6
1 2 3 4 3 5
3
1 2
3 5
2 6
输出示例
2
2
4
c++代码
#include<bits/stdc++.h>
#include<stdio.h>using namespace std;class query {
public:int l, r, key;
};int n, m;
vector<int> trees, ans, arr;
vector<query> querys;
vector<vector<int>> end_by_r;
unordered_map<int, int> mp;bool mycom(query a, query b) { return a.r < b.r; }void build(int p, int l, int r) {if (l == r) {trees[p] = 1;return;}int mid = (l + r) / 2;build(2 * p, l, mid);build(2 * p + 1, mid + 1, r);trees[p] = trees[2 * p] + trees[2 * p + 1];
}void update(int p, int l, int r, int k) {if (l == r && l == k) {trees[p] = 0;return;}int mid = (l + r) / 2;if (k <= mid) update(2 * p, l, mid, k);else update(2 * p + 1, mid + 1, r, k);trees[p] = trees[2 * p] + trees[2 * p + 1];
}int ask(int p, int l, int r, int range_l, int range_r) {if (range_l <= l && range_r >= r) return trees[p];int mid = (l + r) / 2, ans = 0;if (mid >= range_l) ans += ask(2 * p, l, mid, range_l, range_r);if (mid < range_r) ans += ask(2 * p + 1, mid + 1, r, range_l, range_r);return ans;
}int main() {scanf("%d", &n);trees = vector<int>(4 * n), arr = vector<int>(n + 1), end_by_r = vector<vector<int>>(n + 1);for (int i = 1; i <= n; i++) scanf("%d", &arr[i]);build(1, 1, n);scanf("%d", &m);querys = vector<query>(m), ans = vector<int>(m);for (int i = 0; i < m; i++) scanf("%d %d", &querys[i].l, &querys[i].r), querys[i].key = i;sort(querys.begin(), querys.end(), mycom);for (int i = 0; i < m; i++) end_by_r[querys[i].r].push_back(i);for (int i = 1; i <= n; i++) {if (mp.find(arr[i]) != mp.end()) update(1, 1, n, mp[arr[i]]);mp[arr[i]] = i;for (int x : end_by_r[i]) {ans[querys[x].key] = ask(1, 1, n, querys[x].l, querys[x].r);}}for (int i = 0; i < m; i++) printf("%d\n", ans[i]);return 0;
}//by wqs
思路解析
线段树法,时间复杂度0(nlogn)
用区间和模拟区间种类数
但是从1-right要预处理,例如数组1 2 2 1 2,我们要查询[1,4]多少种类,线段树初始化1 1 1 1
第一个数为1,没出现过,下一个,线段树状态1 1 1 1
第二个数为2,没出现过,下一个,线段树状态1 1 1 1
第三个数为2,把上一个2的位置变成0,线段树状态1 0 1 1
第四个数为1,把上一个1的位置变成0,线段树状态0 0 1 1
然后区间求和为2,得出[1,4]多少2个种类
这道题目就是用这样的单点修改+区间求和查询模拟出种类数。
刚刚是一个查询,现在考虑多个查询。
我们主要保证当前修改不会对其他查询产生影响就行。
贪心的办法是将所有的查询按右端点从小到大排序,这样我修改这个就不会对未来的查询产生影响。
例如查询1 1、1 2、2 2、2 3
这个是排序好的,修改1 1,对1 2来说我本来就要修改1 1,对于2 2和2 3来说,1 1不在我的范围,本来就影响不到。
当然,这只是我自己的理解,严格的贪心证明,我是不会的。下面给出算法步骤。
算法步骤
建立线段树
vector<int> trees;
void build(int p, int l, int r) {if (l == r) {trees[p] = 1;//线段树初始值为1return;}int mid = (l + r) / 2;build(2 * p, l, mid);build(2 * p + 1, mid + 1, r);trees[p] = trees[2 * p] + trees[2 * p + 1];
}
build(1, 1, n);
编写单点修改+区间求和函数
void update(int p, int l, int r, int k) {//把[k,k]的值变为0,并且更新线段树if (l == r && l == k) {trees[p] = 0;return;}int mid = (l + r) / 2;if (k <= mid) update(2 * p, l, mid, k);else update(2 * p + 1, mid + 1, r, k);trees[p] = trees[2 * p] + trees[2 * p + 1];
}int ask(int p, int l, int r, int range_l, int range_r) {//返回[range_l, range_r]的区间和if (range_l <= l && range_r >= r) return trees[p];int mid = (l + r) / 2, ans = 0;if (mid >= range_l) ans += ask(2 * p, l, mid, range_l, range_r);if (mid < range_r) ans += ask(2 * p + 1, mid + 1, r, range_l, range_r);return ans;
}
查询排序
class query {
public:int l, r, key;
};
vector<query> querys;
bool mycom(query a, query b) { return a.r < b.r; }
sort(querys.begin(), querys.end(), mycom);
记录所有r结尾的区间
vector<vector<int>> end_by_r;
for (int i = 0; i < m; i++) end_by_r[querys[i].r].push_back(i);
注意记录答案
for (int i = 1; i <= n; i++) {if (mp.find(arr[i]) != mp.end()) update(1, 1, n, mp[arr[i]]);//让一次出现的位置变成0mp[arr[i]] = i;//更新上一次出现for (int x : end_by_r[i]) {ans[querys[x].key] = ask(1, 1, n, querys[x].l, querys[x].r);//此时,区间的和就是种类数。}
}
按顺序输出答案
for (int i = 0; i < m; i++) printf("%d\n", ans[i]);