离散化是指对于数据范围较大(1e9),但数的个数较少(1e5)的一些数进行操作(并查集等)时,需要通过比较这些数的相对大小,将其离散化,得到"1e5"以内的“离散化数值”,然后就可以将其储存在数组中,进行并查集等操作了。
当离散化的数据无重复时,可以通过记录数组下标,直接在结构体内进行排序等操作
当离散化的数据存在重复时,可以通过先排序(nlogn),再去重(因排序后数据有序,故复杂度从O(n^2)降到O(n),最后通过二分查找到数据的相对大小(离散化后的值)。
代码实现
数据无重复(略)
数据有重复:
int tot=0; for(int i=1;i<=n;i++) { scanf("%d%d%d",&a[i].a1,&a[i].a2);san[++tot]=a[i].a1;san[++tot]=a[i].a2; } sort(san+1,san+tot+1,cmp1); m=unique(san+1,san+tot+1)-(san+1);//m表示去重后的数值大小,unique并未删除数据,只是将数据放在了数组末尾,因数据有序,复杂度为O(n) for(int i=1;i<=n;i++) { a[i].a1=query(a[i].a1);//query:二分查找(表示不会lower_bound,upper_bound,只能手打) a[i].a2=query(a[i].a2); }
解析:看似是道裸LCS,观察数据后发现n<=100000,n^2过不了,只能nlogn过。其实这道题因为排列的性质,可以通过离散化,将问题转化为LIS,再加个LIS的优化就能过了。举个栗子吧:样例中的3 2 1 4 5分别被赋予1 2 3 4 5的离散化值,1 2 3 4 5对应的离散化值就为3 2 1 4 5,然后再求3 2 1 4 5的LIS,即1 4 5,则最长公共子序列的长度为3。正确性证明:离散化值如果递增,则再原排列中所在位置也单调递增。如果是求最长下降子序列,则再原排列中的位置是逆序的,不符合题意。
#include <iostream> #include <cstdio> using namespace std; #define Maxn 100100 int n; int a[Maxn],b[Maxn]; int po[Maxn],situ[Maxn]; int dp[Maxn]; int h[Maxn]; int maxx=1; int query(int x) { int l=0,r=maxx;int ans=0; while(l<=r) { int mid=(l+r)>>1; if(h[mid]<=x) { ans=mid;l=mid+1; } else r=mid-1; } return ans; } int main() { scanf("%d",&n); for(int i=1;i<=n;i++)scanf("%d",&a[i]),po[a[i]]=i; for(int i=1;i<=n;i++)scanf("%d",&b[i]),situ[i]=po[b[i]]; h[0]=-2e9;h[1]=situ[1];dp[1]=1; for(int i=2;i<=n;i++)h[i]=2e9; for(int i=2;i<=n;i++) { int tmp=query(situ[i]); if(tmp==maxx){maxx++;h[maxx]=situ[i];dp[i]=maxx;} else{h[tmp+1]=min(h[tmp+1],situ[i]);dp[i]=tmp+1;} } int ans=0; for(int i=1;i<=n;i++)ans=max(ans,dp[i]); printf("%d",ans); return 0; }
解析:并查集+数据存在重复的离散化
#include <iostream> #include <cstdio> #include <algorithm> using namespace std; #define Maxn 1000100 int n; struct node{ int a1,a2,com; }a[Maxn]; int san[Maxn*2];int tot=0;int m; int query(int x) { int l=1,r=m;int ans=0; while(l<=r) { int mid=(l+r)>>1; if(san[mid]>=x) { ans=mid;r=mid-1; } else l=mid+1; } return ans; } bool cmp1(int x,int y){return x<y;} bool cmp2(node x,node y){return x.com>y.com;} int fa[Maxn*2]; int find_fa(int x) { return fa[x]==x?x:fa[x]=find_fa(fa[x]); } int main() { int T;scanf("%d",&T); while(T--) { scanf("%d",&n); for(int i=1;i<=n*2;i++)san[i]=0; tot=0; for(int i=1;i<=n;i++) { scanf("%d%d%d",&a[i].a1,&a[i].a2,&a[i].com);san[++tot]=a[i].a1;san[++tot]=a[i].a2; } sort(san+1,san+tot+1,cmp1); m=unique(san+1,san+tot+1)-(san+1); for(int i=1;i<=n;i++) { a[i].a1=query(a[i].a1); a[i].a2=query(a[i].a2); } sort(a+1,a+n+1,cmp2); for(int i=1;i<=n*2;i++)fa[i]=i; int pd=0; for(int i=1;i<=n;i++) { int fa1=find_fa(a[i].a1); int fa2=find_fa(a[i].a2); if(a[i].com==1)fa[fa1]=fa2; else { if(fa1==fa2)pd=1; } if(pd)break; } if(pd)printf("NO\n");else printf("YES\n"); } return 0; }