离散化

匿名 (未验证) 提交于 2019-12-02 23:49:02

离散化是指对于数据范围较大(1e9),但数的个数较少(1e5)的一些数进行操作(并查集等)时,需要通过比较这些数的相对大小,将其离散化,得到"1e5"以内的“离散化数值”,然后就可以将其储存在数组中,进行并查集等操作了。


当离散化的数据无重复时,可以通过记录数组下标,直接在结构体内进行排序等操作

当离散化的数据存在重复时,可以通过先排序(nlogn),再去重(因排序后数据有序,故复杂度从O(n^2)降到O(n),最后通过二分查找到数据的相对大小(离散化后的值)。

代码实现

数据无重复(略)

数据有重复:

    int tot=0;     for(int i=1;i<=n;i++)     {         scanf("%d%d%d",&a[i].a1,&a[i].a2);san[++tot]=a[i].a1;san[++tot]=a[i].a2;     }     sort(san+1,san+tot+1,cmp1);     m=unique(san+1,san+tot+1)-(san+1);//m表示去重后的数值大小,unique并未删除数据,只是将数据放在了数组末尾,因数据有序,复杂度为O(n)     for(int i=1;i<=n;i++)     {         a[i].a1=query(a[i].a1);//query:二分查找(表示不会lower_bound,upper_bound,只能手打)         a[i].a2=query(a[i].a2);     }

解析:看似是道裸LCS,观察数据后发现n<=100000,n^2过不了,只能nlogn过。其实这道题因为排列的性质,可以通过离散化,将问题转化为LIS,再加个LIS的优化就能过了。举个栗子吧:样例中的3 2 1 4 5分别被赋予1 2 3 4 5的离散化值,1 2 3 4 5对应的离散化值就为3 2 1 4 5,然后再求3 2 1 4 5的LIS,即1 4 5,则最长公共子序列的长度为3。正确性证明:离散化值如果递增,则再原排列中所在位置也单调递增。如果是求最长下降子序列,则再原排列中的位置是逆序的,不符合题意。

#include <iostream> #include <cstdio> using namespace std; #define Maxn 100100 int n; int a[Maxn],b[Maxn]; int po[Maxn],situ[Maxn]; int dp[Maxn]; int h[Maxn]; int maxx=1; int query(int x) {     int l=0,r=maxx;int ans=0;     while(l<=r)     {         int mid=(l+r)>>1;         if(h[mid]<=x)         {             ans=mid;l=mid+1;         }         else r=mid-1;     }     return ans; } int main() {     scanf("%d",&n);     for(int i=1;i<=n;i++)scanf("%d",&a[i]),po[a[i]]=i;     for(int i=1;i<=n;i++)scanf("%d",&b[i]),situ[i]=po[b[i]];     h[0]=-2e9;h[1]=situ[1];dp[1]=1;     for(int i=2;i<=n;i++)h[i]=2e9;     for(int i=2;i<=n;i++)     {         int tmp=query(situ[i]);         if(tmp==maxx){maxx++;h[maxx]=situ[i];dp[i]=maxx;}         else{h[tmp+1]=min(h[tmp+1],situ[i]);dp[i]=tmp+1;}     }     int ans=0;     for(int i=1;i<=n;i++)ans=max(ans,dp[i]);     printf("%d",ans);     return 0; } 

解析:并查集+数据存在重复的离散化

#include <iostream> #include <cstdio> #include <algorithm> using namespace std; #define Maxn 1000100 int n; struct node{    int a1,a2,com; }a[Maxn]; int san[Maxn*2];int tot=0;int m; int query(int x) {     int l=1,r=m;int ans=0;     while(l<=r)     {         int mid=(l+r)>>1;         if(san[mid]>=x)         {             ans=mid;r=mid-1;         }         else l=mid+1;     }     return ans; } bool cmp1(int x,int y){return x<y;} bool cmp2(node x,node y){return x.com>y.com;} int fa[Maxn*2]; int find_fa(int x) {     return fa[x]==x?x:fa[x]=find_fa(fa[x]); } int main() {     int T;scanf("%d",&T);     while(T--)     {     scanf("%d",&n);     for(int i=1;i<=n*2;i++)san[i]=0;     tot=0;     for(int i=1;i<=n;i++)     {         scanf("%d%d%d",&a[i].a1,&a[i].a2,&a[i].com);san[++tot]=a[i].a1;san[++tot]=a[i].a2;     }     sort(san+1,san+tot+1,cmp1);     m=unique(san+1,san+tot+1)-(san+1);     for(int i=1;i<=n;i++)     {         a[i].a1=query(a[i].a1);         a[i].a2=query(a[i].a2);     }     sort(a+1,a+n+1,cmp2);     for(int i=1;i<=n*2;i++)fa[i]=i;     int pd=0;     for(int i=1;i<=n;i++)     {         int fa1=find_fa(a[i].a1);         int fa2=find_fa(a[i].a2);         if(a[i].com==1)fa[fa1]=fa2;         else         {             if(fa1==fa2)pd=1;         }         if(pd)break;     }     if(pd)printf("NO\n");else printf("YES\n");     }     return 0; } 
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!