首页 > 技术文章 > FWT 学习总结

joyouth 2016-05-20 17:18 原文

我理解的FWT是在二元运算意义下的卷积

目前比较熟练掌握的集合对称差卷积

对于子集卷积和集合并卷积掌握不是很熟练(挖坑ing)

那么就先来谈一谈集合对称差卷积吧

所谓集合对称差卷积

就是h(i)=sigma(g(j)*f(k))(j^k=i)

首先一个很显然的事情是如下结论:

 

证明就是如果S是空集,答案为1,否则设存在元素v,则(S交T)和(S交T^v)两两相消配对

答案为0

由于j^k=i,则一定存在j^k^i=0,所以我们可以用上面的式子化简卷积

式子的化简显然是正确的,就是将判断符号带入之后利用乘法分配律分配

这样我们定义:

显然利用反演我们可以得到

至于证明,我们将上面的式子带入下面的式子就可以啦

之后我们再下面的式子代入最上面的式子

可以得到

这也就意味着如果我们可以完成快速沃尔什变换和逆变换

我们就可以在O(n)的时间内把他们乘起来

至于变换的过程,我们利用递推的思想可以得到:

说的简单的一点就是我们FWT的时候利用倍增思想

设左边得到的集合幂级数为tf0

设右边得到的集合幂级数为tf1

合并之后得到的集合幂级数为(tf0+tf1,tf0-tf1)

至于逆变换

得到的集合幂级数为((tf0+tf1)/2,(tf0-tf1)/2)

由于有除法,所以FWT不能对特征为2的集合幂级数使用

以上图片截图自vfk论文

 

然后一道众人皆知的例题是SRM 518 Nim

在[1,L]中可以重复的选取k个质数,问有多少种方案使得他们异或和为0

我们可以构造集合幂级数,之后我们会发现选取两个我们只需要FWT一次就可以了

选取k个我们就可以使用快速幂了,注意这里并不是对FWT做快速幂

由于集合幂级数并没有次数界的问题,所以可以直接对每个点做快速幂

之后再FWT还原即可

#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#include<cstdlib>
using namespace std;

typedef long long LL;
const int maxn=200010;
const int mod=1e9+7;
int k,L,m,inv;
bool vis[maxn];
int p[maxn],cnt=0;
int f[maxn];

int pow_mod(int v,int p){
	int tmp=1;
	while(p){
		if(p&1)tmp=1LL*tmp*v%mod;
		v=1LL*v*v%mod;p>>=1;
	}return tmp;
}
void Get_prime(){
	for(int i=2;i<=L;++i){
		if(!vis[i])p[++cnt]=i;
		for(int j=1;j<=cnt;++j){
			if(1LL*p[j]*i>L)break;
			vis[i*p[j]]=true;
			if(i%p[j]==0)break;
		}
	}return;
}
void FWT(int *A,int n,int flag){
	for(int k=1;k<n;k<<=1){
		int mk=(k<<1);
		for(int j=0;j<n;j+=mk){
			for(int i=0;i<k;++i){
				int x=A[i+j],y=A[i+j+k];
				A[i+j]=1LL*(x+y)*flag%mod;
				A[i+j+k]=1LL*(x-y+mod)*flag%mod;
			}
		}
	}return;
}

int main(){
	freopen("srmnim.in","r",stdin);
	freopen("srmnim.out","w",stdout);
	scanf("%d%d",&k,&L);
	Get_prime();inv=pow_mod(2,mod-2);
	for(m=1;m<=L;m<<=1);
	for(int i=1;i<=cnt;++i)f[p[i]]=1;
	FWT(f,m,1);
	for(int i=0;i<m;++i)f[i]=pow_mod(f[i],k);
	FWT(f,m,inv);printf("%d\n",f[0]);
	return 0;
}

之后是2015年ACM北京赛区的题目

The Celebration of Rabbits

要求你先给每个数赋值在[0,m]范围内,之后再给每个数都加上同一个x,x在[L,R]范围内

求有多少种方案使得最后的数的异或和为0(数的数量为奇数)

首先我们证明一件事情:对于每一种方案中的x都是唯一的

采用反证法,设不是唯一的

设现在序列为a1,a2,a3……,且满足a1^a2^a3……=0

若不是唯一的,则一定存在序列a1-k,a2-k,a3-k……,且他们异或和为0(k!=0)

我们考虑最后一位,由于a1^a2^a3……=0,又因为数的数量为奇数

所以末位为1的有偶数个,末位为0的有奇数个

若k的末位为1,则序列的异或和不为0(因为会转换成末位为1的奇数个,末位为0的有偶数个)

所以k的末位为0,对上一位不会有进位影响,同理我们可以用同样方法考虑上一位

最终得到k=0,与假设不符,证毕

既然x都是唯一的,那么我们可以枚举x,之后问题转换成在[x,x+m]中可以重复的取若干个数使得异或和为0

FWT即可

#include<cstdio>
#include<cstring>
#include<iostream>
#include<cstdlib>
#include<algorithm>
using namespace std;

typedef long long LL;
const int mod=1e9+7;
int n,m,L,R;
int ans=0,N,inv;
int f[20010];
int pow_mod(int v,int p){
	int tmp=1;
	while(p){
		if(p&1)tmp=1LL*tmp*v%mod;
		v=1LL*v*v%mod;p>>=1;
	}return tmp;
}
void FWT(int *A,int n,int flag){
	for(int k=1;k<n;k<<=1){
		int mk=(k<<1);
		for(int j=0;j<n;j+=mk){
			for(int i=0;i<k;++i){
				int x=A[i+j],y=A[i+j+k];
				A[i+j]=1LL*(x+y)*flag%mod;
				A[i+j+k]=1LL*(x-y+mod)*flag%mod;
			}
		}
	}return;
}

int main(){
	inv=pow_mod(2,mod-2);
	while(scanf("%d%d%d%d",&n,&m,&L,&R)==4){
		ans=0;
		for(int i=L;i<=R;++i){
			for(N=1;N<=i+m;N<<=1);
			for(int j=0;j<N;++j){
				if(j>=i&&j<=i+m)f[j]=1;
				else f[j]=0;
			}
			FWT(f,N,1);
			for(int j=0;j<N;++j)f[j]=pow_mod(f[j],(n<<1)+1);
			FWT(f,N,inv);
			ans=ans+f[0];
			if(ans>=mod)ans-=mod;
		}printf("%d\n",ans);
	}return 0;
}

codeforces 259 div1 D

有2^m个点,每个点上有信息,每个时刻每个点会分别向跟他海明码距离为k的点传b(k)次他自己的信息

问t时刻后每个点的信息量

考试题的加强版本,而且数据范围非常全

首先模数的问题可以同考试题的做法解决

首先做法1,我们考虑每个时刻的传输并用集合幂级数表示

设集合幂级数f(i)表示输入数组

设集合幂级数g(j),满足g(j)=b(num(j)) num(j)即j的二进制表示中1的个数

则下一时刻可得h(k)=sigma(f(i)*g(j))(i^j=k)

之后t时刻的话快速幂即可,由于要写快速乘,时间复杂度O(nlog^2n)

用一些奇技淫巧优化快速乘做到O(nlogn)

#include<cstdio>
#include<cstring>
#include<cstdlib>
#include<iostream>
#include<algorithm>
using namespace std;

typedef long long LL;
int n,m;
int Num[1050010];
LL t,mod;
LL b[22];
LL f[1050010],g[1050010];

inline read(LL &num){
	num=0;char ch=getchar();
	while(ch<'!')ch=getchar();
	while(ch>='0'&&ch<='9')num=num*10+ch-'0',ch=getchar();
}
inline LL mul(LL a,LL b) {
    LL tmp=(a*b-(LL)((long double)a/mod*b+1e-8)*mod);
    return tmp<0?tmp+mod:tmp;
}
LL pow_mod(LL v,LL p){
	LL tmp=1;
	while(p){
		if(p&1)tmp=mul(tmp,v);
		v=mul(v,v);p>>=1;
	}return tmp;
}
void FWT(LL *A,int n,int flag){
	for(int k=1;k<n;k<<=1){
		int mk=(k<<1);
		for(int j=0;j<n;j+=mk){
			for(int i=0;i<k;++i){
				LL x=A[i+j],y=A[i+j+k];
				A[i+j]=(x+y)>>flag;
				A[i+j+k]=(x-y+mod)>>flag;
				if(A[i+j]>=mod)A[i+j]-=mod;
				if(A[i+j+k]>=mod)A[i+j+k]-=mod;
			}
		}
	}return;
}

int main(){
	scanf("%d",&m);read(t);read(mod);
	n=(1<<m);mod*=n;
	for(int i=0;i<n;++i)read(f[i]),f[i]%=mod;
	for(int i=0;i<=m;++i)read(b[i]),b[i]%=mod;
	for(int i=0;i<n;++i){
		Num[i]=Num[i>>1]+(i&1);
		g[i]=b[Num[i]];
	}
	FWT(f,n,0);FWT(g,n,0);
	for(int i=0;i<n;++i){
		g[i]=pow_mod(g[i],t);
		f[i]=mul(f[i],g[i]);
	}
	FWT(f,n,1);mod/=n;
	for(int i=0;i<n;++i)printf("%I64d\n",f[i]%mod);
	return 0;
}

我们还有更优的做法

由于每个点的贡献是可分的,我们不妨考虑每个点t时刻内的贡献系数

同考试题可以证明根据海明码距离我们可以分出m+1个等价类

问题在于我们要搞出单次转移的系数,之后矩阵乘法就可以了

我们考虑海明码距离j对海明码距离i的转移,显然i中对海明码距离贡献为1的点有i个,贡献为0的点有m-i个

设k=i-j,我们选取贡献为1的点x个并取反,选取贡献为0的点y个并取反,一定满足y=x-k

这样操作后两个点的海明码距离为x+y

系数的贡献显然就是b(x+y)*C(i,x)*C(m-i,y)

其中C是组合数,我们枚举x算贡献就可以了

我们矩阵乘法搞出系数来了之后同考试题的做法一样做FWT就可以了

时间复杂度O(m^3logn+nlogn)

#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#include<cstdlib>
using namespace std;

typedef long long LL;
int m,n;
int Num[1050010];
LL t,mod;
LL C[22][22];
LL f[1050010],g[1050010];
LL b[22];
struct Matrix{
	LL a[22][22];
	void clear(){memset(a,0,sizeof(a));}
}A,ans;

void pre_C(){
	C[0][0]=1;
	for(int i=1;i<=m;++i){
		C[i][0]=C[i][i]=1;
		for(int j=1;j<i;++j){
			C[i][j]=C[i-1][j-1]+C[i-1][j];
			if(C[i][j]>=mod)C[i][j]-=mod;
		}
	}return;
}
LL mul(LL a,LL b){
	LL s=0;
	while(b){
		if(b&1){
			s=s+a;
			if(s>=mod)s-=mod;
		}
		a<<=1;
		if(a>=mod)a-=mod;
		b>>=1;
	}return s;
}
Matrix operator *(const Matrix &A,const Matrix &B){
	Matrix C;C.clear();
	for(int i=0;i<=m;++i){
		for(int j=0;j<=m;++j){
			for(int k=0;k<=m;++k){
				C.a[i][j]=C.a[i][j]+mul(A.a[i][k],B.a[k][j]);
				if(C.a[i][j]>=mod)C.a[i][j]-=mod;
			}
		}
	}return C;
}
Matrix pow_mod(Matrix v,LL p){
	Matrix tmp;tmp.clear();
	for(int i=0;i<=m;++i)tmp.a[i][i]=1;
	while(p){
		if(p&1)tmp=tmp*v;
		v=v*v;p>>=1;
	}return tmp;
}
void FWT(LL *A,int n,int flag){
	for(int k=1;k<n;k<<=1){
		int mk=(k<<1);
		for(int j=0;j<n;j+=mk){
			for(int i=0;i<k;++i){
				LL x=A[i+j],y=A[i+j+k];
				A[i+j]=(x+y)>>flag;
				A[i+j+k]=(x-y+mod)>>flag;
				if(A[i+j]>=mod)A[i+j]-=mod;
				if(A[i+j+k]>=mod)A[i+j+k]-=mod;
			}
		}
	}return;
}

int main(){
	scanf("%d",&m);n=(1<<m);
	scanf("%I64d%I64d",&t,&mod);mod*=n;
	pre_C();
	for(int i=0;i<n;++i)scanf("%I64d",&f[i]),f[i]%=mod;
	for(int i=0;i<=m;++i)scanf("%I64d",&b[i]),b[i]%=mod;
	for(int i=0;i<=m;++i){
		for(int j=0;j<=m;++j){
			int k=i-j;
			for(int x=0;x<=i;++x){
				int y=x-k;
				if(y<0||y>m-i)continue;
				int d=x+y;
				A.a[j][i]+=mul(b[d],mul(C[i][x],C[m-i][y]));
				if(A.a[j][i]>=mod)A.a[j][i]-=mod;
			}
		}
	}
	A=pow_mod(A,t);
	ans.a[0][0]=1;
	ans=ans*A;
	for(int i=0;i<n;++i){
		Num[i]=Num[i>>1]+(i&1);
		g[i]=ans.a[0][Num[i]];
	}
	FWT(f,n,0);FWT(g,n,0);
	for(int i=0;i<n;++i)f[i]=mul(f[i],g[i]);
	FWT(f,n,1);mod/=n;
	for(int i=0;i<n;++i)printf("%I64d\n",f[i]%mod);
	return 0;
}

 

总结:如何想到FWT?

1、题目中的形式是类似卷积一样的东西,朴素做法O(n^2)算贡献

2、贡献过程是二元运算关系

3、通常情况下算异或和为0神马的QAQ

推荐阅读