快速傅里叶变换

写代码是不可能写代码的,今下午是不想写代码的.不想写代码,又不想咸鱼,就只能靠学点新东西来假装自己在工作的样子,心里才能好受些.

窃格码拉

几乎可以肯定,下面的内容肯定会出锅.

傅里叶变换的实际意义

从电压说起

被模电折磨的同学都知道,有种东西叫做傅里叶级数,可以将成周期性变化的电压分解为数个三角函数波的叠加.

在这里,我们提出另一个问题,如果不知道周期,该如何将这些叠加在一起的信号拆分为单纯的三角波?

三角波叠加图象周期并不那么显然,也许你可以试一试.

一种缠绕机

有一种奇特的方法,我们将一段时域图象在笛卡尔坐标系上以原点为圆心起来,一圈一圈缠起来,然后调整源图象缠绕的速率(几秒一圈),观察整个图形的质心变化.

这个质心会随着图象缠绕的频率而发生位移.取质心的x坐标为y轴,以缠绕的频率为横轴,作出图象B.在这个图象上,会观测到一个现象:(假设我们已知原图像的分解三角波频率)当缠绕频率接近某个源三角波的频率时,缠绕图象出现重合,质心相对原点出现较大位移,图象出现一个峰值.

继续调整缠绕频率,峰值消失,图象回归到小范围波动.

通过观察图象B,可以认为,出现峰值的频率对应着一个频率的源三角波.如此,就将叠加图象还原了回去.

傅里叶变换的数学实现

现在,考虑如何通过的数学的方法来实现这个缠绕.

如何缠绕

g(t)g(t)的图象缠绕到圆上听起来挺奇怪的,有这样的数学方法吗.

有一个东西,叫做y=eixy=e^{ix}.当其图象画在复平面时,就出现了有趣的事情:一个圆.对这个公式做一些加工.

y=g(t)e2πifty=g(t)e^{-2\pi i ft}

如此,就能够将g(t)g(t)ff频率缠绕.

关于质心

上文我们取质心的x坐标作图,现在需要稍微修改一下.

实际上,我们关心的是质心相对于原点的偏移距离.同样,以复平面的方式来表示质心位置就能够同时保留x和y坐标信息.

关于如何求取质心,其实也很直观.选取缠绕图象上的数个点,取平均,就是质心的大约位置.当点的数目达到极限,求和公式化为积分,所求即为质心.

g^(f)=1t2t1t1t2g(t)e2πift\hat g(f)=\frac{1}{t_2-t_1} \int_{t_1}^{t_2}{g(t)e^{-2\pi i ft}}

?

目前为止,这几乎已经是傅里叶变换了.在数学应用时,傅里叶变换会去掉取均值,即

g^(f)=t1t2g(t)e2πift\hat g(f)=\int_{t_1}^{t_2}{g(t)e^{-2\pi i ft}}

也就是说,取样的时域信号越长,该质心的偏移倾向越大,这和我们想要的效果一致.

这就是傅里叶变换,实现了时域信号频域信号的转换.

此外,还有方法将频域信号再次逆变换为时域信号的方法.

应用

傅里叶变换在很多领域都有重要作用.只要问题能转换为时域频域之间的变化,就有傅里叶变换的用武之处.

比如,在音频处理软件中,常常有一个功能叫做消除人声.基于傅里叶变换我们可以设计一个(至少理论上有用)的算法.

首先,任何声音都是相应频率的波对气压变化引起的,也就是不同频率的波在时间上叠加在一起,产生了声音.将源波使用傅里叶变换拆分到多个三角波上去.删除人声所在的频域,再将频域信号逆变换为时域信号.人声便消失了.

离散傅里叶变换

连续意义下的傅里叶变换先到此为止.在计算机中所处理的数据一般都是离散的.我们需要的是离散傅里叶变换.

离散意义下的时域信号和频域信号就都变成了点集.当从连续向离散过渡时,可以这样思考:

在连续的图象上以一定间隔取样得到离散点集.使用该点集进行傅里叶变换.

这也是我们一开始采取的质心求解方法,只不过,这次我们从缠绕时就取样.(质点依然是真正的质点)
对于点集g(0n<N)g(0\leq n < N),它的傅里叶变化就是

g^(k)=n=0N1g(n)ei2πNnk\hat g(k)=\sum_{n=0}^{N-1}g(n)e^{-i\frac {2\pi}{N}nk}

简单粗暴.

快速傅里叶变换

在了解了关于傅里叶变换的一系列背景与一个应用后,我们再回来解决一些重要的问题.

根据傅里叶变换的公式定义

g^(k)=n=0N1g(n)ei2πNnk\hat g(k)=\sum_{n=0}^{N-1}g(n)e^{-i\frac {2\pi}{N}nk}

其朴素算法的时间复杂度为O(N2)O(N^2) 这个复杂度还不够优秀.一种快速傅里叶变换算法利用eixe^{ix}的性质,将复杂度降低到了O(NlgN)O(N\lg N).

单位根

eixe^{ix}个名字.

在数学上, nn单位根nn次幂为1的复数.它们位于复平面的单位圆上,构成正n边形的顶点,其中一个顶点是1.

ωn,k=ei2πnk\omega_{n,k}=-e^{i\frac{2\pi}{n}k}

其几何意义为单位圆上的n等分点的顺时针第k个.

一般来说,单位根取逆时针,不过这里为了方便,取顺时针.

如同三角函数一样,单位根存在一些显然的定理.

折半:ω2n,2k=ωn,k\omega_{2n,2k}=\omega_{n,k}

化简:ωn,k+2n=ωn,k\omega_{n,k+\frac 2n}=-\omega_{n,k}

修改公式

来看原本的离散傅里叶变换公式

g^(k)=n=0N1g(n)ei2πNnk\hat g(k)=\sum_{n=0}^{N-1}g(n)e^{-i\frac {2\pi}{N}nk}

使用单位根来替换一下

g^(k)=n=0N1ωN,nkg(n)\hat g(k)=\sum_{n=0}^{N-1}\omega_{N,nk} g(n)

按照化简公式的指引,将求和公式按照单位根奇偶拆分为2部分.

g^(k)=n=0N1ωN,nkg(n)=0n<NωN,nkg(n)=02n<NωN,2nkg(2n)+02n+1<NωN,(2n+1)kg(2n+1)=02n<NωN,2nkg(2n)+02n+1<NωN,2nk+kg(2n+1)=02n<NωN2,nkg(2n)+ωN,k02n+1<NωN2,nkg(2n+1)=g^even(k)+ωN,kg^odd(k)\begin{aligned} \hat g(k) &= \sum_{n=0}^{N-1}\omega_{N,nk} g(n) \\ &= \sum_{0 \leq n < N}\omega_{N,nk} g(n) \\ &= \sum_{0 \leq 2n < N}\omega_{N,2nk} g(2n) + \sum_{0 \leq 2n+1 < N}\omega_{N,(2n+1)k} g(2n+1) \\ &=\sum_{0 \leq 2n < N}\omega_{N,2nk} g(2n) + \sum_{0 \leq 2n+1 < N}\omega_{N,2nk+k} g(2n+1) \\ &=\sum_{0 \leq 2n < N}\omega_{\frac N2,nk} g(2n) + \omega_{N,k}\sum_{0 \leq 2n+1 < N}\omega_{\frac N2,nk} g(2n+1) \\\\ &=\hat g_{even}(k)+\omega_{N,k} \hat g_{odd}(k) \end{aligned}

注意到不管是g^even(k)\hat g_{even}(k)还是g^even(k)\hat g_{even}(k),它们都以N/2N/2为周期.接下来,应用化简定理

g^(k+N2)=g^even(k)ωN,kg^odd(k)\hat g(k+\frac N2)=\hat g_{even}(k)-\omega_{N,k} \hat g_{odd}(k)

将这2个式子放在一起

g^(k)=g^even(k)+ωN,kg^odd(k)g^(k+N2)=g^even(k)ωN,kg^odd(k)\hat g(k)=\hat g_{even}(k)+\omega_{N,k} \hat g_{odd}(k) \\ \hat g(k+\frac N2)=\hat g_{even}(k)-\omega_{N,k} \hat g_{odd}(k)

当k取遍原问题规模的一半时,可以直接由第二个式子得到另一半.问题的规模减半.递归求解,最终的复杂度就降到了O(NlgN)O(N \lg N).

这就是Cooley-Turkey快速傅里叶变换算法.

快速乘法

定义多项式A(x)=kakxk+1A(x)=\sum_k a_kx^{k+1},B(x)B(x)同理,求解C(x)=A(x)B(x)C(x)=A(x)B(x).

很容易看出,朴素算法的复杂度为O(N2)O(N^2).

现在,来看如何使用FFT快速计算.

点值表示

对于一个次数为n1n-1的多项式,其图象上互不相同的nn个点可以唯一确定该多项式.

如同确定混合在一起的几个波一样.

至于为什么是对的,大可在Google上搜索一番.

xx为数个单位根,在A(x)A(x)B(x)B(x)上利用单位根的性质得到AABB的点值表示,将点值相乘得到CC的点值表示.之后,将CC的点值表示再转换为系数表示.

嗯?FFT在哪?

其实在这里,

g^(ω)=A(ω)=nωA[xn+1]\hat g(\omega)=A(\omega)=\sum_{n}\omega A[x^{n+1}]

离散卷积

有一种数学运算,叫做卷积.现在只讨论它的离散情况.

(fg)(n)=τ=infinff(τ)g(nτ)(f * g)(n)=\sum_{\tau=-\inf}^{inf}f(\tau)g(n-\tau)

这玩意的意义…实在是不怎么明显.不过好在我们只是想算个多项式乘法,也就是把多项式的系数算来算去:

C[xn]C[x^n] 表示多项式CCxnx^n项的系数.

C[xn]=τ=0nA[xτ]B[xnτ]C[x^{n}]=\sum_{\tau=0}^{n}A[x^\tau]B[x^{n-\tau}]

嗯?

如果我们设多项式中不存在的项的系数为0的话.

C[xn]=τ=infinfA[xτ]B[xnτ]C[x^{n}]=\sum_{\tau=-\inf}^{\inf}A[x^\tau]B[x^{n-\tau}]

哈,

C[xn]=(AB)[xn]C[x^n]=(A*B)[x^n]

卷积定理

卷积定理指出:

一个域中的卷积对应于另一个域中的乘积.

这意味着,上面这个计算(卷积)对应着另一个域里的乘积.也就是

F(C[xn])=F(A[xn])F(B[xn])F(C[x^n])=F(A[x^n]) \cdot F(B[x^n])

这便是深层原理.对A和B的取样(频域)称为A和B的点值表示,最终以乘积的方式得到了C的点值表示(频域).用FFT来计算乘法的说法是对的.

傅里叶逆变换

如何从一个频域信号再得到时域信号?

g(n)=1Nk=0N1ei2πNnkg^(k)g(n)=\frac 1N\sum_{k=0}^{N-1}e^{i\frac{2\pi}{N}nk} \hat g(k)

注意:此处的1/N与上面的变换是相匹配的.

这个式子可以理解成对变换后的式子再变换,意味着它同样可以用变换时的思想来加速.

FFT的C++实现

一个值得注意的问题就是,对于单位根的运算涉及到了精度的问题.但目前还不需要讨论.

翻转操作

可以观察到,按照上面的算法实现,我们需要在每次递归按照奇和偶将取样分组.且每次递归都会分组.每次分组都会涉及到数组的复制,常数较大.

观察分组操作中下标的变化.

1
2
3
4
(表示下标)
0 1 2 3 4 5 6 7
0 2 4 6 | 1 3 5 7
0 4 | 2 6 | 1 5 | 3 7

将其转换为二进制

1
2
000 001 010 011 100 101 110 111
000 100 010 110 001 101 011 111

可以发现,最终的分组结果就是将原下标二进制翻转.所以可以直接一次完成分组.

注意,这要求取样为2的幂次.

🦋蝴蝶操作

解决了递归中由顶至底的分组后,接下来优化子问题合并时的数组复制.

观察原来的合并式子

g^(k)=g^even(k)+ωN,kg^odd(k)g^(k+N2)=g^even(k)ωN,kg^odd(k)\hat g(k)=\hat g_{even}(k)+\omega_{N,k} \hat g_{odd}(k) \\ \hat g(k+\frac N2)=\hat g_{even}(k)-\omega_{N,k} \hat g_{odd}(k)

按照算法中的实现方法,其为

g^(k)=g^(k)+ωN,kg^(k+N2)g^(k+N2)=g^(k)ωN,kg^(k+N2)\hat g(k)=\hat g(k)+\omega_{N,k} \hat g(k+\frac N2) \\ \hat g(k+\frac N2)=\hat g(k)-\omega_{N,k} \hat g(k+\frac N2)

想要省略数组复制,进行原地合并,问题出在新数值太早地替换掉了我们需要的数值.

取辅助变量,修改原式

t=ωN,kg^(k+N2)g^(k+N2)=g^(k)tg^(k)=g^(k)+tt=\omega_{N,k} \hat g(k+\frac N2)\\ \hat g(k+\frac N2)=\hat g(k)-t\\ \hat g(k)=\hat g(k)+t

这个操作被称为"蝴蝶操作",名字很有意思.

代码

在这段代码中同时去掉了递归.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
const double PI=acos(-1);

inline complex<double> gomega(int n,int k,bool rev=false){
complex<double> res(cos(2*PI/n*k),sin(2*PI/n*k));
if(rev)return conj(res);
else return res;
}
const int MAXN=10;
struct FFT{
complex<double> omega[MAXN],omegaI[MAXN];

FFT(int n){
for(int i=0;i<n;i++){
omega[i]=gomega(n,i);
omegaI[i]=gomega(n,i,1);
}
}
void transform(complex<double> *a,int n,const complex<double> *omega){
for(int i=0,j=0;i<n;i++){
if(i>j)swap(a[i],a[j]);
//二进制换位
for(int l=n/2;(j^=l)<l;l>>=1);
}
for(int l=2;l<=n;l<<=1){
int m=l/2;
for(complex<double> *p=a;p!=a+n;p+=l){
for(int i=0;i<m;i++){
//蝴蝶操作
complex<double> t=omega[n/l*i]*p[m+i];
p[m+i]=p[i]-t;
p[i]+=t;
}
}
}
}
void dft(complex<double> *a,int n){
transform(a,n,omega);
}
void idft(complex<double> *a,int n){
transform(a,n,omegaI);
for(int i=0;i<n;i++)a[i]/=n;
}
};

如果想要实现快速乘法,只要将2个多项式的系数函数传入进行变换,变换结果相乘并逆变换即可.

应用

快速乘法

指快速大数乘法。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
#include <iostream>
#include <algorithm>
#include <vector>
#include <complex>
#include <cmath>
using namespace std;

const int MAXN=300000;
const double PI=acos(-1);

inline complex<double> gomega(int n,int k,bool rev=false){
complex<double> res(cos(2*PI/n*k),sin(2*PI/n*k));
if(rev)return conj(res);
else return res;
}
struct FFT{
complex<double> omega[MAXN],omegaI[MAXN];

FFT(){
}
void init(int n){
for(int i=0;i<n;i++){
omega[i]=gomega(n,i);
omegaI[i]=gomega(n,i,1);
}
}

void transform(complex<double> *a,int n,const complex<double> *omega){
for(int i=0,j=0;i<n;i++){
if(i>j)swap(a[i],a[j]);
//二进制换位
for(int l=n/2;(j^=l)<l;l>>=1);
}
for(int l=2;l<=n;l<<=1){
int m=l/2;
for(complex<double> *p=a;p!=a+n;p+=l){
for(int i=0;i<m;i++){
//蝴蝶操作
complex<double> t=omega[n/l*i]*p[m+i];
p[m+i]=p[i]-t;
p[i]+=t;
}
}
}
}
void dft(complex<double> *a,int n){
transform(a,n,omega);
}
void idft(complex<double> *a,int n){
transform(a,n,omegaI);
for(int i=0;i<n;i++)a[i]/=n;
}
};

complex<double> a[2][MAXN];
int ans[MAXN];
FFT fft;
int main(){

int nlen;cin>>nlen;
int n=1;
//根据原理,n必须取大于2nlen的数,才能满足取样要求和反转操作要求
while(n<2*nlen)n*=2;
fft.init(n);


for(int i=0;i<2;i++){
string inp;cin>>inp;
for(int j=0,k=inp.size()-1;j<inp.size();j++,k--){
a[i][j]=complex<double>(inp[j]-&#039;0&#039;,0);
}
fft.dft(a[i],n);
}
for(int i=0;i<n;i++)a[0][i]=a[0][i]*a[1][i];
fft.idft(a[0],n);
int reslen=nlen+nlen-1;
for(int i=reslen-1,k=0;i>=0;i--,k++)
ans[k]=(int)floor(a[0][i].real()+0.5);
/*
for(int i=0;i<reslen;i++)cout<<ans[i]<<" ";
cout<<endl;
*/
for(int i=0;i<MAXN;i++){
ans[i+1]+=ans[i]/10;
ans[i]%=10;
}
int ptr=MAXN-1;
while(ans[ptr]==0)ptr--;
for(;ptr>=0;ptr--)cout<<ans[ptr];
cout<<endl;

return 0;
}

实际意义

但是更加值得关心的是其广义上的物理意义。N个采样点拿到的N个值到底对应着什么。

设采样率为FF,采样间隔为T=1FT=\frac{1}{F}。设采样次数NN。那么显然不管是数据下标还是结果下标,都不是其原有意义。

有如下对应关系

  • 采样时长为TNTN或者N/FN/F(采样区间长度)
  • 数据下标很显然

结果略有一点点绕。对于「在NN个点中出现了kk个周期」的基信号,一个周期N/kN/k个点,一个周期时长NkF\frac{N}{kF}。如果不想把你的频域图像画爆那就倒过来取周期频率FNk\frac{F}{N}k

即结果的点下标xx对应着频率为FNx\frac{F}{N}x的基信号。


快速傅里叶变换
https://blog.chenc.me/2019/07/11/fast-fourier-transform/
作者
CC
发布于
2019年7月12日
许可协议