打印
[STM32F1]

快速傅里叶变换FFT

[复制链接]
515|1
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
lzmm|  楼主 | 2023-12-30 21:45 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
FFT位翻转程序效率:
在单片机控制程序中,往往会用到位翻转程序,例如点阵的控制,图形的处理,FFT运算等。那么,在C语言中如何才能写出高效率的程序呢?今日在keil的论坛中看到有网友提及这个程序,又在论坛搜索了一下,将老外写的,网友写的,我自己写的程序做了一个全方位的测试,结果如下所示:
首先是老外的程序:
作者:Concepcion Marco Valero
#include <reg52.h>
unsigned char mr;
unsigned char invertir_byte (mr) {
mr = (mr & 0x0F) << 4 | (mr & 0xF0) >> 4;
mr = (mr & 0x33) << 2 | (mr & 0xCC) >> 2;
mr = (mr & 0x55) << 1 | (mr & 0xAA) >> 1;
return (mr);
}
void main()
{
while(1)
{
P1=invertir_byte(0x33);
}
}
Program Size: data=10.0 xdata=0 code=123
完成位交换需要 121 个时钟周期。
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
第二个程序:我写的
#include <reg52.h>
unsigned char mr;
unsigned char invertir_byte (mr) {
unsigned char temp;
if(mr&0x80){temp=temp|0x01;}
if(mr&0x40){temp=temp|0x02;}
if(mr&0x20){temp=temp|0x04;}
if(mr&0x10){temp=temp|0x08;}
if(mr&0x08){temp=temp|0x10;}
if(mr&0x04){temp=temp|0x20;}
if(mr&0x02){temp=temp|0x40;}
if(mr&0x01){temp=temp|0x80;}
return (temp);
}
void main()
{
while(1)
{
P1=invertir_byte(0x33);
}
}
Program Size: data=10.0 xdata=0 code=85
完成位交换需要 42 个时钟周期。
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

第三个程序:还是我写的
#include <reg52.h>
unsigned char mr;
unsigned char invertir_byte (mr) {
bit tempb;
unsigned char count,temp;
for(count=8;count;count--)
{
tempb=mr&0x01;
mr>>=1;
temp<<=1;
temp=temp|tempb;
}
return (temp);
}
void main()
{
while(1)
{
P1=invertir_byte(0x33);
}
}
Program Size: data=12.1 xdata=0 code=64
完成位交换需要 175 个时钟周期
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
第三个程序:还是我写的
#include <reg52.h>
unsigned char mr;
unsigned char invertir_byte (mr) {
bit tempb;
unsigned char count,temp;
for(count=8;count;count--)
{
tempb=mr&0x01;
mr>>=1;
temp<<=1;
temp=temp|tempb;
}
return (temp);
}
void main()
{
while(1)
{
P1=invertir_byte(0x33);
}
}
Program Size: data=12.1 xdata=0 code=64
完成位交换需要 175 个时钟周期
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
第四个程序:还是我写的
#include <reg52.h>
unsigned char bdata temp;
sbit D0=temp^0;
sbit D1=temp^1;
sbit D2=temp^2;
sbit D3=temp^3;
sbit D4=temp^4;
sbit D5=temp^5;
sbit D6=temp^6;
sbit D7=temp^7;
unsigned char invertir_byte (unsigned char mr)
{
D7=mr&0x01;
D6=mr&0x02;
D5=mr&0x04;
D4=mr&0x08;
D3=mr&0x10;
D2=mr&0x20;
D1=mr&0x40;
D0=mr&0x80;
return (temp);
}
void main()
{
while(1)
{
P1=invertir_byte(0x33);
}
}
Program Size: data=10.0 xdata=0 code=59
完成位交换需要 35个时钟周期
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
第五个程序:Jon Ward
##include <reg52.h>
unsigned char bdata src;
sbit S0=src^0;
sbit S1=src^1;
sbit S2=src^2;
sbit S3=src^3;
sbit S4=src^4;
sbit S5=src^5;
sbit S6=src^6;
sbit S7=src^7;
unsigned char bdata dst;
sbit D0=dst^0;
sbit D1=dst^1;
sbit D2=dst^2;
sbit D3=dst^3;
sbit D4=dst^4;
sbit D5=dst^5;
sbit D6=dst^6;
sbit D7=dst^7;
unsigned char invertir_byte (unsigned char mr)
{
src=mr;
D0=S7;
D1=S6;
D2=S5;
D3=S4;
D4=S3;
D5=S2;
D6=S1;
D7=S0;
return(dst);
}
void main()
{
while(1)
{
P1=invertir_byte(0x33);
}
}
//cost 35 machine cycle
//Program Size: data=11.0 xdata=0 code=61
完成位交换需要 35个时钟周期
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
第六个程序:来自**论坛的网友
#include <reg52.h>
unsigned char invertir_byte (unsigned char val)
{
unsigned char dat_b ,i;
dat_b=0x00;
for(i=0;i<=7;i++)
{
dat_b=dat_b|((val>>i)&0x01);
if(i==7)break;
dat_b=dat_b<<1;
}
val=dat_b;
return(val);
}
void main()
{
while(1)
{
P1=invertir_byte(0x33);
}
}

287 cycle
Program Size: data=9.0 xdata=0 code=57
完成位交换需要 287个时钟周期
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
第七个程序:来自**论坛的网友
#include <reg52.h>
unsigned char code tab[16]={0x00,0x08,0x04,0x0c,0x02,0x0a,0x06,0x0e,
0x01,0x09,0x05,0x0d,0x03,0x0b,0x07,0x0f};
unsigned char invertir_byte (unsigned char dat)
{
dat = tab[(dat & 0xf0)>>4] | (tab[dat & 0x0f]<<4);
return dat;
}
void main()
{
while(1)
{
P1=invertir_byte(0x33);
}
}
//cost 26 machine cycle
//Program Size: data=9.0 xdata=0 code=63
完成位交换需要 26 个时钟周期
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
第八个程序:来自**网友
#include<AT89X51.H>
unsigned char byte_bit_swap(unsigned char a)
{
a = ((a & 0x0F) << 4) | ((a & 0xF0) >> 4);
a = ((a << 2) & 0xcc) | ((a>> 2) & 0x33);
a = ((a << 1) & 0xaa) | ((a>> 1) & 0x55);
return(a);
}
void main(void)
{
while(1)
{
P1=byte_bit_swap(0x33);
}
}
Program Size: data=9.0 xdata=0 code=66
完成位交换需要 37 个时钟周期
 



// 快速傅里 叶变换FFT的C语言算法彻底研究
         // LED音乐频谱显示的核心算法就是快速傅里叶变换,FFT的理解和编程还是比较难的,特地撰写此文分享一下研究成果。
// 一、彻底理解傅里叶变换   
// 快速傅里叶变换(Fast Fourier Transform)是离散傅里叶变换的一种快速算法,简称FFT,通过FFT可以将一个信号从时域变换到频域。
// 模拟信号经过A/D转换变为数字信号的过程称为采样。为保证采样后信号的频谱形状不失真,采样频率必须大于信号中最高频率成分的2倍,这称之为采样定理。
// 假设采样频率为fs,采样点数为N,那么FFT结果就是一个N点的复数,每一个点就对应着一个频率点,某一点n(n从1开始)表示的频率为:fn=(n-1)*fs/N。
// 举例说明:用1kHz的采样频率采样128点,则FFT结果的128个数据即对应的频率点分别是0,1k/128,2k/128,3k/128,…,127k/128 Hz。
// 这个频率点的幅值为:该点复数的模值除以N/2(n=1时是直流分量,其幅值是该点的模值除以N)。
// 二、傅里叶变换的C语言编程
// 1、对于快速傅里叶变换FFT,第一个要解决的问题就是码位倒序。
    // 假设一个N点的输入序列,那么它的序号二进制数位数就是t=log2N.
    // 码位倒序要解决两个问题:①将t位二进制数倒序;②将倒序后的两个存储单元进行交换。

// ①将t=3位二进制数倒序

// ②将倒序后的两个存储单元进行交换
    // 如果输入序列的自然顺序号i用二进制数表示,例如若最大序号为15,即用4位就可表示n3n2n1n0,则其倒序后j对应的二进制数就是n0n1n2n3,那么怎样才能实现倒序呢?利用C语言的移位功能!
// 程序如下,我不多说,看不懂者智商一定在180以下!
// 复数类型定义及其运算
#define N 64      //64点
#define log2N 6   //log2N=6
/*复数类型*/
typedef struct
{
float real;
float img;
}complex;
complex xdata x[N]; //输入序列
/*复数加法*/
complex add(complex a,complex b)
{
complex c;
c.real=a.real+b.real;
c.img=a.img+b.img;
return c;
}
/*复数减法*/
complex sub(complex a,complex b)
{
complex c;
c.real=a.real-b.real;
c.img=a.img-b.img;
return c;
}
/*复数乘法*/
complex mul(complex a,complex b)
{
complex c;
c.real=a.real*b.real - a.img*b.img;
c.img=a.real*b.img + a.img*b.real;
return c;
}
/***码位倒序函数***/
void Reverse(void)
{
unsigned int i,j,k;
unsigned int t;
complex temp;//临时交换变量
for(i=0;i<N;i++)//从第0个序号到第N-1个序号
{
  k=i;//当前第i个序号
  j=0;//存储倒序后的序号,先初始化为0
  for(t=0;t<log2N;t++)//共移位t次,其中log2N是事先宏定义算好的
  {
   j<<=1;
   j|=(k&1);//j左移一位然后加上k的最低位
   k>>=1;//k右移一位,次低位变为最低位
  }
  if(j>i)//如果倒序后大于原序数,就将两个存储单元进行交换(判断j>i是为了防止重复交换)
  {
   temp=x[ i];
   x[ i]=x[j];
   x[j]=temp;
  }
}
}
2、第二个要解决的问题就是蝶形运算
  
①第1级(第1列)每个蝶形的两节点“距离”为1,第2级每个蝶形的两节点“距离”为2,第3级每个蝶形的两节点“距离”为4,第4级每个蝶形的两节点“距离”为8。由此推得,
第m级蝶形运算,每个蝶形的两节点“距离”L=2m-1。
②对于16点的FFT,第1级有16组蝶形,每组有1个蝶形;第2级有4组蝶形,每组有2个蝶形;第3级有2组蝶形,每组有4个蝶形;第4级有1组蝶形,每组有8个蝶形。由此可推出,
对于N点的FFT,第m级有N/2L组蝶形,每组有L=2m-1个蝶形。
③旋转因子 的确定
以16点FFT为例,第m级第k个旋转因子为 ,其中k=0~2m-1-1,即第m级共有2m-1个旋转因子,根据旋转因子的可约性, ,所以第m级第k个旋转因子为 ,其中k=0~2m-1-1。
为提高FFT的运算速度,我们可以事先建立一个旋转因子数组,然后通过查表法来实现。
complex code WN[N]=//旋转因子数组
{ //为节省CPU计算时间,旋转因子采用查表处理
  //★根据实际FFT的点数N,该表数据需自行修改
  //以下结果通过Excel自动生成
  //  WN[k].real=cos(2*PI/N*k);
  //  WN[k].img=-sin(2*PI/N*k);
  {1.00000,0.00000},{0.99518,-0.09802},{0.98079,-0.19509},{0.95694,-0.29028},
  {0.92388,-0.38268},{0.88192,-0.47140},{0.83147,-0.55557},{0.77301,-0.63439},
  {0.70711,-0.70711},{0.63439,-0.77301},{0.55557,-0.83147},{0.47140,-0.88192},
  {0.38268,-0.92388},{0.29028,-0.95694},{0.19509,-0.98079},{0.09802,-0.99518},
  {0.00000,-1.00000},{-0.09802,-0.99518},{-0.19509,-0.98079},{-0.29028,-0.95694},
  {-0.38268,-0.92388},{-0.47140,-0.88192},{-0.55557,-0.83147},{-0.63439,-0.77301},
  {-0.70711,-0.70711},{-0.77301,-0.63439},{-0.83147,-0.55557},{-0.88192,-0.47140},
  {-0.92388,-0.38268},{-0.95694,-0.29028},{-0.98079,-0.19509},{-0.99518,-0.09802},
  {-1.00000,0.00000},{-0.99518,0.09802},{-0.98079,0.19509},{-0.95694,0.29028},
  {-0.92388,0.38268},{-0.88192,0.47140},{-0.83147,0.55557},{-0.77301,0.63439},
  {-0.70711,0.70711},{-0.63439,0.77301},{-0.55557,0.83147},{-0.47140,0.88192},
  {-0.38268,0.92388},{-0.29028,0.95694},{-0.19509,0.98079},{-0.09802,0.99518},
  {0.00000,1.00000},{0.09802,0.99518},{0.19509,0.98079},{0.29028,0.95694},
  {0.38268,0.92388},{0.47140,0.88192},{0.55557,0.83147},{0.63439,0.77301},
  {0.70711,0.70711},{0.77301,0.63439},{0.83147,0.55557},{0.88192,0.47140},
  {0.92388,0.38268},{0.95694,0.29028},{0.98079,0.19509},{0.99518,0.09802}   
};
3、算法实现
//我们已经知道,N点FFT从左到右共有log2N级蝶形,每级有N/2L组,每组有L个。
//所以FFT的C语言编程只需用3层循环即可实现:最外层循环完成每一级的蝶形运算(整个FFT共log2N级),
//中间层循环完成每一组的蝶形运算(每一级有N/2L组),最内层循环完成单独1个蝶形运算(每一组有L个)。
  /***【快速傅里叶变换】***/
  void FFT(void)
  {
   unsigned int i,j,k,l;
   complex top,bottom,xW;
   Reverse(); //码位倒序
   for(i=0;i<log2N;i++)   /*共log2N级*/
   {    //一级蝶形运算
    l=1<<i;//l等于2的i次方
    for(j=0;j<N;j+=2*l)  /*每L个蝶形是一组,每级有N/2L组*/
    {   //一组蝶形运算
     for(k=0;k<l;k++)   /*每组有L个*/
     {  //一个蝶形运算
       xW=mul(x[j+k+l],WN[N/(2*l)*k]); //碟间距为l
       top=add(x[j+k],xW); //每组的第k个蝶形
       bottom=sub(x[j+k],xW);
       x[j+k]=top;
       x[j+k+l]=bottom;
     }
    }
   }
  }

使用特权

评论回复
沙发
sfd123| | 2023-12-31 09:47 | 只看该作者
一直没搞懂FFT,这个似乎写的不那么深奥,学习一下,谢谢分享!

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

401

主题

8826

帖子

11

粉丝