1.DMA产生的背景
在许多需要使用DSP 的场合,一般都需要大量的数据搬移工作,而如果每次数据搬移都由DSP 内核来参与完成,将大大占用DSP 内核的处理时间,从而严重影响其信号处理能力。因此,Blackfin DSP 集成了直接访问(DMA)控制器来完成数据搬移这种简单却耗时的工作。它可以直接进行数据搬移而不需要内核的参与。
说说我对DMA的理解:其实我觉得DMA不算难,反而十分便利,将它想象成城市供水局,为了给城市中不同的小区供水,最原始的办法就是挨家挨户的去送,这就耗费了大量的供水局(DSP内核)的人力物力,而当我们建成了自来水管道(DMA通道),一端连接到自来水厂(数据源),一端连接到需要供水的小区(目的地),当需要供水时阀门一开(DMA_ENABLE),自来水(数据)就源源不断的在管道中流动,再也不需要其它人员的参与了,是不是很方便???下面就看看DSP中的这条管道是如何建立的。
2.BF533的DMA总线结构图如下:
从图中可以看出,DMA可以在各种存储器与外设之间直接进行数据传输。
3. DMA的种类
DMA分为基于寄存器的DMA和基于描述符的DMA:
1)基于寄存器的DMA
允许用户直接对DMA寄存器进行编程,当DMA完成时,由配置寄存器中特定的位来决定接下来的动作:是重装初始值,还是自动停止。
2)基于描述符的DMA
这种DMA要求我们先将所要设置的寄存器值存储在内存单元中,这组参数就叫做描述符,然后配置Current Descriptor Pointer寄存器和NEXT_DESC_PTR寄存器指向这组描述符,当DMA开始时,内核会自动控制将这组描述符按顺序载入到DMA控制寄存器中,从而完成对DMA的初始化。
当然,描述符的排列顺序是有要求的,根据不同的排列顺序就衍生出了以下几种描述符的排列方式:Array mode,small mode和Large model,直接从图就可以看出他们的区别,就不再用语言描述了。
在本音频处理模板中,采用的是直接配置寄存器的方法。
4.如何配置寄存器
对于不同的传输模式,需要配置的寄存器也不同。每种模式至少需要配置以下寄存器:
以下例程将DMA与SPORT相连,接收SPORT传递来的数据,同时也通过SPORT将数据发送出去:
//--------------------------------------------------------------------------//
// Function: Init_DMA //
// //
// Description: Initialize DMA1 in autobuffer mode to receive and DMA2 in //
// autobuffer mode to transmit //
//--------------------------------------------------------------------------//
void Init_DMA(void)
{
// Set up DMA1 to receive
// Map DMA1 to Sport0 RX
*pDMA1_PERIPHERAL_MAP = 0x1000;
// Configure DMA1
// 32-bit transfers, Interrupt on completion, Autobuffer mode
*pDMA1_CONFIG = WNR | WDSIZE_32 | DI_EN | 0x1000;
// Start address of data buffer
*pDMA1_START_ADDR = (void *)iRxBuffer1;
// DMA inner loop count
*pDMA1_X_COUNT = 4;
// Inner loop address increment
*pDMA1_X_MODIFY = 4;
// Set up DMA2 to transmit
// Map DMA2 to Sport0 TX
*pDMA2_PERIPHERAL_MAP = 0x2000;
// Configure DMA2
// 32-bit transfers, Autobuffer mode
*pDMA2_CONFIG = WDSIZE_32 | 0x1000;
// Start address of data buffer
*pDMA2_START_ADDR = (void *)iTxBuffer1;
// DMA inner loop count
*pDMA2_X_COUNT = 4;
// Inner loop address increment
*pDMA2_X_MODIFY = 4;
}
这里最需要说明的就是COUNT和MODIFY的值。COUNT指定了每次要读取/发送的element的数量,这个element就是CONFIG寄存器中的WDSIZE_32,也就是说,当COUNT=4时,我们共要传输的数据为4个32位字。因此需要的缓冲的大小为4×32 = 4×sizeof(int),由此可以推断程序中iTxBuffer1的定义为:
int iTxBuffer1[4];
而MODIFY的值指出,当每次COUNT值减1时,也就是每次传输完一个elements时,指针移动的字节数,注意,是字节数!此时MODIFY的值至少为4,否则就会发生覆盖现象。示意图如下:
当传输完毕后,由于设置的是Autobuffer 模式,当这4个elements传输结束后,参数寄存器会自动重载当前寄存器的值,0延时的重新开始下一次传输。因此DMA的开启和停止都需要手动来完成:
//--------------------------------------------------------------------------//
// Function: Enable_DMA_Sport //
// //
// Description: Enable DMA1, DMA2, Sport0 TX and Sport0 RX //
//--------------------------------------------------------------------------//
void Enable_DMA_Sport0(void)
{
// enable DMAs
*pDMA2_CONFIG = (*pDMA2_CONFIG | DMAEN);
*pDMA1_CONFIG = (*pDMA1_CONFIG | DMAEN);
// enable Sport0 TX and RX
*pSPORT0_TCR1 = (*pSPORT0_TCR1 | TSPEN);
*pSPORT0_RCR1 = (*pSPORT0_RCR1 | RSPEN);
}
以上就是DMA的设置过程,下面趁热打铁,利用上述设置,介绍音频处理模板。
<<<<<<<<<<<<<<<<<<<<<<<<< 分隔符 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
本模板使用ezkit-533,通过SPI接口将AD1836配置为I2S模式,然后利用SPORT0口接收数据的采样值,并通过DMA传输给DSP,DSP处理后,再通过SPORT0口传回DAC,输出波形。配置的过程如下:
1)EBIU初始化,见Blackfin DSP(三):BF533 的EBIU接口之flash和Blackfin DSP(四):BF533 EBIU之SDRAM;
2)SPI初始化,见Blackfin DSP(五):BF533的SPI接口
3)SPORT0初始化,见Blackfin DSP(六):BF533的SPORT接口
4)DMA setup;
5)配置系统中断;
void main(void)
{
Set_PLL(10,2); //初始化PLL
Init_EBIU(); //初始化EBIU,与flash接口
Init_SDRAM(); //初始化SDRAM
ezConfigureFlashA(); //配置板载flash的IO口方向,主要为了引脚复位AD1836
Init1836();
Init_Sport0();
Init_DMA();
Init_Interrupts();
Enable_DMA_Sport0();
while(1);
}
对于AD1836的配置如下:
// names for codec registers, used for sCodec1836TxRegs[]
#define DAC_CONTROL_1 0x0000
#define DAC_CONTROL_2 0x1000
#define DAC_VOLUME_0 0x2000
#define DAC_VOLUME_1 0x3000
#define DAC_VOLUME_2 0x4000
#define DAC_VOLUME_3 0x5000
#define DAC_VOLUME_4 0x6000
#define DAC_VOLUME_5 0x7000
#define ADC_0_PEAK_LEVEL 0x8000
#define ADC_1_PEAK_LEVEL 0x9000
#define ADC_2_PEAK_LEVEL 0xA000
#define ADC_3_PEAK_LEVEL 0xB000
#define ADC_CONTROL_1 0xC000
#define ADC_CONTROL_2 0xD000
#define ADC_CONTROL_3 0xE000
// names for slots in ad1836 audio frame
#define INTERNAL_ADC_L0 0
#define INTERNAL_ADC_R0 2
#define INTERNAL_DAC_L0 0
#define INTERNAL_DAC_R0 2
#define INTERNAL_ADC_L1 1
#define INTERNAL_ADC_R1 3
#define INTERNAL_DAC_L1 1
#define INTERNAL_DAC_R1 3
volatile short sCodec1836TxRegs[CODEC_1836_REGS_LENGTH] =
{
DAC_CONTROL_1 | 0x000,
DAC_CONTROL_2 | 0x000,
DAC_VOLUME_0 | 0x3ff,
DAC_VOLUME_1 | 0x3ff,
DAC_VOLUME_2 | 0x3ff,
DAC_VOLUME_3 | 0x3ff,
DAC_VOLUME_4 | 0x000,
DAC_VOLUME_5 | 0x000,
ADC_CONTROL_1 | 0x000,
ADC_CONTROL_2 | 0x000,
ADC_CONTROL_3 | 0x000
};
void Init1836(void)
{
int i;
int j;
static unsigned char ucActive_LED = 0x01;
// write to Port A to reset AD1836
*pFlashA_PortA_Out = 0x00;
// write to Port A to enable AD1836
*pFlashA_PortA_Out = ucActive_LED;
// wait to recover from reset
for (i=0; i<0xf0000; i++) asm("nop;");
// Enable PF4
*pSPI_FLG = FLS4;
// Set baud rate SCK = HCLK/(2*SPIBAUD) SCK = 2MHz
*pSPI_BAUD = 16;
// configure spi port
// SPI DMA write, 16-bit data, MSB first, SPI Master
*pSPI_CTL = 0x0003 | SIZE | MSTR;
// Set up DMA5 to transmit
// Map DMA5 to SPI
*pDMA5_PERIPHERAL_MAP = 0x5000;
// Configure DMA5
// 16-bit transfers
*pDMA5_CONFIG = WDSIZE_16;
// Start address of data buffer
*pDMA5_START_ADDR = (void *)sCodec1836TxRegs;
// DMA inner loop count
*pDMA5_X_COUNT = CODEC_1836_REGS_LENGTH;
// Inner loop address increment
*pDMA5_X_MODIFY = 2;
// enable DMAs
*pDMA5_CONFIG = (*pDMA5_CONFIG | DMAEN);
// enable spi
*pSPI_CTL = (*pSPI_CTL | SPE);
// wait until dma transfers for spi are finished
for (j=0; j<0xaff0; j++) asm("nop;");
// disable spi
*pSPI_CTL = 0x0000;
}
SPORT0的初始化:
//--------------------------------------------------------------------------//
// Function: Init_Sport0 //
// //
// Description: Configure Sport0 for I2S mode, to transmit/receive data //
// to/from the AD1836. Configure Sport for external clocks and //
// frame syncs. //
//--------------------------------------------------------------------------//
void Init_Sport0(void)
{
// Sport0 receive configuration
// External CLK, External Frame sync, MSB first, Active Low
// 24-bit data, Stereo frame sync enable
*pSPORT0_RCR1 = RFSR | RCKFE;
*pSPORT0_RCR2 = 0x0017 | RXSE | RSFSE;
// Sport0 transmit configuration
// External CLK, External Frame sync, MSB first, Active Low
// 24-bit data, Secondary side enable, Stereo frame sync enable
*pSPORT0_TCR1 = TFSR | TCKFE;
*pSPORT0_TCR2 = 0x0017 | TXSE | TSFSE;
}
每一次DMA传输完毕后,都会进入中断函数,调用Process_data()进行数据处理,系统中断配置:
//--------------------------------------------------------------------------//
// Function: Init_Interrupts //
// //
// Description: Initialize Interrupt for Sport0 RX //
//--------------------------------------------------------------------------//
void Init_Interrupts(void)
{
// Set Sport0 RX (DMA1) interrupt priority to 2 = IVG9
*pSIC_IAR0 = 0xffffffff;
*pSIC_IAR1 = 0xffffff2f;
*pSIC_IAR2 = 0xffffffff;
// assign ISRs to interrupt vectors
// Sport0 RX ISR -> IVG 9
register_handler(ik_ivg9, Sport0_RX_ISR);
// enable Sport0 RX interrupt
*pSIC_IMASK = 0x00000200;
}
//--------------------------------------------------------------------------//
// Function: Sport0_RX_ISR //
// //
// Description: This ISR is executed after a complete frame of input data //
// has been received. The new samples are stored in //
// iChannel0LeftIn, iChannel0RightIn, iChannel1LeftIn and //
// iChannel1RightIn respectively. Then the function //
// Process_Data() is called in which user code can be executed.//
// After that the processed values are copied from the //
// variables iChannel0LeftOut, iChannel0RightOut, //
// iChannel1LeftOut and iChannel1RightOut into the dma //
// transmit buffer. //
//--------------------------------------------------------------------------//
EX_INTERRUPT_HANDLER(Sport0_RX_ISR)
{
// confirm interrupt handling
*pDMA1_IRQ_STATUS = 0x0001;
// copy input data from dma input buffer into variables
iChannel0LeftIn = iRxBuffer1[INTERNAL_ADC_L0];
iChannel0RightIn = iRxBuffer1[INTERNAL_ADC_R0];
iChannel1LeftIn = iRxBuffer1[INTERNAL_ADC_L1];
iChannel1RightIn = iRxBuffer1[INTERNAL_ADC_R1];
// call function that contains user code
Process_Data();
// copy processed data from variables into dma output buffer
iTxBuffer1[INTERNAL_DAC_L0] = iChannel0LeftOut;
iTxBuffer1[INTERNAL_DAC_R0] = iChannel0RightOut;
iTxBuffer1[INTERNAL_DAC_L1] = iChannel1LeftOut;
iTxBuffer1[INTERNAL_DAC_R1] = iChannel1RightOut;
}
这里的Process_Data()可以按照自己的需求添加信号处理函数,下面代码只是将连续的256个int32_t类型的音频采样点数据保存到数组中,输入和输出都只取了一个通道,即通道0的右声道。
int32_t audio_data[256];
uint16_t cnt=0;
void Process_Data(void)
{
cnt %= 256;
if(cnt<256)
{
audio_data[cnt] = (iChannel0RightIn<<8);
cnt ++ ;
}
//iChannel0LeftOut = iChannel0LeftIn;
iChannel0RightOut = iChannel0RightIn; //原样输出
//iChannel1LeftOut = iChannel1LeftIn;
//iChannel1RightOut = iChannel1RightIn;
}
注意这里的 (iChannel0RightIn<<8); 这是因为AD1836的数据是24位的,符号位在第24位上,而我们的数组是int32的,所以需要左移8位将符号位放置到最高位上。
用IDE的plot功能将audio_data[256]显示出来,结果如下:
如果继续相对数据进行其他处理比如FFT,做一个“if(cnt==256) FFT_func(audio_data[256]);” 运算即可;
FFT变换结果:
来源:oschina
链接:https://my.oschina.net/u/4340796/blog/4336641