CoCalc -- mdct.c

GitHub Repository: godotengine/godot
Path: blob/master/thirdparty/libvorbis/mdct.c
²¹⁶⁸⁹ views
1
/********************************************************************
2
 *                                                                  *
3
 * THIS FILE IS PART OF THE OggVorbis SOFTWARE CODEC SOURCE CODE.   *
4
 * USE, DISTRIBUTION AND REPRODUCTION OF THIS LIBRARY SOURCE IS     *
5
 * GOVERNED BY A BSD-STYLE SOURCE LICENSE INCLUDED WITH THIS SOURCE *
6
 * IN 'COPYING'. PLEASE READ THESE TERMS BEFORE DISTRIBUTING.       *
7
 *                                                                  *
8
 * THE OggVorbis SOURCE CODE IS (C) COPYRIGHT 1994-2009             *
9
 * by the Xiph.Org Foundation https://xiph.org/                     *
10
 *                                                                  *
11
 ********************************************************************
12

13
 function: normalized modified discrete cosine transform
14
           power of two length transform only [64 <= n ]
15

16
 Original algorithm adapted long ago from _The use of multirate filter
17
 banks for coding of high quality digital audio_, by T. Sporer,
18
 K. Brandenburg and B. Edler, collection of the European Signal
19
 Processing Conference (EUSIPCO), Amsterdam, June 1992, Vol.1, pp
20
 211-214
21

22
 The below code implements an algorithm that no longer looks much like
23
 that presented in the paper, but the basic structure remains if you
24
 dig deep enough to see it.
25

26
 This module DOES NOT INCLUDE code to generate/apply the window
27
 function.  Everybody has their own weird favorite including me... I
28
 happen to like the properties of y=sin(.5PI*sin^2(x)), but others may
29
 vehemently disagree.
30

31
 ********************************************************************/
32

33
/* this can also be run as an integer transform by uncommenting a
34
   define in mdct.h; the integerization is a first pass and although
35
   it's likely stable for Vorbis, the dynamic range is constrained and
36
   roundoff isn't done (so it's noisy).  Consider it functional, but
37
   only a starting point.  There's no point on a machine with an FPU */
38

39
#include <stdio.h>
40
#include <stdlib.h>
41
#include <string.h>
42
#include <math.h>
43
#include "vorbis/codec.h"
44
#include "mdct.h"
45
#include "os.h"
46
#include "misc.h"
47

48
/* build lookups for trig functions; also pre-figure scaling and
49
   some window function algebra. */
50

51
void mdct_init(mdct_lookup *lookup,int n){
52
  int   *bitrev=_ogg_malloc(sizeof(*bitrev)*(n/4));
53
  DATA_TYPE *T=_ogg_malloc(sizeof(*T)*(n+n/4));
54

55
  int i;
56
  int n2=n>>1;
57
  int log2n=lookup->log2n=rint(log((float)n)/log(2.f));
58
  lookup->n=n;
59
  lookup->trig=T;
60
  lookup->bitrev=bitrev;
61

62
/* trig lookups... */
63

64
  for(i=0;i<n/4;i++){
65
    T[i*2]=FLOAT_CONV(cos((M_PI/n)*(4*i)));
66
    T[i*2+1]=FLOAT_CONV(-sin((M_PI/n)*(4*i)));
67
    T[n2+i*2]=FLOAT_CONV(cos((M_PI/(2*n))*(2*i+1)));
68
    T[n2+i*2+1]=FLOAT_CONV(sin((M_PI/(2*n))*(2*i+1)));
69
  }
70
  for(i=0;i<n/8;i++){
71
    T[n+i*2]=FLOAT_CONV(cos((M_PI/n)*(4*i+2))*.5);
72
    T[n+i*2+1]=FLOAT_CONV(-sin((M_PI/n)*(4*i+2))*.5);
73
  }
74

75
  /* bitreverse lookup... */
76

77
  {
78
    int mask=(1<<(log2n-1))-1,i,j;
79
    int msb=1<<(log2n-2);
80
    for(i=0;i<n/8;i++){
81
      int acc=0;
82
      for(j=0;msb>>j;j++)
83
        if((msb>>j)&i)acc|=1<<j;
84
      bitrev[i*2]=((~acc)&mask)-1;
85
      bitrev[i*2+1]=acc;
86

87
    }
88
  }
89
  lookup->scale=FLOAT_CONV(4.f/n);
90
}
91

92
/* 8 point butterfly (in place, 4 register) */
93
STIN void mdct_butterfly_8(DATA_TYPE *x){
94
  REG_TYPE r0   = x[6] + x[2];
95
  REG_TYPE r1   = x[6] - x[2];
96
  REG_TYPE r2   = x[4] + x[0];
97
  REG_TYPE r3   = x[4] - x[0];
98

99
           x[6] = r0   + r2;
100
           x[4] = r0   - r2;
101

102
           r0   = x[5] - x[1];
103
           r2   = x[7] - x[3];
104
           x[0] = r1   + r0;
105
           x[2] = r1   - r0;
106

107
           r0   = x[5] + x[1];
108
           r1   = x[7] + x[3];
109
           x[3] = r2   + r3;
110
           x[1] = r2   - r3;
111
           x[7] = r1   + r0;
112
           x[5] = r1   - r0;
113

114
}
115

116
/* 16 point butterfly (in place, 4 register) */
117
STIN void mdct_butterfly_16(DATA_TYPE *x){
118
  REG_TYPE r0     = x[1]  - x[9];
119
  REG_TYPE r1     = x[0]  - x[8];
120

121
           x[8]  += x[0];
122
           x[9]  += x[1];
123
           x[0]   = MULT_NORM((r0   + r1) * cPI2_8);
124
           x[1]   = MULT_NORM((r0   - r1) * cPI2_8);
125

126
           r0     = x[3]  - x[11];
127
           r1     = x[10] - x[2];
128
           x[10] += x[2];
129
           x[11] += x[3];
130
           x[2]   = r0;
131
           x[3]   = r1;
132

133
           r0     = x[12] - x[4];
134
           r1     = x[13] - x[5];
135
           x[12] += x[4];
136
           x[13] += x[5];
137
           x[4]   = MULT_NORM((r0   - r1) * cPI2_8);
138
           x[5]   = MULT_NORM((r0   + r1) * cPI2_8);
139

140
           r0     = x[14] - x[6];
141
           r1     = x[15] - x[7];
142
           x[14] += x[6];
143
           x[15] += x[7];
144
           x[6]  = r0;
145
           x[7]  = r1;
146

147
           mdct_butterfly_8(x);
148
           mdct_butterfly_8(x+8);
149
}
150

151
/* 32 point butterfly (in place, 4 register) */
152
STIN void mdct_butterfly_32(DATA_TYPE *x){
153
  REG_TYPE r0     = x[30] - x[14];
154
  REG_TYPE r1     = x[31] - x[15];
155

156
           x[30] +=         x[14];
157
           x[31] +=         x[15];
158
           x[14]  =         r0;
159
           x[15]  =         r1;
160

161
           r0     = x[28] - x[12];
162
           r1     = x[29] - x[13];
163
           x[28] +=         x[12];
164
           x[29] +=         x[13];
165
           x[12]  = MULT_NORM( r0 * cPI1_8  -  r1 * cPI3_8 );
166
           x[13]  = MULT_NORM( r0 * cPI3_8  +  r1 * cPI1_8 );
167

168
           r0     = x[26] - x[10];
169
           r1     = x[27] - x[11];
170
           x[26] +=         x[10];
171
           x[27] +=         x[11];
172
           x[10]  = MULT_NORM(( r0  - r1 ) * cPI2_8);
173
           x[11]  = MULT_NORM(( r0  + r1 ) * cPI2_8);
174

175
           r0     = x[24] - x[8];
176
           r1     = x[25] - x[9];
177
           x[24] += x[8];
178
           x[25] += x[9];
179
           x[8]   = MULT_NORM( r0 * cPI3_8  -  r1 * cPI1_8 );
180
           x[9]   = MULT_NORM( r1 * cPI3_8  +  r0 * cPI1_8 );
181

182
           r0     = x[22] - x[6];
183
           r1     = x[7]  - x[23];
184
           x[22] += x[6];
185
           x[23] += x[7];
186
           x[6]   = r1;
187
           x[7]   = r0;
188

189
           r0     = x[4]  - x[20];
190
           r1     = x[5]  - x[21];
191
           x[20] += x[4];
192
           x[21] += x[5];
193
           x[4]   = MULT_NORM( r1 * cPI1_8  +  r0 * cPI3_8 );
194
           x[5]   = MULT_NORM( r1 * cPI3_8  -  r0 * cPI1_8 );
195

196
           r0     = x[2]  - x[18];
197
           r1     = x[3]  - x[19];
198
           x[18] += x[2];
199
           x[19] += x[3];
200
           x[2]   = MULT_NORM(( r1  + r0 ) * cPI2_8);
201
           x[3]   = MULT_NORM(( r1  - r0 ) * cPI2_8);
202

203
           r0     = x[0]  - x[16];
204
           r1     = x[1]  - x[17];
205
           x[16] += x[0];
206
           x[17] += x[1];
207
           x[0]   = MULT_NORM( r1 * cPI3_8  +  r0 * cPI1_8 );
208
           x[1]   = MULT_NORM( r1 * cPI1_8  -  r0 * cPI3_8 );
209

210
           mdct_butterfly_16(x);
211
           mdct_butterfly_16(x+16);
212

213
}
214

215
/* N point first stage butterfly (in place, 2 register) */
216
STIN void mdct_butterfly_first(DATA_TYPE *T,
217
                                        DATA_TYPE *x,
218
                                        int points){
219

220
  DATA_TYPE *x1        = x          + points      - 8;
221
  DATA_TYPE *x2        = x          + (points>>1) - 8;
222
  REG_TYPE   r0;
223
  REG_TYPE   r1;
224

225
  do{
226

227
               r0      = x1[6]      -  x2[6];
228
               r1      = x1[7]      -  x2[7];
229
               x1[6]  += x2[6];
230
               x1[7]  += x2[7];
231
               x2[6]   = MULT_NORM(r1 * T[1]  +  r0 * T[0]);
232
               x2[7]   = MULT_NORM(r1 * T[0]  -  r0 * T[1]);
233

234
               r0      = x1[4]      -  x2[4];
235
               r1      = x1[5]      -  x2[5];
236
               x1[4]  += x2[4];
237
               x1[5]  += x2[5];
238
               x2[4]   = MULT_NORM(r1 * T[5]  +  r0 * T[4]);
239
               x2[5]   = MULT_NORM(r1 * T[4]  -  r0 * T[5]);
240

241
               r0      = x1[2]      -  x2[2];
242
               r1      = x1[3]      -  x2[3];
243
               x1[2]  += x2[2];
244
               x1[3]  += x2[3];
245
               x2[2]   = MULT_NORM(r1 * T[9]  +  r0 * T[8]);
246
               x2[3]   = MULT_NORM(r1 * T[8]  -  r0 * T[9]);
247

248
               r0      = x1[0]      -  x2[0];
249
               r1      = x1[1]      -  x2[1];
250
               x1[0]  += x2[0];
251
               x1[1]  += x2[1];
252
               x2[0]   = MULT_NORM(r1 * T[13] +  r0 * T[12]);
253
               x2[1]   = MULT_NORM(r1 * T[12] -  r0 * T[13]);
254

255
    x1-=8;
256
    x2-=8;
257
    T+=16;
258

259
  }while(x2>=x);
260
}
261

262
/* N/stage point generic N stage butterfly (in place, 2 register) */
263
STIN void mdct_butterfly_generic(DATA_TYPE *T,
264
                                          DATA_TYPE *x,
265
                                          int points,
266
                                          int trigint){
267

268
  DATA_TYPE *x1        = x          + points      - 8;
269
  DATA_TYPE *x2        = x          + (points>>1) - 8;
270
  REG_TYPE   r0;
271
  REG_TYPE   r1;
272

273
  do{
274

275
               r0      = x1[6]      -  x2[6];
276
               r1      = x1[7]      -  x2[7];
277
               x1[6]  += x2[6];
278
               x1[7]  += x2[7];
279
               x2[6]   = MULT_NORM(r1 * T[1]  +  r0 * T[0]);
280
               x2[7]   = MULT_NORM(r1 * T[0]  -  r0 * T[1]);
281

282
               T+=trigint;
283

284
               r0      = x1[4]      -  x2[4];
285
               r1      = x1[5]      -  x2[5];
286
               x1[4]  += x2[4];
287
               x1[5]  += x2[5];
288
               x2[4]   = MULT_NORM(r1 * T[1]  +  r0 * T[0]);
289
               x2[5]   = MULT_NORM(r1 * T[0]  -  r0 * T[1]);
290

291
               T+=trigint;
292

293
               r0      = x1[2]      -  x2[2];
294
               r1      = x1[3]      -  x2[3];
295
               x1[2]  += x2[2];
296
               x1[3]  += x2[3];
297
               x2[2]   = MULT_NORM(r1 * T[1]  +  r0 * T[0]);
298
               x2[3]   = MULT_NORM(r1 * T[0]  -  r0 * T[1]);
299

300
               T+=trigint;
301

302
               r0      = x1[0]      -  x2[0];
303
               r1      = x1[1]      -  x2[1];
304
               x1[0]  += x2[0];
305
               x1[1]  += x2[1];
306
               x2[0]   = MULT_NORM(r1 * T[1]  +  r0 * T[0]);
307
               x2[1]   = MULT_NORM(r1 * T[0]  -  r0 * T[1]);
308

309
               T+=trigint;
310
    x1-=8;
311
    x2-=8;
312

313
  }while(x2>=x);
314
}
315

316
STIN void mdct_butterflies(mdct_lookup *init,
317
                             DATA_TYPE *x,
318
                             int points){
319

320
  DATA_TYPE *T=init->trig;
321
  int stages=init->log2n-5;
322
  int i,j;
323

324
  if(--stages>0){
325
    mdct_butterfly_first(T,x,points);
326
  }
327

328
  for(i=1;--stages>0;i++){
329
    for(j=0;j<(1<<i);j++)
330
      mdct_butterfly_generic(T,x+(points>>i)*j,points>>i,4<<i);
331
  }
332

333
  for(j=0;j<points;j+=32)
334
    mdct_butterfly_32(x+j);
335

336
}
337

338
void mdct_clear(mdct_lookup *l){
339
  if(l){
340
    if(l->trig)_ogg_free(l->trig);
341
    if(l->bitrev)_ogg_free(l->bitrev);
342
    memset(l,0,sizeof(*l));
343
  }
344
}
345

346
STIN void mdct_bitreverse(mdct_lookup *init,
347
                            DATA_TYPE *x){
348
  int        n       = init->n;
349
  int       *bit     = init->bitrev;
350
  DATA_TYPE *w0      = x;
351
  DATA_TYPE *w1      = x = w0+(n>>1);
352
  DATA_TYPE *T       = init->trig+n;
353

354
  do{
355
    DATA_TYPE *x0    = x+bit[0];
356
    DATA_TYPE *x1    = x+bit[1];
357

358
    REG_TYPE  r0     = x0[1]  - x1[1];
359
    REG_TYPE  r1     = x0[0]  + x1[0];
360
    REG_TYPE  r2     = MULT_NORM(r1     * T[0]   + r0 * T[1]);
361
    REG_TYPE  r3     = MULT_NORM(r1     * T[1]   - r0 * T[0]);
362

363
              w1    -= 4;
364

365
              r0     = HALVE(x0[1] + x1[1]);
366
              r1     = HALVE(x0[0] - x1[0]);
367

368
              w0[0]  = r0     + r2;
369
              w1[2]  = r0     - r2;
370
              w0[1]  = r1     + r3;
371
              w1[3]  = r3     - r1;
372

373
              x0     = x+bit[2];
374
              x1     = x+bit[3];
375

376
              r0     = x0[1]  - x1[1];
377
              r1     = x0[0]  + x1[0];
378
              r2     = MULT_NORM(r1     * T[2]   + r0 * T[3]);
379
              r3     = MULT_NORM(r1     * T[3]   - r0 * T[2]);
380

381
              r0     = HALVE(x0[1] + x1[1]);
382
              r1     = HALVE(x0[0] - x1[0]);
383

384
              w0[2]  = r0     + r2;
385
              w1[0]  = r0     - r2;
386
              w0[3]  = r1     + r3;
387
              w1[1]  = r3     - r1;
388

389
              T     += 4;
390
              bit   += 4;
391
              w0    += 4;
392

393
  }while(w0<w1);
394
}
395

396
void mdct_backward(mdct_lookup *init, DATA_TYPE *in, DATA_TYPE *out){
397
  int n=init->n;
398
  int n2=n>>1;
399
  int n4=n>>2;
400

401
  /* rotate */
402

403
  DATA_TYPE *iX = in+n2-7;
404
  DATA_TYPE *oX = out+n2+n4;
405
  DATA_TYPE *T  = init->trig+n4;
406

407
  do{
408
    oX         -= 4;
409
    oX[0]       = MULT_NORM(-iX[2] * T[3] - iX[0]  * T[2]);
410
    oX[1]       = MULT_NORM (iX[0] * T[3] - iX[2]  * T[2]);
411
    oX[2]       = MULT_NORM(-iX[6] * T[1] - iX[4]  * T[0]);
412
    oX[3]       = MULT_NORM (iX[4] * T[1] - iX[6]  * T[0]);
413
    iX         -= 8;
414
    T          += 4;
415
  }while(iX>=in);
416

417
  iX            = in+n2-8;
418
  oX            = out+n2+n4;
419
  T             = init->trig+n4;
420

421
  do{
422
    T          -= 4;
423
    oX[0]       =  MULT_NORM (iX[4] * T[3] + iX[6] * T[2]);
424
    oX[1]       =  MULT_NORM (iX[4] * T[2] - iX[6] * T[3]);
425
    oX[2]       =  MULT_NORM (iX[0] * T[1] + iX[2] * T[0]);
426
    oX[3]       =  MULT_NORM (iX[0] * T[0] - iX[2] * T[1]);
427
    iX         -= 8;
428
    oX         += 4;
429
  }while(iX>=in);
430

431
  mdct_butterflies(init,out+n2,n2);
432
  mdct_bitreverse(init,out);
433

434
  /* roatate + window */
435

436
  {
437
    DATA_TYPE *oX1=out+n2+n4;
438
    DATA_TYPE *oX2=out+n2+n4;
439
    DATA_TYPE *iX =out;
440
    T             =init->trig+n2;
441

442
    do{
443
      oX1-=4;
444

445
      oX1[3]  =  MULT_NORM (iX[0] * T[1] - iX[1] * T[0]);
446
      oX2[0]  = -MULT_NORM (iX[0] * T[0] + iX[1] * T[1]);
447

448
      oX1[2]  =  MULT_NORM (iX[2] * T[3] - iX[3] * T[2]);
449
      oX2[1]  = -MULT_NORM (iX[2] * T[2] + iX[3] * T[3]);
450

451
      oX1[1]  =  MULT_NORM (iX[4] * T[5] - iX[5] * T[4]);
452
      oX2[2]  = -MULT_NORM (iX[4] * T[4] + iX[5] * T[5]);
453

454
      oX1[0]  =  MULT_NORM (iX[6] * T[7] - iX[7] * T[6]);
455
      oX2[3]  = -MULT_NORM (iX[6] * T[6] + iX[7] * T[7]);
456

457
      oX2+=4;
458
      iX    +=   8;
459
      T     +=   8;
460
    }while(iX<oX1);
461

462
    iX=out+n2+n4;
463
    oX1=out+n4;
464
    oX2=oX1;
465

466
    do{
467
      oX1-=4;
468
      iX-=4;
469

470
      oX2[0] = -(oX1[3] = iX[3]);
471
      oX2[1] = -(oX1[2] = iX[2]);
472
      oX2[2] = -(oX1[1] = iX[1]);
473
      oX2[3] = -(oX1[0] = iX[0]);
474

475
      oX2+=4;
476
    }while(oX2<iX);
477

478
    iX=out+n2+n4;
479
    oX1=out+n2+n4;
480
    oX2=out+n2;
481
    do{
482
      oX1-=4;
483
      oX1[0]= iX[3];
484
      oX1[1]= iX[2];
485
      oX1[2]= iX[1];
486
      oX1[3]= iX[0];
487
      iX+=4;
488
    }while(oX1>oX2);
489
  }
490
}
491

492
void mdct_forward(mdct_lookup *init, DATA_TYPE *in, DATA_TYPE *out){
493
  int n=init->n;
494
  int n2=n>>1;
495
  int n4=n>>2;
496
  int n8=n>>3;
497
  DATA_TYPE *w=alloca(n*sizeof(*w)); /* forward needs working space */
498
  DATA_TYPE *w2=w+n2;
499

500
  /* rotate */
501

502
  /* window + rotate + step 1 */
503

504
  REG_TYPE r0;
505
  REG_TYPE r1;
506
  DATA_TYPE *x0=in+n2+n4;
507
  DATA_TYPE *x1=x0+1;
508
  DATA_TYPE *T=init->trig+n2;
509

510
  int i=0;
511

512
  for(i=0;i<n8;i+=2){
513
    x0 -=4;
514
    T-=2;
515
    r0= x0[2] + x1[0];
516
    r1= x0[0] + x1[2];
517
    w2[i]=   MULT_NORM(r1*T[1] + r0*T[0]);
518
    w2[i+1]= MULT_NORM(r1*T[0] - r0*T[1]);
519
    x1 +=4;
520
  }
521

522
  x1=in+1;
523

524
  for(;i<n2-n8;i+=2){
525
    T-=2;
526
    x0 -=4;
527
    r0= x0[2] - x1[0];
528
    r1= x0[0] - x1[2];
529
    w2[i]=   MULT_NORM(r1*T[1] + r0*T[0]);
530
    w2[i+1]= MULT_NORM(r1*T[0] - r0*T[1]);
531
    x1 +=4;
532
  }
533

534
  x0=in+n;
535

536
  for(;i<n2;i+=2){
537
    T-=2;
538
    x0 -=4;
539
    r0= -x0[2] - x1[0];
540
    r1= -x0[0] - x1[2];
541
    w2[i]=   MULT_NORM(r1*T[1] + r0*T[0]);
542
    w2[i+1]= MULT_NORM(r1*T[0] - r0*T[1]);
543
    x1 +=4;
544
  }
545

546

547
  mdct_butterflies(init,w+n2,n2);
548
  mdct_bitreverse(init,w);
549

550
  /* roatate + window */
551

552
  T=init->trig+n2;
553
  x0=out+n2;
554

555
  for(i=0;i<n4;i++){
556
    x0--;
557
    out[i] =MULT_NORM((w[0]*T[0]+w[1]*T[1])*init->scale);
558
    x0[0]  =MULT_NORM((w[0]*T[1]-w[1]*T[0])*init->scale);
559
    w+=2;
560
    T+=2;
561
  }
562
}
563

564
Product

Resources

Company