CONTENTS

Annex 1� MPEG audio layer II (ISO/IEC 13818‑3): a generic coding standard for two‑channel and multi‑channel sound for digital video broadcasting, digital audio broadcasting and computer multimedia
�1���� Introduction
�2���� Principles of the MPEG Layer II audio coding technique
������� 2.1���� Psychoacoustic model
������� 2.2���� Filter bank
������� 2.3���� Determination and coding of scale factors
������� 2.4���� Bit allocation and encoding of bit allocation information
������� 2.5���� Quantization and encoding of sub‑band samples
������� 2.6���� Layer II bit stream structure
������ �2.7���� Layer II decoding
�3���� MPEG‑2 Audio: generic multi-channel audio coding
������� 3.1���� Characteristics of the MPEG‑2 multi‑channel audio coding system
����������������� 3.1.1���� 3/2-stereo presentation performance
����������������� 3.1.2���� Backward/forward compatibility with ISO/IEC 11172‑3
����������������� 3.1.3���� Downward compatibility
����������������� 3.1.4���� Multilingual extension and associated services
����������������� 3.1.5���� Low frequency effects channel
������� 3.2���� Composite coding strategies for multi-channel audio
����������������� 3.2.1���� Dynamic crosstalk
����������������� 3.2.2���� Phantom coding of centre channel
����������������� 3.2.3���� Adaptive multi‑channel prediction
����������������� 3.2.4���� Common masked threshold
����������������� 3.2.5���� Common bit pool
����������������� 3.2.6���� Transmission channel switching
�4���� Concluding summary
Annex 2� Digital Audio Compression (AC‑3) Standard (ATSC Standard)
Foreword
�1���� Introduction
������� 1.1�� ��Motivation
������� 1.2���� Encoding
������� 1.3���� Decoding
�2���� Scope
�3���� References
������� 3.1���� Normative references
������� 3.2���� Informative references
�4���� Notation, definitions, and terminology
������� 4.1���� Compliance notation
��� ����4.2���� Definitions
������� 4.3���� Terminology abbreviations
�5���� Bit stream syntax
������� 5.1���� Synchronization frame
������� 5.2���� Semantics of syntax specification
������� 5.3���� Syntax specification
����������������� 5.3.1���� syncinfo � Synchronization information
����������������� 5.3.2���� bsi � Bit stream information
����������������� 5.3.3���� audblk � Audio block
����������������� 5.3.4���� auxdata � Auxiliary data
����������������� 5.3.5���� errorcheck � Error detection code
������� 5.4���� Description of bit stream elements
����������������� 5.4.1���� syncinfo � Synchronization information
����������������� 5.4.2���� bsi � Bit stream information
����������������� 5.4.3���� audblk � Audio block
4
4
3
(cplinu == 1) && (cplbegf == 0)
2
����������������� 5.4.4���� auxdata � Auxiliary data field
����������������� 5.4.5���� errorcheck � Frame error detection field
������� 5.5���� Bit stream constraints
�6���� Decoding the AC‑3 bit stream
������� 6.1���� Introduction
������� 6.2����Summary of the decoding process
����������������� 6.2.1���� Input bit stream
����������������� 6.2.2���� Synchronization and error detection
����������������� 6.2.3���� Unpack BSI, side information
����������������� 6.2.4���� Decode exponents
�������� ���������6.2.5���� Bit allocation
����������������� 6.2.6���� Process mantissas
����������������� 6.2.7���� Decoupling
����������������� 6.2.8���� Rematrixing
����������������� 6.2.9���� Dynamic range compression
����������������� 6.2.10���� Inverse transform
����������������� 6.2.11���� Window, overlap/add
����������������� 6.2.12���� Downmixing
����������������� 6.2.13���� PCM output buffer
����������������� 6.2.14���� Output PCM
�7���� Algorithmic details
������� 7.1���� Exponent coding
���������������� �7.1.1���� Overview
����������������� 7.1.2���� Exponent strategy
����������������� 7.1.3���� Exponent decoding
������� 7.2���� Bit allocation
����������������� 7.2.1���� Overview
����������������� 7.2.2���� Parametric bit allocation
����������������� 7.2.3���� Bit allocation tables
������� 7.3���� Quantization and decoding of mantissas
����������������� 7.3.1���� Overview
����������������� 7.3.2���� Expansion of mantissas for asymmetric quantization (6 bap 15)
����������������� 7.3.3���� Expansion of mantissas for symmetrical quantization (1 bap 5)
����������������� 7.3.4���� Dither for zero bit mantissas (bap = 0)
����������������� 7.3.5���� Ungrouping of mantissas
������� 7.4���� Channel coupling
����������������� 7.4.1���� Overview
����������������� 7.4.2���� Sub‑band structure for coupling
����������������� 7.4.3���� Coupling coordinate format
������� 7.5���� Rematrixing
����������������� 7.5.1���� Overview
����������������� 7.5.2���� Frequency band definitions
����������������� 7.5.3���� Encoding technique
����������������� 7.5.4���� Decoding technique
������� 7.6���� Dialogue normalization
����������������� 7.6.1���� Overview
������� 7.7���� Dynamic range compression
����������������� 7.7.1���� Dynamic range control; dynrng, dynrng2
����������������� 7.7.2���� Heavy compression; compr, compr2
������� 7.8���� Downmixing
����������������� 7.8.1���� General downmix procedure
����������������� 7.8.2���� Downmixing into two channels
������� 7.9���� Transform equations and block switching
����������������� 7.9.1���� Overview
����������������� 7.9.2���� Technique
����������������� 7.9.3���� Decoder implementation
����������������� 7.9.4���� Transformation equations
����������������� 7.9.5���� Channel gain range code
������ 7.10���� Error detection
����������������� 7.10.1���� CRC checking
����������������� 7.10.2���� Checking bit stream consistency
�8���� Encoding the AC‑3 bit stream
������� 8.1���� Introduction
������� 8.2���� Summary of the encoding process
����������������� 8.2.1���� Input PCM
����������������� 8.2.2���� Transient detection
����������������� 8.2.3���� Forward transform
����������������� 8.2.4���� Coupling strategy
����������������� 8.2.5���� Form coupling channel
����������������� 8.2.6���� Rematrixing
����������������� 8.2.7���� Extract exponents
����������������� 8.2.8���� Exponent strategy
����������������� 8.2.9���� Dither strategy
����������������� 8.2.10���� Encode exponents
����������������� 8.2.11���� Normalize mantissas
����������������� 8.2.12���� Core bit allocation
����������������� 8.2.13���� Quantize mantissas
����������������� 8.2.14���� Pack AC‑3 frame
Appendix 1 to Annex 2� (Normative)� AC‑3 elementary streams in the MPEG‑2 multiplex
�1���� Scope
�2���� Introduction
�3���� Detailed specification for System A (ATSC)
������� 3.1���� Stream_type
������� 3.2���� Stream_id
������� 3.3���� Registration_descriptor
������� 3.4���� AC‑3 audio_stream_descriptor
������� 3.5���� ISO_639_language_code
������� 3.6���� STD audio buffer size
�4���� Detailed specification for System B (DVB)
������� 4.1���� Stream_type
������� 4.2���� Stream_id
������� 4.3���� Service information
����������������� 4.3.1���� AC‑3_descriptor
����������������� 4.3.2���� AC‑3_descriptor syntax
����������������� 4.3.3���� AC‑3 component_type values
������� 4.4���� STD audio buffer size
�5���� PES constraints
������� 5.1���� Encoding
������� 5.2���� Decoding
�6���� Byte‑alignment