INTERNALS
上传用户:sun1608
上传日期:2007-02-02
资源大小:6116k
文件大小:10k
源码类别:

流媒体/Mpeg4/MP4

开发平台:

Visual C++

  1. January 7, 2002
  2. MP4V2 LIBRARY INTERNALS
  3. =======================
  4. This document provides an overview of the interals of the mp4v2 library 
  5. to aid those who wish to modify and extend it. Before reading this document,
  6. I recommend familiarizing yourself with the MP4 (or Quicktime) file format 
  7. standard and the mp4v2 library API. The API is described in a set of man pages
  8. in mpeg4ip/doc/mp4v2, or if you prefer by looking at mp4.h.
  9. All the library code is written in C++, however the library API follows uses
  10. C calling conventions hence is linkable by both C and C++ programs. The
  11. library has been compiled and used on Linux, BSD, Windows, and Mac OS X.
  12. Other than libc, the library has no external dependencies, and hence can
  13. be used independently of the mpeg4ip package if desired.  The library is 
  14. used for both real-time recording and playback in mpeg4ip, and its runtime 
  15. performance is up to those tasks. On the IA32 architecture compiled with gcc,
  16. the stripped library is approximately 600 KB code and initialized data.
  17. It is useful to think of the mp4v2 library as consisting of four layers:
  18. infrastructure, file format, generic tracks, and type specific track helpers.
  19. A description of each layer follows, from the fundamental to the optional.
  20. Infrastructure
  21. ==============
  22. The infrastructure layer provides basic file I/O, memory allocation, 
  23. error handling, string utilities, and protected arrays. The source files 
  24. for this layer are mp4file_io, mp4util, and mp4array. 
  25. Note that the array classes uses preprocessor macros instead of C++ 
  26. templates. The rationale for this is to increase portability given the 
  27. sometimes incomplete support by some compilers for templates.
  28. File Format
  29. ===========
  30. The file format layer provides the translation from the on-disk MP4 file 
  31. format to in-memory C++ structures and back to disk. It is intended 
  32. to exactly match the MP4 specification in syntax and semantics. It 
  33. represents the majority of the code.
  34. There are three key structures at the file format layer: atoms, properties,
  35. and descriptors. 
  36. Atoms are the primary containers within an mp4 file. They can contain 
  37. any combination of properties, other atoms, or descriptors.
  38. The mp4atom files contain the base class for all the atoms, and provide 
  39. generic functions that cover most cases. However, each atom has it's own 
  40. subclass contained in file atom_<name>.cpp, where <name> is the four 
  41. letter name of the atom defined in the MP4 specification. Typically this 
  42. atom file just specifies the properties of the atom or the possible child 
  43. atoms in the case of a container atom. In more specialized cases the atom 
  44. specific file provides routines to initialize, read, or write the atom.
  45. Properties are the atomic pieces of information. The basic types of 
  46. properties are integers, floats, strings, and byte arrays. For integers 
  47. and floats there are subclasses that represent the different storage sizes,
  48. e.g. 8, 16, 24, 32, and 64 bit integers. For strings, there is 1 property 
  49. class with a number of options regarding exact storage details, e.g. null 
  50. terminated, fixed length, counted. 
  51. For implementation reasons, there are also two special properties, table 
  52. and descriptor, that are actually containers for groups of properties. 
  53. I.e by making these containers provide a property interface much code can 
  54. be written in a generic fashion.
  55. The mp4property files contain all the property related classes. 
  56. Descriptors are containers that derive from the MPEG conventions and use 
  57. different encoding rules than the atoms derived from the QuickTime file
  58. format. This means more use of bitfields and conditional existence with 
  59. an emphasis on bit efficiency at the cost of encoding/decoding complexity.
  60. Descriptors can contain other descriptors and/or properties.
  61. The mp4descriptor files contain the generic base class for descriptors. 
  62. Also the mp4property files have a descriptor wrapper class that allows a 
  63. descriptor to behave as if it were a property. The specific descriptors 
  64. are implemented as subclasses of the base class descriptor in manner similar 
  65. to that of atoms. The descriptors, ocidescriptors, and qosqualifiers files 
  66. contain these implementations.
  67. Each atom/property/descriptor has a name closely related to that in the 
  68. MP4 specification. The difference being that the mp4v2 library doesn't 
  69. use '-' or '_' in property names and capitalizes the first letter of each 
  70. word, e.g. "thisIsAPropertyName". A complete name specifies the complete 
  71. container path.  The names follow the C/C++ syntax for elements and array 
  72. indices. 
  73. Examples are:
  74. "moov.mvhd.duration"
  75. "moov.trak[2].tkhd.duration"
  76. "moov.trak[3].minf.mdia.stbl.stsz[101].sampleSize"
  77. Note "*" can be used as a wildcard for an atom name (only). This is most 
  78. useful when dealing with the stsd atom which contains child atoms with 
  79. various names, but shared property names.
  80. Note that internally when performance matters the code looks up a property
  81. by name once, and then stores the returned pointer to the property class.
  82. Generic Tracks
  83. ==============
  84. The two entities at this level are the mp4 file as a whole and the tracks 
  85. which are contained with it. The mp4file and mp4track files contain the 
  86. implementation.
  87. The critical work done by this layer is to map the collection of atoms,
  88. properties, and descriptors that represent a media track into a useful,
  89. and consistent set of operations. For example, reading or writing a media 
  90. sample of a track is a relatively simple operation from the library API
  91. perspective. However there are numerous pieces of information in the mp4
  92. file that need to be properly used and updated to do this. This layer
  93. handles all those details.
  94. Given familiarity with the mp4 spec, the code should be straight-forward.
  95. What may not be immediately obvious are the functions to handle chunks of
  96. media samples. These exist to allow optimization of the mp4 file layout by
  97. reordering the chunks on disk to interleave the media sample chunks of
  98. multiple tracks in time order. (See MP4Optimize API doc).
  99. Type Specific Track Helpers 
  100. ===========================
  101. This specialized code goes beyond the meta-information about tracks in
  102. the mp4 file to understanding and manipulating the information in the
  103. track samples. There are currently two helpers in the library: 
  104. the MPEG-4 Systems Helper, and the RTP Hint Track Helper.
  105.  
  106. The MPEG-4 Systems Helper is currently limited to creating the OD, BIFS,
  107. and SDP information about a minimal audio/video scene consistent with
  108. the Internet Streaming Media Alliance (ISMA) specifications. We will be
  109. evaluating how best to generalize the library's helper functions for
  110. MPEG-4 Systems without overburdening the implementation. The code for 
  111. this helper is found in the isma and odcommands files.
  112. The RTP Hint Track Helper is more extensive in its support. The hint 
  113. tracks contain the track packetization information needed to build 
  114. RTP packets for streaming. The library can construct RTP packets based 
  115. on the hint track making RTP based servers significantly easier to write.
  116. All code related to rtp hint tracks is in the rtphint files. It would also
  117. be useful to look at test/mp4broadcaster and mpeg4ip/server/mp4creator for
  118. examples of how this part of the library API can be used.
  119. Library API
  120. ===========
  121. The library API is defined and implemented in the mp4 files. The API uses
  122. C linkage conventions, and the mp4.h file adapts itself according to whether
  123. C or C++ is the compilation mode.
  124. All API calls are implemented in mp4.cpp and basically pass thru's to the
  125. MP4File member functions. This ensures that the library has internal access
  126. to the same functions as available via the API. All the calls in mp4.cpp use
  127. C++ try/catch blocks to protect against any runtime errors in the library.
  128. Upon error the library will print a diagnostic message if the verbostiy level
  129. has MP4_DETAILS_ERROR set, and return a distinguished error value, typically
  130. 0 or -1.
  131. The test and util subdirectories contain useful examples of how to
  132. use the library. Also the mp4creator and mp4live programs within
  133. mpeg4ip demonstrate more complete usage of the library API.
  134. Debugging
  135. =========
  136. Since mp4 files are fairly complicated, extensive debugging support is
  137. built into the library. Multi-level diagnostic messages are available 
  138. under the control of a verbosity bitmask described in the API.
  139. Also the library provides the MP4Dump() call which provides an ASCII
  140. version of the mp4 file meta-information. The mp4dump utilitity is a
  141. wrapper executable around this function.
  142. The mp4extract program is also provided in the utilities directory
  143. which is useful for extracting a track from an mp4file and putting the
  144. media data back into it's own file. It can also extract each sample of
  145. a track into its own file it that is desired.
  146. When all else fails, mp4 files are amenable to debugging by direct
  147. examination. Since the atom names are four letter ASCII codes finding
  148. reference points in a hex dump is feasible. On UNIX, the od command
  149. is your friend: "od -t x1z -A x [-j 0xXXXXXX] foo.mp4" will print
  150. a hex and ASCII dump, with hex addresses, starting optionally from
  151. a specified offset. The library diagnostic messages can provide
  152. information on where the library is reading or writing.
  153. General caveats
  154. ===============
  155. The coding convention is to use the C++ throw operator whenever an 
  156. unrecoverable error occurs. This throw is caught at the API layer 
  157. in mp4.cpp and translated into an error value. 
  158. Be careful about indices. Internally, we follow the C/C++ convention 
  159. to use zero-based indices. However the MP4 spec uses one-based indices 
  160. for things like samples and hence the library API uses this convention.