Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

MPEG-4_ALSとは? わかりやすく解説

MPEG-4 ALS

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/03/21 09:52 UTC 版)

ナビゲーションに移動 検索に移動
Audio Lossless Coding
開発者 ISO
種別 オーディオコーデック音声ファイルフォーマット
包含先 MP4
国際標準 ISO/IEC 14496-3

MPEG-4 ALS (MPEG-4 Audio Lossless Coding) はMPEG-4オーディオ (MPEG-4 Part 3) の一部として規格化されたロスレス圧縮方式で、スタジオ編集などでも使える高音質のマルチチャネルオーディオ信号を扱うことができる。

MPEG-4 ALSは、インターネットでの音楽配信、携帯ミュージックプレーヤ、音楽アーカイブシステムやスタジオ編集などさまざまな用途への応用が考えられており、FFmpegなどさまざまなソフトウェアでサポートされている[1]

概要

MPEG-4 ALSはMPEG-4オーディオで定義されたロスレスオーディオ符号化ツール (lossless audio coding tools) の1つで、MP3AACVorbisなどの非可逆圧縮方式と異なり、オリジナルのオーディオ信号をそのまま復元することができる。MPEG-4 ALSの規格はMPEG-4オーディオ (MPEG-4 Part 3) の一部としてISO/IEC 14496-3 Subpart 11で定義されている[2][3]

MPEG-4 ALSは、スタジオ編集にも使用できる量子化ビット数32ビット長のPCM信号を扱うことができ、CDより高いサンプリング周波数にも対応できる。また、5.1チャネル・7.2チャネル・22.2チャネルサラウンドを含むマルチチャネルのオーディオ入力を扱うことができる。

圧縮率は同じロスレス圧縮を行うFLACより優れており[4]、またMonkey's AudioやOptimFROGと比べると同じ圧縮率での処理時間が短い[5]

MPEG-4 ALSのアルゴリズムはFLACDirect Stream Transferなど他のロスレス圧縮と同様、線形予測エントロピー符号化を組み合わせたものである。

MPEG-4 ALSの特徴は以下の通りで[5]、柔軟性が高い。

  • 量子化ビット数32ビットまでのPCMに対応、IEEE 754 32ビット浮動小数点形式も使用可
  • 任意のサンプリング周波数(192 kHzで試験済、384 kHz以上の高サンプリング周波数にも対応可能)
  • マルチチャネル/マルチトラック対応、扱えるチャネル数は最大65536チャネル
  • 再生時のランダムアクセスが可能
  • MP4ファイルフォーマットを使い映像データとの組み合わせが可能
  • 対応可能な入力フォーマットはRaw、WAVAIFFBWF、Sony Wave64、BWF with RF64など

MPEG-4オーディオでの位置づけ

MPEG-4オーディオは多くのツールの組み合わせからなり、MPEG-4 ALSはオーディオ符号化ツール (audio coding tools) の1つであるロスレスオーディオ符号化ツール (lossless audio coding tools) に分類される[3]

同じカテゴリのツールとして、スーパーオーディオCDでのロスレス圧縮方式として使われているMPEG-4 DST (direct stream transfer) や、MPEG-4 AACなどの汎用オーディオ符号化ツール (general audio coding tools) と組み合わせて使うMPEG-4 SLS (scalable lossless coding) がある[3]。それぞれは符号化方式が異なる。

アルゴリズム

MPEG-4 ALSの符号化処理は、フレーム/ブロック分割、短期予測(線形予測)、長期予測、マルチチャネル符号化、エントロピー符号化の5つの処理からなる[4][6]

線形予測や長期予測により情報の圧縮を行う考え方は、CELPなど音声符号化での基本的な考え方と変わらない。多くのロスレス圧縮では、何らかの形で予測可能な成分は少数の予測係数として表現し、予測できなかった残差部分をエントロピー符号化を使って効率よく符号化することで、元の信号が持つ情報を維持しながらデータの圧縮を行う。MPEG-4 ALSも同様の考え方にもとづく。

フレーム/ブロック分割

フレーム分割では入力信号を基本的な処理単位であるフレームに分割する。1フレームのサンプル数はサンプリング周波数により異なり、48 kHzでは2048サンプル、96 kHzでは4096サンプルで、おおよそ43 msの長さになる。オプションとして、変化の激しい信号を効率よく符号化するため、入力信号の内容に応じて1フレームを複数のブロックに分けることもできる。

線形予測

続く短期予測では線形予測フィルターを用い、線形予測の残差信号を求める。フレーム内の各サンプル間には相関があるため過去のサンプル値からある程度予測ができる。線形予測はそのような信号を効率的に表現するための手法で、予測可能な成分を少数の線形予測係数で表現する。予測しきれなかった残差成分のみを別に符号化することで、情報の圧縮を行う。

線形予測係数はより量子化特性にすぐれたPARCOR係数(偏自己相関係数)に変換された後に量子化と符号化が行われる。

MPEG-4 ALSでの線形予測の次数は0(予測しない)から1023までで、入力信号の性質に応じて適応的に変化する[6]

長期予測

多くの音楽には、楽器などの基本周波数(ピッチ周波数)によって決まる繰り返し成分やハーモニック成分が含まれている。長期予測 (Long-Term Prediction) を追加し、短期予測の残差成分に残るこのような繰り返し成分を係数化することで残差成分の振幅を減少させ、情報の圧縮を行うことができる。

長期予測の係数としては元の信号に対する複数の遅延時間と重み係数の組み合わせが使われる。残差について、過去のサンプル値から現在のサンプル値を最もよく近似できる遅延時間と重み係数の組み合わせが計算され、係数をゴロム・ライス符号で符号化する。

マルチチャネル符号化

MPEG-4 ALSはマルチチャネルの信号を扱うことができ、チャネル間の相関を利用してさらに圧縮率の向上を行うことができる。

まず最初にチャネル間で最も相関の高い組合せ(親子関係)を探索する。続いて親チャネルの残差信号に対して、長期予測と同様の方法で複数の遅延時間と重み係数の組み合わせによる予測係数を求め、ゴロム・ライス符号で符号化する。

エントロピー符号化

入力信号からさまざまな予測成分を取り除いた残差成分に対しエントロピー符号化を行う。

符号化方式として、比較的演算量が少ないライス符号と、より複雑だが圧縮効率が高いBGMC(Block Gilbert-Moore Code、ブロック ギルバート・ムーア符号)と呼ばれる方法のいずれかを選ぶことができる。

これらの符号は小さい振幅値に短いコードを割り当てるため、それまでのさまざまな予測により振幅が小さくなった残差信号を効率的に圧縮できる[6]

復号

復号はこれらの処理を逆に行う。エントロピー符号化結果から残差信号を復元し、マルチチャネル符号化の各係数、長期予測の係数、線形予測係数により計算した予測成分を使って新しい残差成分を順次計算していくことで、1フレーム分の最終的なサンプル値を計算する。

符号化時の予測計算の方法と復号時の予測計算方法が同じであれば、符号化時の入力信号とまったく同じ信号を復号することができる。

その他の処理

MPEG-4 ALSはプロのミキシングなどに用いられるIEEE 754 32ビット浮動小数点形式の入力信号が扱える。浮動小数点形式で表現された信号は見た目のサンプル値が無相関になり圧縮がうまく行えず[6]、また丸め誤差の扱いの違いにより入力信号と同じ信号を復号できない可能性があり、整数入力の場合と異なる手法が用いられる。

入力信号を整数部分と余りの誤差部分に分割し、整数部分については従来と同じ方法で符号化を行い、余りの部分は辞書式圧縮の一種のLempel-Ziv法を修正したマスクLempel-Ziv符号化と呼ばれる方法で圧縮する。

ソフトウェア

MPEG-4 ALSのリファレンス実装はベルリン工科大学のMPEG-4 ALSのウェブページ[1]で入手できる。また、ISO/IEC 14496-5:2001/Amd.10:2007でも定義されている[7][8]

MPEG-4 ALSをサポートしている代表的ソフトウェアとして、以下のものがある[1]

歴史

2002年6月から始まったMoving Picture Experts Groupによるロスレスオーディオ符号化方式の提案要求に対し[9][10]、2002年12月にベルリン工科大学(ドイツ)、NTT(日本)、リアルネットワークス社(アメリカ)、インフォコム研究所(シンガポール)、フラウンホーファーIIS(ドイツ)、マイクロソフト(アメリカ)、サムスン電子(韓国)の7社から基本要求を満たすコーデックの提案があり、圧縮効率、必要な演算量、柔軟性についての評価が行われた。提案には可逆圧縮のみを行う方式(その後のMPEG-4 ALS)と、非可逆/可逆圧縮のハイブリッド方式(その後のMPEG-4 SLS)とが含まれていた。

Moving Picture Experts Groupは両方の方式をサポートすることを決定し、2003年6月に可逆圧縮のみを行う方式として圧縮効率が優れていたベルリン工科大学の提案をリファレンスモデルとして採用した[4]。これをベースとし、ベルリン工科大学NTT、リアルネットワークス社、インフォコム研究所が協力して[6]圧縮性能や柔軟性の向上と演算量の低減を行い、現在のMPEG-4 ALSの最終案を2005年12月にまとめ、最初の規格ISO/IEC 14496-3:2005/Amd 2:2006が2006年3月に出版された[11]

脚注

  1. ^ a b c Communication Systems Group (2010年6月22日). “MPEG-4 Audio Lossless Coding (ALS)”. Technische Universität Berlin. 2010年8月26日閲覧。
  2. ^ ISO/IEC (2009年). “ISO/IEC 14496-3:2009 - Information technology -- Coding of audio-visual objects -- Part 3: Audio”. ISO. 2010年8月15日閲覧。
  3. ^ a b c ISO/IEC (2009) (PDF), ISO/IEC 14496-3:2009 - Information technology -- Coding of audio-visual objects -- Part 3: Audio, ISO, http://webstore.iec.ch/preview/info_isoiec14496-3%7Bed4.0%7Den.pdf 2010年8月15日閲覧。 
  4. ^ a b c T. Liebchen, T. Moriya, N. Harada, Y. Kamamoto, Y. Reznik. (2005年8月). “The MPEG-4 Audio Lossless Coding (ALS) Standard - Technology and Applications (PDF)”. Technical Universifty of Berlin. 2010年8月26日閲覧。
  5. ^ a b 原田 登, 守谷 健弘, 鎌本 優 (2008年2月). “MPEG-4 ALSの性能・応用と関連する標準化活動 (PDF)”. NTT. 2010年8月26日閲覧。
  6. ^ a b c d e 鎌本 優, 守谷 健弘, 原田 登, Csaba Kos (2008年2月). “ロスレス・オーディオ符号化MPEG-4 ALSの高性能化 (PDF)”. NTT. 2010年8月26日閲覧。
  7. ^ ISO/IEC (2007) (ZIP), ISO/IEC 14496-5:2001/Amd.10:2007 - Information technology -- Coding of audio-visual objects -- Part 5: Reference software -- Amendment 10: SSC, DST, ALS and SLS reference software, ISO, http://standards.iso.org/ittf/PubliclyAvailableStandards/c043465_ISO_IEC_14496-5_2001_Amd_10_2007_Reference_Software.zip 2010年8月15日閲覧。 
  8. ^ ISO/IEC (2007), ISO/IEC 14496-5:2001/Amd.10:2007 - SSC, DST, ALS and SLS reference software, ISO, http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=43465 2010年8月15日閲覧。 
  9. ^ ISO/IEC JTC1/SC29/WG11 (MPEG), Call for Proposals on MPEG-4 Lossless Audio Coding, N5040, Klagenfurt, Austria, July 2002.
  10. ^ ISO/IEC JTC1/SC29/WG11 (MPEG), Final Call for Proposals on MPEG-4 Lossless Audio Coding, N5208, Shanghai, China, October 2002.
  11. ^ ISO (2006年). “Audio Lossless Coding (ALS), new audio profiles and BSAC extensions - ISO/IEC 14496-3:2005/Amd 2:2006”. ISO. 2010年8月15日閲覧。

参考文献

  • Andreas Spanias, Ted Painter, Venkatraman Atti (ed). Audio signal processing and coding. Wiley-Interscience, John Wiley & Sons, Inc., 2006. ISBN 978-0471791478.
  • ISO/IEC. Information technology — Coding of audio-visual objects — Part 3:Audio. ISO/IEC 14496-3:2009, Fourth edition, 2009.

関連項目

外部リンク


MPEG-4 ALS(Audio Lossless Coding)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/01/23 01:31 UTC 版)

MPEG-4 Part 3」の記事における「MPEG-4 ALS(Audio Lossless Coding)」の解説

スタジオ編集などでも使える高音質のマルチチャネルオーディオ信号を扱うことができるロスレス圧縮方式量子化ビット数32ビットまでの PCM対応し任意のサンプリング周波数最大 65536 チャネルまでのマルチチャネル/マルチトラック扱えるなど、柔軟性が高い。

※この「MPEG-4 ALS(Audio Lossless Coding)」の解説は、「MPEG-4 Part 3」の解説の一部です。
「MPEG-4 ALS(Audio Lossless Coding)」を含む「MPEG-4 Part 3」の記事については、「MPEG-4 Part 3」の概要を参照ください。

ウィキペディア小見出し辞書の「MPEG-4_ALS」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ

「MPEG-4 ALS」の例文・使い方・用例・文例

Weblio日本語例文用例辞書はプログラムで機械的に例文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。



固有名詞の分類


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「MPEG-4_ALS」の関連用語

MPEG-4_ALSのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



MPEG-4_ALSのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのMPEG-4 ALS (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、WikipediaのMPEG-4 Part 3 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。
Tanaka Corpusのコンテンツは、特に明示されている場合を除いて、次のライセンスに従います:
 Creative Commons Attribution (CC-BY) 2.0 France.
この対訳データはCreative Commons Attribution 3.0 Unportedでライセンスされています。
浜島書店 Catch a Wave
Copyright © 1995-2025 Hamajima Shoten, Publishers. All rights reserved.
株式会社ベネッセコーポレーション株式会社ベネッセコーポレーション
Copyright © Benesse Holdings, Inc. All rights reserved.
研究社研究社
Copyright (c) 1995-2025 Kenkyusha Co., Ltd. All rights reserved.
日本語WordNet日本語WordNet
日本語ワードネット1.1版 (C) 情報通信研究機構, 2009-2010 License All rights reserved.
WordNet 3.0 Copyright 2006 by Princeton University. All rights reserved. License
日外アソシエーツ株式会社日外アソシエーツ株式会社
Copyright (C) 1994- Nichigai Associates, Inc., All rights reserved.
「斎藤和英大辞典」斎藤秀三郎著、日外アソシエーツ辞書編集部編
EDRDGEDRDG
This page uses the JMdict dictionary files. These files are the property of the Electronic Dictionary Research and Development Group, and are used in conformance with the Group's licence.

©2025 GRAS Group, Inc.RSS