Warning: Undefined variable $type in /home/users/1/sub.jp-asate/web/wiki/extensions/HeadScript/HeadScript.php on line 3

Warning: "continue" targeting switch is equivalent to "break". Did you mean to use "continue 2"? in /home/users/1/sub.jp-asate/web/wiki/includes/json/FormatJson.php on line 297

Warning: Trying to access array offset on value of type bool in /home/users/1/sub.jp-asate/web/wiki/includes/Setup.php on line 660

Warning: session_name(): Session name cannot be changed after headers have already been sent in /home/users/1/sub.jp-asate/web/wiki/includes/Setup.php on line 834

Warning: ini_set(): Session ini settings cannot be changed after headers have already been sent in /home/users/1/sub.jp-asate/web/wiki/includes/session/PHPSessionHandler.php on line 126

Warning: ini_set(): Session ini settings cannot be changed after headers have already been sent in /home/users/1/sub.jp-asate/web/wiki/includes/session/PHPSessionHandler.php on line 127

Warning: session_cache_limiter(): Session cache limiter cannot be changed after headers have already been sent in /home/users/1/sub.jp-asate/web/wiki/includes/session/PHPSessionHandler.php on line 133

Warning: session_set_save_handler(): Session save handler cannot be changed after headers have already been sent in /home/users/1/sub.jp-asate/web/wiki/includes/session/PHPSessionHandler.php on line 140

Warning: "continue" targeting switch is equivalent to "break". Did you mean to use "continue 2"? in /home/users/1/sub.jp-asate/web/wiki/languages/LanguageConverter.php on line 773

Warning: Cannot modify header information - headers already sent by (output started at /home/users/1/sub.jp-asate/web/wiki/extensions/HeadScript/HeadScript.php:3) in /home/users/1/sub.jp-asate/web/wiki/includes/Feed.php on line 294

Warning: Cannot modify header information - headers already sent by (output started at /home/users/1/sub.jp-asate/web/wiki/extensions/HeadScript/HeadScript.php:3) in /home/users/1/sub.jp-asate/web/wiki/includes/Feed.php on line 300

Warning: Cannot modify header information - headers already sent by (output started at /home/users/1/sub.jp-asate/web/wiki/extensions/HeadScript/HeadScript.php:3) in /home/users/1/sub.jp-asate/web/wiki/includes/WebResponse.php on line 46

Warning: Cannot modify header information - headers already sent by (output started at /home/users/1/sub.jp-asate/web/wiki/extensions/HeadScript/HeadScript.php:3) in /home/users/1/sub.jp-asate/web/wiki/includes/WebResponse.php on line 46

Warning: Cannot modify header information - headers already sent by (output started at /home/users/1/sub.jp-asate/web/wiki/extensions/HeadScript/HeadScript.php:3) in /home/users/1/sub.jp-asate/web/wiki/includes/WebResponse.php on line 46
https:///mymemo.xyz/wiki/api.php?action=feedcontributions&feedformat=atom&user=118.243.68.113 miniwiki - 利用者の投稿記録 [ja] 2024-06-15T19:09:00Z 利用者の投稿記録 MediaWiki 1.31.0 離散コサイン変換 2016-12-16T18:43:14Z <p>118.243.68.113: キーワード「離散信号」へのリンク</p> <hr /> <div>[[ファイル:Dandelion clock quarter dft dct.png|thumb|350px|right|二次元DCTと[[離散フーリエ変換|DFT]]との比較。左はスペクトル、右はヒストグラム。低周波域での相違を示すため、スペクトルは 1/4 だけ示してある。DCTでは、パワーのほとんどが低周波領域に集中していることがわかる。]]<br /> &#039;&#039;&#039;離散コサイン変換&#039;&#039;&#039;(りさんコサインへんかん)は、[[離散信号]]を[[周波数領域]]へ変換する方法の一つであり、信号圧縮に広く用いられている。英語の &#039;&#039;discrete cosine transform&#039;&#039; の頭文字から &#039;&#039;&#039;DCT&#039;&#039;&#039; と呼ばれる。以下DCTと略す。<br /> <br /> == 概要 ==<br /> DCTは、有限[[数列]]を、[[余弦関数]]数列 cos(&#039;&#039;nk&#039;&#039;) を[[基底]]とする一次結合(つまり、適切な[[周波数]]と[[振幅]]のコサインカーブの和)の係数に変換する。余弦関数は実数に対しては[[実数]]を返すので、実数列に対してはDCT係数も実数列となる。<br /> <br /> これは、[[離散フーリエ変換]] (DFT: discrete Fourier transform) が、実数に対しても複素数を返す exp(&#039;&#039;ink&#039;&#039;) を使うため、実数列に対しても[[複素数]]列となるのと大きな違いである。なお、DFTも[[偶関数]]数列に対しては実係数を返す、つまりコサイン成分のみとなるが、DCTは&#039;&#039;y&#039;&#039;軸で折り返して偶関数化してDFTすることと等価であり、実際にそう計算することが多い。<br /> <br /> DCTでは、係数が実数になる上、特定の成分への集中度があがる。[[JPEG]]などの画像圧縮、[[AAC]]や[[MP3]]、[[ATRAC]]といった[[音声圧縮]]、デジタルフィルタ等広い範囲で用いられている。<br /> <br /> 逆変換を&#039;&#039;&#039;逆離散コサイン変換&#039;&#039;&#039;({{Lang-en-short|&#039;&#039;inverse discrete cosine transform (IDCT)&#039;&#039;}})と呼ぶ。<br /> <br /> == 種類 ==<br /> DCTには標準的な方法が8通りあり、そのうち4つがふつうに用いられる。最も一般的な方法は type-II DCT であり、単にDCTと呼んだ場合これを指すことが多い(以下DCT-II)。同様に、DCT-IIの逆変換である type-III DCT は単に逆DCT (inverse DCT) ないしIDCTと呼ばれることが多い。<br /> <br /> DCTに関連する変換法が二つある。一つは[[離散サイン変換]] (DST) であり、実領域で奇関数を用いた[[離散フーリエ変換]] (DFT) と等価である。もう一つの[[修正離散コサイン変換]] (MDCT) は「互いに重なりのある」データのDCTに基づいている。<br /> <br /> == 応用 ==<br /> DCT、特にDCT-IIは信号・画像処理にしばしば用いられる。特に[[不可逆圧縮]]に頻用されるが、これはDCTの持つ強力な「エネルギー圧縮」特性による。DCTで変換すると、情報が少数の低周波成分に集中する傾向が生まれ、[[マルコフ過程]]の制限に基づく信号について、非相関成分の検出に最適である[[Karhunen-Loève変換]]に近い。<br /> <br /> たとえばDCTは[[JPEG]]、[[MJPEG]]、[[MPEG]]、[[DV (ビデオ規格)|DV]]等の画像圧縮に用いられる。これらの画像圧縮では、&#039;&#039;N&#039;&#039; × &#039;&#039;N&#039;&#039; のブロックに2次元DCT-IIを行い、その結果を[[量子化]]し、[[エントロピー圧縮]]する。典型的には &#039;&#039;N&#039;&#039; = 8 であり、そのブロックの行ごと、列ごとにDCT-IIの式を適用する。その結果得られる 8 × 8 行列は、要素 (0, 0) をDC(直流。周波数が 0)成分とし、行・列とも、添字が大きくなるほど垂直ないし水平方向の空間周波数が高い成分を表す。<br /> <br /> [[ファイル:Example dft dct.svg|thumb|350px|right|2次元DCTとDFTとの比較。]]<br /> <br /> 音声圧縮に用いられる[[MDCT]]、[[AAC]]、[[Vorbis]]、[[MP3]]も関連した変換法である。<br /> <br /> DCTは、[[偏微分方程式]]をスペクトル法で解くときにも広く使われる。その場合、配列の両端での境界条件の偶奇性に対応して、異なるDCTの変種が使われる。<br /> <br /> DCTはまた、[[チェビシェフ多項式]]とも密接に関係しており、高速DCT算法(下記)は[[クレーンショー・カーチス数値積分則]]のような、任意の関数についてのチェビシェフ近似に用いられる。<br /> <br /> == 非形式的概説 ==<br /> フーリエ変換やそれに類似の変換(以下、類フーリエ変換とよぶ)のように、離散コサイン変換 (DCT) も関数あるいは信号を異なる[[周波数]]と[[振幅]]をもつ[[三角関数]]の和として表現する。また、DCTは、離散フーリエ変換 (DFT) と同じく、離散的なデータ点からなる有限の関数に対して施される。一見してそれとわかるDCTとDFTとの違いはDCTがコサイン(余弦)関数のみを使うのに対してDFTがコサインとサイン(正弦)関数の両方を(複素数の[[指数関数]]の形式で)使うという点である。しかし、この見かけの違いはもっと本質的な違いの帰結でしかない。すなわち、DCTとDFTあるいは他の関連する変換は[[境界条件]]において異なっているということである。<br /> <br /> 有限の定義域をもつ関数に施される類フーリエ変換、すなわちDFTやDCTや[[フーリエ級数]]は、暗黙のうちにその定義域の外部に関数を「拡張」して定義しているのだと考えることができる。つまり、ある関数 &#039;&#039;f&#039;&#039;(&#039;&#039;x&#039;&#039;) を一旦三角関数の和として表現してしまうと、任意の &#039;&#039;x&#039;&#039; に対し、それがたとえ元の関数 &#039;&#039;f&#039;&#039;(&#039;&#039;x&#039;&#039;) が定義されていない &#039;&#039;x&#039;&#039; であったとしても、その &#039;&#039;x&#039;&#039; におけるその三角関数の和を計算できる。DFTやフーリエ級数では元の関数の周期的な拡張がなされていると考えることができる。DCTでは、(離散的でない)[[コサイン変換]]と同様に、元の関数を[[偶関数]]に拡張することを意味する。<br /> <br /> &lt;!--[[Image:DCT-symmetries.svg|thumb|right|350px|DCTの入力データの非明示的な偶対称/奇対称の拡張。&#039;&#039;N&#039;&#039; = 11 のデータ点(赤)が与えられたときの一般的なDCTのタイプ(DCT-IからDCT-IV)に対する例。]]--&gt;<br /> しかしながら、DCTは「有限」で「離散的」な数列に対して施されるものであるから、連続なコサイン変換にはない2つの微妙な問題が引き起こされる。まず、有限の点で定義された関数は定義域に左端と右端(すなわち最小の添字と最大の添字)とをもつので、その&#039;&#039;両方&#039;&#039;それぞれで偶対称であるか奇対称であるかを指定しなければならない。次に、関数の定義域は離散的であるので、&#039;&#039;どの位置&#039;&#039;に関して関数が偶/奇対称であるのかを指定しなければならない。例えば、&#039;&#039;abcd&#039;&#039; という均等に離れた4つの点の列を考えてみよう。そして例えば、&#039;&#039;左&#039;&#039;の境界で偶対称であると指定したとしよう。このときどの位置で対称なのかという微妙な相違が生ずる。すなわち、データは点 &#039;&#039;a&#039;&#039; に関して偶対称であって偶関数への拡張は &#039;&#039;dcbabcd&#039;&#039; なのだろうか、それともデータは &#039;&#039;a&#039;&#039; とその前の点との&#039;&#039;中間&#039;&#039;点に関して偶対称であって拡張は &#039;&#039;dcbaabcd&#039;&#039; であるのか(&#039;&#039;a&#039;&#039; が繰り返すのか)?<br /> <br /> これら2重の選択が、DCTと[[離散サイン変換]] (DST) との標準的なさまざまな変種すべてを生じさせることになる。各々の境界は偶対称であるか奇対称であるかどちらかであることができ(これは2つの境界それぞれに2つの選択肢を与える)、さらに、各々の境界であるデータ点に関して対称か、2つのデータ点の中間点に関して対称かどちらかであることができる(同様に、これは2つの境界それぞれに2つの選択肢を与える)。結局、2 × 2 × 2 × 2 = 16 種類の選択肢がある。これらの選択肢のうち&#039;&#039;左&#039;&#039;の境界が偶対称であるものがDCTとよばれ、選択肢の半分の8つのタイプに対応する。残りの半分がDSTの8つのタイプとなる。<br /> <br /> これらは境界条件が異なるだけで施される変換はすべて離散フーリエ変換であるが、これらの違いは変換を応用する際にその用途に強く影響し、さまざまなDCTの変種に対してそれぞれに有用な特性を与えている。最も直接的には、[[偏微分方程式]]を{{仮リンク|スペクトル法|en|Spectral method}}で解くために類フーリエ変換を用いるとき、境界条件は解かせることになる問題の一部として直接指定される。あるいはまた、(DCTのタイプIVに基づいている)修正離散コサイン変換 (modified DCT, MDCT) に対しては、境界条件はMDCTの本質的な特性である[[時間領域]]の[[エイリアシング]]の消去に密接に関係している。もっと微妙なあり方ながら、境界は任意の類フーリエ級数において収束の速さに影響しているので、境界条件は画像や音声圧縮に対してDCTを有用なものとしているいわゆる「エネルギー圧縮」の特性を与える原因となっている。<br /> <br /> 特に、関数に[[不連続性の分類|不連続性]]があればフーリエ級数の{{仮リンク|収束率|en|Rate of convergence}}を減少させることはよく知られている。同じ原理は信号圧縮に対して類フーリエ変換の有用性を決定している。よりなめらかな関数はそれをより正確に表すために必要となるDFTやDCTの係数がより少なくてすみ、より圧縮できることになる(ここで、「なめらかさ」について語るためにDFTやDCTをそれぞれ関数のフーリエ級数とコサイン級数の近似だとみなしている)。しかし、DFTがもつ非明示的な周期性は境界において通常不連続性を作り出すことを意味する。任意に選んだ信号の断片において左と右の境界の値が共に同じ値を持つということはめったに起こることではない。対照的に、「両方」の境界が「常に」偶対称であるDCTはこれらの境界において連続した拡張を与える(ただし一般にはその傾きは不連続である)。これがなぜDCTが、とりわけ(両方の境界が偶対称である)DCTのタイプ I, II, V, VI が一般にDFTよりも信号圧縮でよい成績を収めるのかという理由である。応用上は、こうした用途には一部には計算の容易さからDCT-IIが最も好まれている。<br /> <br /> == 形式的定義 ==<br /> 形式的には、1次元のDCT &#039;&#039;F&#039;&#039;: &#039;&#039;&#039;R&#039;&#039;&#039;&lt;sup&gt;&#039;&#039;N&#039;&#039;&lt;/sup&gt; → &#039;&#039;&#039;R&#039;&#039;&#039;&lt;sup&gt;&#039;&#039;N&#039;&#039;&lt;/sup&gt; は、ある可逆な[[線形写像]](ただし、&#039;&#039;&#039;R&#039;&#039;&#039; は[[実数]]の集合)、または同じことであるが、ある正則な &#039;&#039;N&#039;&#039; × &#039;&#039;N&#039;&#039; 正方[[行列]]であって、以下に示された式で表される。ただし、これらの式では、&#039;&#039;N&#039;&#039; 個の実数列 &#039;&#039;x&#039;&#039;&lt;sub&gt;0&lt;/sub&gt;, ..., &#039;&#039;x&#039;&#039;&lt;sub&gt;&#039;&#039;N&#039;&#039;−1&lt;/sub&gt; が &#039;&#039;N&#039;&#039; 個の実数列 &#039;&#039;X&#039;&#039;&lt;sub&gt;0&lt;/sub&gt;, ..., &#039;&#039;X&#039;&#039;&lt;sub&gt;&#039;&#039;N&#039;&#039;−1&lt;/sub&gt; に変換される。<br /> <br /> === DCT-I ===<br /> : &lt;math&gt;X_k = \frac{1}{2} x_0 <br /> + \sum_{n=1}^{N-2} x_n \cos\!\left(\frac{\pi}{N-1} n k \right)<br /> + \frac{(-1)^k}{2} x_{N-1}&lt;/math&gt;<br /> <br /> フーリエ変換や他の類似の変換と同じように式全体にかかる定数係数にはばらつきがあり、文献やライブラリによっては、DFTとの対応からこの式を 2 倍したものや、逆変換との対称性から {2/(&#039;&#039;N&#039;&#039;−1)}&lt;sup&gt;1/2&lt;/sup&gt; 倍したものによって定義している場合もあるので注意を要する。また、&#039;&#039;x&#039;&#039;&lt;sub&gt;0&lt;/sub&gt; と &#039;&#039;x&#039;&#039;&lt;sub&gt;&#039;&#039;N&#039;&#039;−1&lt;/sub&gt; の項を 2&lt;sup&gt;1/2&lt;/sup&gt; 倍し、対応して &#039;&#039;X&#039;&#039;&lt;sub&gt;0&lt;/sub&gt; と &#039;&#039;X&#039;&#039;&lt;sub&gt;&#039;&#039;N&#039;&#039;−1&lt;/sub&gt; を 2&lt;sup&gt;−1/2&lt;/sup&gt; 倍していることもある。後者の変更によって、ある定数倍を除いて変換は直交変換となるが、このときには実偶関数に対するDFTとは直接の関連を失うことになる。<br /> <br /> DCT-Iでは、境界条件から 2(&#039;&#039;N&#039;&#039; − 1) 周期に拡張された関数を考えていることに対応するので、&#039;&#039;N&#039;&#039; ≥ 2 でないと定義できないことに注意されたい。他のタイプのDCTはすべて、&#039;&#039;N&#039;&#039; ≥ 1 であればよい。なお、&#039;&#039;N&#039;&#039; = 2 のときは上式の総和の項は消え、&#039;&#039;X&#039;&#039;&lt;sub&gt;0&lt;/sub&gt; = 1/2 (&#039;&#039;x&#039;&#039;&lt;sub&gt;0&lt;/sub&gt; + &#039;&#039;x&#039;&#039;&lt;sub&gt;1&lt;/sub&gt;), &#039;&#039;X&#039;&#039;&lt;sub&gt;1&lt;/sub&gt; = 1/2 (&#039;&#039;x&#039;&#039;&lt;sub&gt;0&lt;/sub&gt; − &#039;&#039;x&#039;&#039;&lt;sub&gt;1&lt;/sub&gt;) となる。<br /> <br /> DCT-Iは(全体が2倍になる違いを除いて)、2(&#039;&#039;N&#039;&#039; − 1) 個の実数をもつ偶対称関数のDFTとまったく同じものである。たとえば、DCT-Iで &#039;&#039;N&#039;&#039; = 5 とし、5個の実数を abcde とすると、これは8個の実数 abcdedcb(偶対称)に対するDFTを 2 で割ったものになる。<br /> <br /> DCT-Iは次の境界条件の場合に対応している:<br /> * &#039;&#039;x&#039;&#039;&lt;sub&gt;&#039;&#039;n&#039;&#039;&lt;/sub&gt; が &#039;&#039;n&#039;&#039; = 0 に関して偶対称、&#039;&#039;n&#039;&#039; = &#039;&#039;N&#039;&#039; − 1 に関して偶対称。<br /> * &#039;&#039;X&#039;&#039;&lt;sub&gt;&#039;&#039;k&#039;&#039;&lt;/sub&gt; についても同様。<br /> <br /> === DCT-II ===<br /> : &lt;math&gt;X_k =<br /> \sum_{n=0}^{N-1} x_n \cos\!\left\{\frac{\pi}{N} \left(n+\frac{1}{2}\right) k \right\}&lt;/math&gt;<br /> <br /> DCT-IIは信号の圧縮分野などの応用では最も広く用いられている方法で、単にDCT (&#039;&#039;the&#039;&#039; DCT) と呼ばれることもある。DCT-Iと同様の理由により、これを2倍したものや、(2/&#039;&#039;N&#039;&#039;)&lt;sup&gt;1/2&lt;/sup&gt; 倍したものとして定められている場合もあり、また直交化のために &#039;&#039;X&#039;&#039;&lt;sub&gt;0&lt;/sub&gt; の項のみ 2&lt;sup&gt;−1/2&lt;/sup&gt; 倍されている場合もある。最後の場合DFTとの直接の対応は失われる。<br /> <br /> このタイプは境界の両側に要素の間隔の半分のシフトを含んだ偶対称への拡張を考える。例えば &#039;&#039;N&#039;&#039; = 5 のときの実数列を &#039;&#039;abcde&#039;&#039; とすれば、2&#039;&#039;N&#039;&#039; = 10 個の実数列 &#039;&#039;abcdeedcba&#039;&#039; となる。両端の要素 &#039;&#039;a&#039;&#039;, &#039;&#039;e&#039;&#039; が繰り返される点がDCT-Iとは異なっている。ただし半分のシフトを行っているため、DFTとの対応を考える場合にはさらに倍にして偶数の添字の要素を 0 とした 4&#039;&#039;N&#039;&#039; 個の実数列をとる。すなわち、4&#039;&#039;N&#039;&#039; 個の実数列 &#039;&#039;y&#039;&#039;&lt;sub&gt;0&lt;/sub&gt;, ..., &#039;&#039;y&#039;&#039;&lt;sub&gt;4&#039;&#039;N&#039;&#039;−1&lt;/sub&gt; を、<br /> * &#039;&#039;y&#039;&#039;&lt;sub&gt;2&#039;&#039;n&#039;&#039;&lt;/sub&gt; = 0&amp;nbsp;&amp;nbsp;&amp;nbsp;(0 ≤ &#039;&#039;n&#039;&#039; &amp;lt; 2&#039;&#039;N&#039;&#039; である &#039;&#039;n&#039;&#039; について),<br /> * &#039;&#039;y&#039;&#039;&lt;sub&gt;2&#039;&#039;n&#039;&#039;+1&lt;/sub&gt; = &#039;&#039;y&#039;&#039;&lt;sub&gt;4&#039;&#039;N&#039;&#039;−2&#039;&#039;n&#039;&#039;−1&lt;/sub&gt; = &#039;&#039;x&#039;&#039;&lt;sub&gt;&#039;&#039;n&#039;&#039;&lt;/sub&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;(0 ≤ &#039;&#039;n&#039;&#039; &amp;lt; &#039;&#039;N&#039;&#039; である &#039;&#039;n&#039;&#039; について)<br /> を満たすものとすると、DCT-IIはこの実数列 &#039;&#039;y&#039;&#039;&lt;sub&gt;&#039;&#039;n&#039;&#039;&lt;/sub&gt; をDFTで変換し 2 で割ったものと一致する。<br /> <br /> DCT-IIは次の境界条件に対応する:<br /> * &#039;&#039;x&#039;&#039;&lt;sub&gt;&#039;&#039;n&#039;&#039;&lt;/sub&gt; が &#039;&#039;n&#039;&#039; = −1/2 に関して偶対称、&#039;&#039;n&#039;&#039; = &#039;&#039;N&#039;&#039; − 1/2 に関して偶対称。<br /> * &#039;&#039;X&#039;&#039;&lt;sub&gt;&#039;&#039;k&#039;&#039;&lt;/sub&gt; が &#039;&#039;k&#039;&#039; = 0 に関して偶対称、&#039;&#039;k&#039;&#039; = &#039;&#039;N&#039;&#039; に関して奇対称。<br /> <br /> === DCT-III ===<br /> : &lt;math&gt;X_k = \frac{1}{2} x_0 +<br /> \sum_{n=1}^{N-1} x_n \cos\!\left\{\frac{\pi}{N} n \left(k+\frac{1}{2}\right) \right\}&lt;/math&gt;<br /> <br /> DCT-IIIは(ある定数倍を無視すれば)DCT-IIの逆変換である。そのため、単に「逆DCT」(the inverse DCT, IDCT) と呼ばれることがある。<br /> <br /> &#039;&#039;x&#039;&#039;&lt;sub&gt;0&lt;/sub&gt; の項を &lt;math&gt;\sqrt{2}&lt;/math&gt; 倍することもある(対応する変形は上記DCT-II参照)。そうすると、DCT-IIとDCT-IIIとは互いに転置になる。DCT-IIIの行列は直交になるが、DFTとの直接の対応関係は失われる。<br /> <br /> DCT-IIIは次の境界条件にあたる:<br /> * &#039;&#039;x&#039;&#039;&lt;sub&gt;&#039;&#039;n&#039;&#039;&lt;/sub&gt; が &#039;&#039;n&#039;&#039; = 0 で偶対称かつ &#039;&#039;n&#039;&#039; = &#039;&#039;N&#039;&#039; で奇対称。<br /> * &#039;&#039;X&#039;&#039;&lt;sub&gt;&#039;&#039;k&#039;&#039;&lt;/sub&gt; が &#039;&#039;k&#039;&#039; = −1/2 で偶対称かつ &#039;&#039;k&#039;&#039; = &#039;&#039;N&#039;&#039; − 1/2 で偶対称。<br /> <br /> === DCT-IV ===<br /> : &lt;math&gt;X_k =<br /> \sum_{n=0}^{N-1} x_n \cos\!\left\{\frac{\pi}{N} \left(n+\frac{1}{2}\right) \left(k+\frac{1}{2}\right) \right\}&lt;/math&gt;<br /> <br /> DCT-IVの行列は(定数倍を無視すれば)[[直交]]である。<br /> <br /> DCT-IVの変種のひとつで、各変換のデータが「重なり合っている」変形を、[[修正離散コサイン変換]] (modified DCT, MDCT) と呼ぶ。<br /> <br /> DCT-IVは次の境界条件に対応する:<br /> * &#039;&#039;x&#039;&#039;&lt;sub&gt;&#039;&#039;n&#039;&#039;&lt;/sub&gt; が &#039;&#039;n&#039;&#039; = −1/2 で偶対称、&#039;&#039;n&#039;&#039; = &#039;&#039;N&#039;&#039; − 1/2 で奇対称。<br /> * &#039;&#039;X&#039;&#039;&lt;sub&gt;&#039;&#039;k&#039;&#039;&lt;/sub&gt; についても同様。<br /> <br /> === DCT-V – VIII ===<br /> DCTタイプ I – IV は、実偶関数への偶数次DFTと等価である。原理的には、実際にはさらに、実偶関数への奇数次DFTに対応する4タイプのDCTタイプ V – VIII が存在する (Martucci, 1994)。タイプ V – VIII は、cos 関数の引数の分母に &#039;&#039;N&#039;&#039; + 1/2 の係数がある。ただし、タイプ V – VIII は実際にはほとんど使われない。<br /> <br /> (自明な実偶配列である、1つの数 &#039;&#039;a&#039;&#039; への長さ 1(奇数)のDFTは、&#039;&#039;N&#039;&#039; = 1 のDCT-Vである)<br /> <br /> == 逆変換 ==<br /> DCT-Iの逆変換は、DCT-Iの 2/(&#039;&#039;N&#039;&#039; − 1) 倍である。DCT-IVの逆変換は、DCT-IVの 2/&#039;&#039;N&#039;&#039; 倍である。DCT-IIの逆変換はDCT-IIIの 2/&#039;&#039;N&#039;&#039; 倍で、DCT-IIIの逆変換はDCT-IIの 2/&#039;&#039;N&#039;&#039; 倍である。<br /> <br /> DFT同様、これらの変換公式の最前部にある標準化係数は便宜的なもので、扱いによって異なる。たとえば変換式を &lt;math&gt;\sqrt{2 / N}&lt;/math&gt; 倍(DCT-Iでは {2/(&#039;&#039;N&#039;&#039; − 1)}&lt;sup&gt;1/2&lt;/sup&gt; 倍)する著者もおり、その場合何も乗算しなくても逆変換になる。<br /> <br /> == 計算法 ==<br /> 上記の公式を直接使うと、計算量は O(&#039;&#039;N&#039;&#039;&lt;sup&gt;2&lt;/sup&gt;) となるが、[[高速フーリエ変換]] (FFT) と同様の技法を使って、計算量を O(&#039;&#039;N&#039;&#039; log&#039;&#039;N&#039;&#039;) に減らせる。また、計算量 O(&#039;&#039;N&#039;&#039;) の事前処理と事後処理を加えることで、FFTそのものを使ってもDCTを計算できる。<br /> <br /> 当然ながら、ふつうは、最も効率がいいのはDCT専用の[[アルゴリズム]]であり、FFTはそれに及ばない(例外については後述する)。とはいうものの、DCTに特化したアルゴリズム(少なくとも2の冪乗個のデータに関しては、現在知られている中で最も計算量の少ないものを含め)は通常、FFTのアルゴリズムと密接に関連している。というのも、DCTは本質的には偶である実数データに対するDFTであるから、高速DCTのアルゴリズムの設計には、FFTを元にして、データの対称性に基づき冗長な計算を減らすことができる。この設計は自動化もできる (Frigo &amp; Johnson, 2005)。{{仮リンク|クーリー・テューキーのアルゴリズム|en|Cooley–Tukey FFT algorithm}}に基づくものが最も一般的だが、FFTのアルゴリズムならこれに限らず何でも用いることができる。たとえば、ウィノグラードのアルゴリズム (Winograd algorithm) を用いると、加算の回数が増える代わりに乗算の回数を最小化することができ、一般的には効率があがる。同様なアルゴリズムは Feig &amp; Winograd (1992) によってもDCT向きに提唱されている。DFT、DCT、および類似の変換法のアルゴリズムは互いに密接に関連しているため、どれかの変換法で改善が行われると、理論的には他の変換法にも即座に応用することができる (Duhamel &amp; Vetterli, 1990)。<br /> <br /> 理論的には、FFTそのものを変更なしで用いた場合、DCT専用のアルゴリズムに比べいくらかのオーバーヘッドを伴うことになるが、この方法には明瞭な利点がある。高度に最適化されたFFTプログラムが広く出回っていることである。かくして実際には、一般的な &#039;&#039;N&#039;&#039; 長のデータを扱う場合、FFTを元にしたアルゴリズムの方が容易に性能を出せることが多い(現代の主なハードウェアの速度は、単純な計算量で決まるようなものではなく、プログラムの最適化によって、それに応じたハードウェアの改良も行われる)。一方、DCT専用アルゴリズムは、少量かつ固定長のデータ(たとえば、JPEGで用いられる 8 × 8 のDCT-II)向けや、音声圧縮用途の小規模なDCT(ないしMDCT)向けに広く用いられている。このような[[組み込みシステム]]用には、プログラムコードが短くて済むことも重要だからである。<br /> <br /> 実際のところ、通常のFFTを用いたDCTアルゴリズムといっても、それはしばしば、実数の偶関数データに対するより大規模なFFTから冗長な処理をそぎ落としたものと等価であり、計算量から見ても最適でありうる。たとえば、DCT-IIは 4&#039;&#039;N&#039;&#039; の偶対称な実数データ(偶数番目の要素が 0)に対するDFTと等価である。FFTを用いた一般的な計算法(たとえば[[FFTPACK]]や[[FFTW]]に用いられている)の一つは Makhoul (1980) による。この手法は、実で偶なDFT(DCT-IIに対応する)における radix-4 時間間引きFFTの1ステップと見ることもできる(基数を 4 にする radix-4 ステップによって 4&#039;&#039;N&#039;&#039; 個のデータに対するDFTが4つのDFTに分解されることになり、それぞれのDFTは &#039;&#039;N&#039;&#039; 個の実数データに対するものとなる。4つのDFTのうち2つは 0 で、データが偶対称であることから、残りの2つは互いに等しくなる。かくして &#039;&#039;N&#039;&#039; 個の実数データに対するFFT 1回と、O(&#039;&#039;N&#039;&#039;) のバタフライ演算で計算できることとなる)。偶数の添字を持つ要素が 0 であるから、radix-4 ステップは split-radix ステップと正確に同じものである。続いて &#039;&#039;N&#039;&#039; 個の実数データに対するFFTを実データ split-radix FFT(Sorensen et al., 1987等)を用いて行えば、最終的な算法全体は、すでに述べた 2 の冪乗データに対するDCT-IIアルゴリズムのうち、最も計算量が少ないものに匹敵する(実数演算の回数が 2&#039;&#039;N&#039;&#039; log&lt;sub&gt;2&lt;/sub&gt;&#039;&#039;N&#039;&#039; − &#039;&#039;N&#039;&#039; + 2 のオーダーである&lt;ref&gt;正確には、実数演算の回数、特に実数乗算の回数は、変換式のスケーリングに幾分依存する。計算量 2&#039;&#039;N&#039;&#039; log&lt;sub&gt;2&lt;/sub&gt;&#039;&#039;N&#039;&#039; − &#039;&#039;N&#039;&#039; + 2 はDCT-IIについて前述の定義を用いた場合で、式全体が &lt;math&gt;\sqrt{2}&lt;/math&gt; でスケーリングされていれば、乗算を2回節約できる。出力を個別にスケーリングすることが許されるなら、さらに乗算を減らせる。size-8 であるJPEGに関する結果を参照されたい (Arai et al. , 1988)。&lt;/ref&gt;)。したがって、計算量の点ではDCTをFFTで計算することが本質的に悪であるというわけではなく、単に使おうとしているFFTアルゴリズムの最適化の問題であることがある。アルゴリズムではなく実装上の問題であるが、データ量 &#039;&#039;N&#039;&#039; が小さい場合は、独立したFFTルーチンを呼び出すための関数呼び出しに伴うオーバーヘッドの方が問題になりうるほどである。<br /> <br /> == 注釈 ==<br /> &lt;references /&gt;<br /> <br /> == 参考文献 ==<br /> * K.R. Rao and P. Yip, &#039;&#039;Discrete Cosine Transform: Algorithms, Advantages, Applications&#039;&#039;, 1990, Academic Press:Boston; K.R. Rao, P. Yip, and V. Britanak, 2006, 2 sub ed., ISBN 0-12-580251-X; [[安田浩]], 藤原洋訳 『画像符号化技術 — DCTとその国際標準』, 1992, オーム社, ISBN 4-274-03401-1<br /> * A. V. Oppenheim, R. W. Schafer, and J. R. Buck, &#039;&#039;Discrete-Time Signal Processing&#039;&#039;, second edition (Prentice-Hall, New Jersey, 1999).<br /> * S. A. Martucci, &quot;Symmetric convolution and the discrete sine and cosine transforms,&quot; &#039;&#039;IEEE Trans. Sig. Processing&#039;&#039; &#039;&#039;&#039;SP-42&#039;&#039;&#039;, 1038–1051 (1994).<br /> * Matteo Frigo and Steven G. Johnson: &#039;&#039;FFTW&#039;&#039;, http://www.fftw.org/. フリー([[GNU General Public License|GPL]] ライセンス)の C ライブラリで、任意の大きさの 1 次元と多次元の DCT(タイプ I–IV)を高速に計算できる。 M. Frigo and S. G. Johnson, &quot;[http://fftw.org/fftw-paper-ieee.pdf The Design and Implementation of FFTW3],&quot; &#039;&#039;Proceedings of the IEEE&#039;&#039; &#039;&#039;&#039;93&#039;&#039;&#039; (2), 216–231 (2005) も参照。<br /> * E. Feig, S. Winograd. &quot;Fast algorithms for the discrete cosine transform,&quot; &#039;&#039;IEEE Transactions on Signal Processing&#039;&#039; &#039;&#039;&#039;40&#039;&#039;&#039; (9), 2174–2193 (1992).<br /> * P. Duhamel and M. Vetterli, &quot;Fast Fourier transforms: a tutorial review and a state of the art,&quot; &#039;&#039;Signal Processing&#039;&#039; &#039;&#039;&#039;19&#039;&#039;&#039;, 259–299 (1990).<br /> * John Makhoul, &quot;A fast cosine transform in one and two dimensions,&quot; &#039;&#039;IEEE Trans. Acoust. Speech Sig. Proc.&#039;&#039; &#039;&#039;&#039;28&#039;&#039;&#039; (1), 27–34 (1980).<br /> * H. V. Sorensen, D. L. Jones, M. T. Heideman, and C. S. Burrus, &quot;Real-valued fast Fourier transform algorithms,&quot; &#039;&#039;IEEE Trans. Acoust. Speech Sig. Processing&#039;&#039; &#039;&#039;&#039;ASSP-35&#039;&#039;&#039;, 849–863 (1987).<br /> * Y. Arai, T. Agui, and M. Nakajima, &quot;A fast DCT-SQ scheme for images,&quot; &#039;&#039;Trans. IEICE&#039;&#039; &#039;&#039;&#039;71&#039;&#039;&#039; (11), 1095–1097 (1988).<br /> <br /> == 関連項目 ==<br /> * [[修正離散コサイン変換]] (MDCT)<br /> &lt;!--*{{planetmath reference|id=1469|title=discrete cosine transform}}--&gt;<br /> * [http://f-cpu.seul.org/whygee/dct_fc0/dct_fc0.html Some code in various forms]<br /> * [http://www.egr.msu.edu/waves/people/Ali_files/DCT_TR802.pdf The Discrete Cosine Transform (DCT): Theory and Application]<br /> {{データ圧縮}}<br /> {{DEFAULTSORT:りさんこさいんへんかん}}<br /> [[Category:信号処理]]<br /> [[Category:フーリエ解析]]<br /> [[Category:動画圧縮]]<br /> [[Category:数学に関する記事]]</div> 118.243.68.113
Warning: Cannot modify header information - headers already sent by (output started at /home/users/1/sub.jp-asate/web/wiki/extensions/HeadScript/HeadScript.php:3) in /home/users/1/sub.jp-asate/web/wiki/includes/WebResponse.php on line 46