Discover millions of ebooks, audiobooks, and so much more with a free trial

Only $11.99/month after trial. Cancel anytime.

画像圧縮: ビジュアルデータ最適化のための効率的なテクニック
画像圧縮: ビジュアルデータ最適化のための効率的なテクニック
画像圧縮: ビジュアルデータ最適化のための効率的なテクニック
Ebook119 pages14 minutes

画像圧縮: ビジュアルデータ最適化のための効率的なテクニック

Rating: 0 out of 5 stars

()

Read preview

About this ebook

画像圧縮とは


画像圧縮は、デジタル写真に適用されるデータ圧縮の一種であり、保存や保管に必要な費用の削減に役立ちます。 伝染 ; 感染。 他のタイプのデジタル データに使用される一般的なデータ圧縮アプローチと比較して、アルゴリズムで画像データの視覚的認識と統計的側面を利用して、より高い結果を提供することが可能です。


>どのようなメリットがあるか


(I) 次のトピックに関する洞察と検証:


第 1 章: 画像圧縮


第 2 章: データ圧縮


第 3 章: 共同写真専門家グループ


第 4 章: 非可逆圧縮


第 5 章: 可逆圧縮


第 6 章: ポータブルネットワークグラフィックス


第 7 章: 変換コーディング


第 8 章: 離散コサイン変換


第 9 章: 共同写真専門家グループ 2000


第 10 章: 圧縮アーティファクト


(II) 画像圧縮に関する一般のよくある質問に答えます。


(III) 多くの分野で画像圧縮が使用されている実際の例。


この本は、


専門家、学部生および大学院生、愛好家、愛好家、およびあらゆる種類の画像圧縮に関する基本的な知識や情報を超えたいと考えている人を対象としています。

Language日本語
Release dateApr 29, 2024
画像圧縮: ビジュアルデータ最適化のための効率的なテクニック

Related to 画像圧縮

Titles in the series (100)

View More

Related ebooks

Related articles

Reviews for 画像圧縮

Rating: 0 out of 5 stars
0 ratings

0 ratings0 reviews

What did you think?

Tap to rate

Review must be at least 10 words

    Book preview

    画像圧縮 - Fouad Sabry

    第1章:画像圧縮

    デジタル写真は、データ圧縮の一種である画像圧縮を使用して圧縮することで、サイズを小さくし、保存と転送のコストを下げることができます。他のデジタルデータに使用される一般的なデータ圧縮方法よりも優れた結果を得るために、アルゴリズムは視覚と画像データの統計的特徴を利用する場合があります。

    非可逆画像圧縮と可逆画像圧縮の両方が可能です。医用画像、製図、クリップアート、漫画の大部分は、長期保存のための可逆圧縮の恩恵を受けています。圧縮アーティファクトは、特に低ビットレートで作業する場合に、非可逆圧縮技術によって発生します。ビットレートの大幅な低下が望まれるが、品質の低下がわずか(多くの場合検出されない)で許容される場合は、非可逆アプローチが理想的です。これは、写真のような自然な写真の場合です。視覚的に可逆圧縮は、非可逆圧縮の形式を使用しており、知覚できないほどの品質低下をもたらします。

    損失を伴う圧縮技術:

    最もよく使用される手法は、変換コーディングです。

    非可逆圧縮の最も一般的なタイプは、離散コサイン変換(DCT)です。1974 年に Nasir Ahmed、T. Natarajan、K. R. Rao によって発明され、フーリエ変換を含む変換ファミリーに属します。離散コサイン変換のグループのコンテキストでは、DCT はしばしば DCT-II と呼ばれます (離散コサイン変換を参照)。ほとんどの場合、これは画像圧縮の最も効果的な方法です。

    最も広く使用されている非可逆形式であるJPEGは、最新のHEIFと同様にDCTを使用します。

    次に量子化とエントロピー符号化が続き、次に最新のウェーブレット変換が行われます。

    カラー量子化は、画像のカラーパレットを「代表的な」色相の小さなセットに縮小するプロセスです。圧縮されたイメージのヘッダーには、イメージの作成に使用された色を指定するカラー パレットが含まれています。カラーインデックスは、各ピクセルで単に参照されます。ポスタリゼーションを防ぐために、この手法はディザリングと並行して使用できます。

    GIFおよびPNGファイルで一般的に使用されるフルカラーパレットで、最大256色です。

    BTC、CCC、S2TC、S3TCでは、4x4ピクセルブロックごとに2色または4色のブロックパレットが採用されています。

    クロマサブサンプリングによる色空間の縮小。これは、画像内のクロミナンス情報の一部を平均化または除去することにより、人間の目が色の空間的明るさの変化よりも鋭敏に記録するという事実を利用します。

    フラクタル圧縮。

    多層パーセプトロン、畳み込みニューラルネットワーク、敵対的生成ネットワークなど、すべて機械学習の領域から、より現代的なアプリケーションで使用されています。

    可逆圧縮技術:

    PCX は既定でランレングス エンコードを使用しますが、BMP、TGA、および TIFF はすべてエンコードの代替モードとしてランレングス エンコードをサポートしています。

    エリア画像圧縮

    DPCMは予測コーディングを利用します。

    数学的符号化とハフマン符号化は、エントロピー符号化の最も一般的な 2 つの形式です。

    LZW は、GIF や TIFF で使用される一般的なアダプティブ辞書メソッドで、PNG、MNG、および TIFF ファイルで DEFLATE を使用します。

    チェーンコード

    拡散モデル

    画像圧縮の主な目的は、特定の圧縮率(またはビットレート)で可能な限り最高の品質を得ることです。

    ほとんどの場合、スケーラビリティの低下は、基になるビットストリームまたはファイルを (圧縮解除および再圧縮せずに) 操作して品質を犠牲にすることを意味します。プログレッシブ エンコードと埋め込みビットストリームは、スケーラビリティの別名です。ロスレスコーデックにもスケーラビリティがありますが、形状が異なり(多くの場合、粗いピクセルから細かいピクセルへのスキャン)、他の目的に使用されます。ダウンロード中に画像をプレビューしたり (Web ブラウザーなど)、リソース (データベースなど) にさまざまな品質のアクセスを提供したりすることは、どちらもスケーラビリティの大きなメリットがあります。スケーラビリティにはさまざまな種類があります。

    品質または複雑さの段階的なエスカレーション: ビットストリームを反復するたびに、再構築されたイメージの品質が向上します。

    イメージの高品質バージョンをエンコードするには、最初に低解像度バージョンをエンコードする必要があります。

    以前にエンコードされた白黒バージョンから色を段階的にエンコードします。

    関心のある領域によるコーディング。画像のさまざまな領域は、さまざまな品質レベルでエンコードされます。これにスケーリングする能力を追加することができます(これらの部分を最初にエンコードし、他の部分は後でエンコードします)。

    データに関するデータ。画像は、圧縮データに存在する可能性のあるメタデータの助けを借りて、閲覧、検索、および分類できます。色とテクスチャのデータ、プレビュー画像、作成者/著作権情報はすべて、このタイプのデータの例です。

    コンピューティング容量。圧縮方法には、さまざまなエンコードとデコードの計算要求があります。いくつかの高圧縮方法を実行するには、多くのCPUリソースが必要です。

    ピーク信号対雑音比は、圧縮技術の有効性を評価するために使用される一般的な指標です。これは、画像の非可逆圧縮によって生成されるノイズの量を定量化しますが、視聴者の主観的な評価は、それ以上ではないにしても、不可欠であると見なされる場合があります。

    現代のエントロピー符号化の先駆けであるシャノン・ファノ符号化は、1940年代後半に開発された「画像のデータ圧縮」です

    1974年1月、IEEE Trans. ComputersはNasir Ahmed、T. Natarajan、K. R. Raoによる「Discrete Cosine Transform」を90-93ページに掲載した。

    Maayan, Gilad David (2021年11月24日).人工知能ベースの画像圧縮の「最先端」。データの科学に向けて。2023年4月6日抽出。

    高品質のジェネレーティブ画像圧縮。2023年4月6日抽出。

    ^ Bühlmann, Matthias (2022年9月28日).

    安定した拡散法で画像を圧縮します。

    ミディアム。

    2022年11月2日閲覧

    バート、P.;アデルソン、E.(1983年4月1日)。ラプラシアンピラミッドは凝縮された画像コードです。通信, IEEE, 31(4), pp.532-540.DOI: 10.1109/TCOM.1983.1095851;引用SeerX:10.1.1.54.299;S2CID:8018433です。

    ^ シャオ、ダン;クロパッチ、ウォルターG

    (2010年2月3-5日)。

    Špaček、Libor;フラン、ヴォイチェフ(編)。

    不規則なラプラシアングラフのピラミッド (PDF).

    コンピュータビジョン冬季ワークショップ2010。

    Nové Hrady、チェコ共和国:チェコパターン認識協会。

    初版発行日:2013年5月27日(PDF)

    おかげで:クロードエルウッドシャノン(1948)。アルカテル・ルーセント(編)。「対人相互作用の数学的理論」 (PDF)。27(3-4)ベルシステムテクニカルジャーナル、379〜423、623〜656ページ。参考文献: hdl:11858/00-001M-0000-002C-4314-2;DOI: 10.1002/j.1538-7305.1948.tb01338.x.2011年5月24日よりオリジナル(PDF)をご覧いただけます。アクセス日:2019年4月21日。

    David Albert HuffmanによるA method for the creation of minimum-redundancy codesのオリジナル(PDF)版は、2005年10月8日にProceedings of the IRE, vol. 40, no. 9, pp. 1098-1101 (doi:10.1109/JRPROC.1952.273898)からアーカイブされました。

    参考文献: Hadamard transform image coding, William K. Pratt, Julius Kane, and Harry C. Andrews, Proceedings of the IEEE 57.1 (1969), pages 58-68.

    Nasir Ahmed (1991年1月).離散コサイン変換:その作成の背後にある物語。この記事を引用するには: Digital Signal Processing 1 (January): 4-5.

    T.81: REQUIREMENTS AND GUIDELINES FOR THE DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES (PDF) (英語)1992 年 9 月に CCITT に掲載されました。2000年8月18日、同日付のオリジナル(PDF)より取得。2019年7月12日にこれを入手!です。

    BT.com にJPEG画像形式の説明があります。2018年5月31日、BTグループ。2019年8月5日現在

    ^ "JPEG:なにそれ?気づかれない日用品」。2013年9月24日にThe Atlanticに掲載されました。2019年9月13日抽出。

    Chris Baraniuk (2015年10月15日).BBCニュースによると、「JPEGにコピー制限がかかる可能性がある」とのことです。2019年9月13日にBBCから取得

    The GIF Debate: A Programmer's Viewpoint」、1995 年 1 月 27 日。2015年5月26日より入手可能

    著者: L. Peter Deutsch (1996年5月).要約。DOI: 10.17487/RFC1951.DEFLATE 圧縮データ形式仕様バージョン 1.3。IETFです。ページ 1.セクションの要約。これを入手してください: 2014-04-23.

    参照: Taubman, David;マルセリン、マイケル(2012)。JPEG2000による画像圧縮の基本:推奨プラクティスと技術ガイドライン。ISBN: 9781461507994、Springer Science & Business Media発行

    ^ a b Unser、M;ブルー、T。

    (2003).

    JPEG2000ウェーブレット

    Enjoying the preview?
    Page 1 of 1