画像圧縮: ビジュアルデータ最適化のための効率的なテクニック
By Fouad Sabry
()
About this ebook
画像圧縮とは
画像圧縮は、デジタル写真に適用されるデータ圧縮の一種であり、保存や保管に必要な費用の削減に役立ちます。 伝染 ; 感染。 他のタイプのデジタル データに使用される一般的なデータ圧縮アプローチと比較して、アルゴリズムで画像データの視覚的認識と統計的側面を利用して、より高い結果を提供することが可能です。
>どのようなメリットがあるか
(I) 次のトピックに関する洞察と検証:
第 1 章: 画像圧縮
第 2 章: データ圧縮
第 3 章: 共同写真専門家グループ
第 4 章: 非可逆圧縮
第 5 章: 可逆圧縮
第 6 章: ポータブルネットワークグラフィックス
第 7 章: 変換コーディング
第 8 章: 離散コサイン変換
第 9 章: 共同写真専門家グループ 2000
第 10 章: 圧縮アーティファクト
(II) 画像圧縮に関する一般のよくある質問に答えます。
(III) 多くの分野で画像圧縮が使用されている実際の例。
誰 この本は、
専門家、学部生および大学院生、愛好家、愛好家、およびあらゆる種類の画像圧縮に関する基本的な知識や情報を超えたいと考えている人を対象としています。
Related to 画像圧縮
Titles in the series (100)
カラープロファイル: コンピューター ビジョンにおける視覚認識と分析の探求 Rating: 0 out of 5 stars0 ratingsキャニーエッジ検出器: 視覚認識の芸術を明らかにする Rating: 0 out of 5 stars0 ratingsコンピュータビジョン: コンピュータービジョンの深部を探る Rating: 0 out of 5 stars0 ratingsコンピュータステレオビジョン: コンピュータービジョンにおける奥行き知覚の探求 Rating: 0 out of 5 stars0 ratings水中コンピュータビジョン: 波の下でコンピューター ビジョンの深さを探索する Rating: 0 out of 5 stars0 ratingsノイズ減少: 明瞭度の向上、コンピュータ ビジョンのノイズ低減のための高度な技術 Rating: 0 out of 5 stars0 ratingsトーンマッピング: トーン マッピング: コンピューター ビジョンにおける視点を照らす Rating: 0 out of 5 stars0 ratingsヒストグラム均等化: 画像のコントラストを強化して視覚認識を強化 Rating: 0 out of 5 stars0 ratings人間の視覚系モデル: 知覚と処理を理解する Rating: 0 out of 5 stars0 ratings画像圧縮: ビジュアルデータ最適化のための効率的なテクニック Rating: 0 out of 5 stars0 ratingsガンマ補正: コンピューター ビジョンの視覚的な鮮明さを高める: ガンマ補正技術 Rating: 0 out of 5 stars0 ratingsカラーマネジメントシステム: デジタル環境における視覚認識の最適化 Rating: 0 out of 5 stars0 ratingsラドン変換: ビジュアルデータに隠されたパターンを明らかにする Rating: 0 out of 5 stars0 ratingsアフィン変換: 視覚的な視点を解き放つ: コンピューター ビジョンにおけるアフィン変換の探索 Rating: 0 out of 5 stars0 ratingsハリスコーナーディテクター: 画像特徴検出の魔法を明らかにする Rating: 0 out of 5 stars0 ratingsアダマール変換: コンピューター ビジョンにおけるアダマール変換の力を明らかにする Rating: 0 out of 5 stars0 ratings異方性拡散: 異方性拡散による画像解析の強化 Rating: 0 out of 5 stars0 ratings画像ヒストグラム: 視覚的な洞察を明らかにし、コンピューター ビジョンの画像ヒストグラムの深さを探る Rating: 0 out of 5 stars0 ratingsエッジ検出: コンピュータービジョンの境界を探索する Rating: 0 out of 5 stars0 ratingsレティネックス: レティネックスでコンピュテーショナル ビジョンの秘密を明らかにする Rating: 0 out of 5 stars0 ratings最小二乗: コンピュータビジョンの最適化手法: 最小二乗法 Rating: 0 out of 5 stars0 ratings修復: コンピュータビジョンにおけるギャップを埋める Rating: 0 out of 5 stars0 ratings共同写真専門家グループ: 共同写真専門家グループ規格でビジュアルデータの力を解き放つ Rating: 0 out of 5 stars0 ratingsフィルターバンク: コンピューター ビジョンのフィルター バンク技術に関する洞察 Rating: 0 out of 5 stars0 ratings視覚: 計算による視覚処理に関する洞察 Rating: 0 out of 5 stars0 ratingsホモグラフィー: ホモグラフィー: コンピューター ビジョンの変換 Rating: 0 out of 5 stars0 ratings適応フィルタ: 適応フィルタリングによるコンピュータビジョンの強化 Rating: 0 out of 5 stars0 ratingsアクティブコンター: アクティブコンター技術によるコンピュータービジョンの進歩 Rating: 0 out of 5 stars0 ratingsハフ変換: コンピューター ビジョンにおけるハフ変換の魔法を明らかにする Rating: 0 out of 5 stars0 ratings色空間: コンピューター ビジョンのスペクトルを探索する Rating: 0 out of 5 stars0 ratings
Related ebooks
カラープロファイル: コンピューター ビジョンにおける視覚認識と分析の探求 Rating: 0 out of 5 stars0 ratings画像ヒストグラム: 視覚的な洞察を明らかにし、コンピューター ビジョンの画像ヒストグラムの深さを探る Rating: 0 out of 5 stars0 ratingsデジタルラスターグラフィックス: コンピューター ビジョンにおけるデジタル ラスター グラフィックスの威力を明らかにする Rating: 0 out of 5 stars0 ratingsビデオコンテンツ分析: ビジュアルデータから洞察を引き出す Rating: 0 out of 5 stars0 ratingsデジタルビデオフィンガープリンティング: ビジュアルデータのセキュリティと識別を強化する Rating: 0 out of 5 stars0 ratingsシェーダ: シェーダーによる視覚領域の探索: コンピューター ビジョンへの旅 Rating: 0 out of 5 stars0 ratings文脈に応じた画像分類: 効果的な分類のための視覚データの理解 Rating: 0 out of 5 stars0 ratingsデータ圧縮: データ圧縮によるコンピュータ ビジョンの効率性の解放 Rating: 0 out of 5 stars0 ratingsコンテンツベースの画像検索: ビジュアルデータベースのロックを解除する Rating: 0 out of 5 stars0 ratingsハイダイナミックレンジレンダリング: 視覚スペクトルのロックを解除: コンピューター ビジョンの高度なテクニック Rating: 0 out of 5 stars0 ratings共同写真専門家グループ: 共同写真専門家グループ規格でビジュアルデータの力を解き放つ Rating: 0 out of 5 stars0 ratings画像コレクションの探索: コンピュータービジョンにおけるビジュアルランドスケープを明らかにする Rating: 0 out of 5 stars0 ratingsカラーマネジメントシステム: デジタル環境における視覚認識の最適化 Rating: 0 out of 5 stars0 ratingsビサージュ・ソフトウェア開発キット: 顔立ち ソフトウェア開発キット でコンピューター ビジョンのイノベーションを強化 Rating: 0 out of 5 stars0 ratingsガンマ補正: コンピューター ビジョンの視覚的な鮮明さを高める: ガンマ補正技術 Rating: 0 out of 5 stars0 ratings赤信号カメラ: コンピューター ビジョン アプリケーションの探求: 赤色灯カメラの視点 Rating: 0 out of 5 stars0 ratingsブロブの検出: ビジュアルデータのパターンを明らかにする Rating: 0 out of 5 stars0 ratings自動光学検査: コンピュータービジョンテクノロジーの進歩 Rating: 0 out of 5 stars0 ratings最小二乗: コンピュータビジョンの最適化手法: 最小二乗法 Rating: 0 out of 5 stars0 ratings技術的な図面: 製図を通じてコンピューター ビジョンを解き放つ Rating: 0 out of 5 stars0 ratingsスマートカメラ: コンピュータービジョンによる視覚認識の革命 Rating: 0 out of 5 stars0 ratingsピープルカウンター: ビジュアル分析を通じて洞察を引き出す Rating: 0 out of 5 stars0 ratingsシェーディング: コンピューター ビジョンにおける画像シェーディングの探求 Rating: 0 out of 5 stars0 ratings歩行者検知: 「コンピュータ ビジョン」の範囲内で「歩行者検知」というタイトルの本の副題を提案してください。提案されたサブタイトルには「:」を含めないでください。 Rating: 0 out of 5 stars0 ratings限界費用: 限界費用をマスターする、賢い経済学の鍵 Rating: 0 out of 5 stars0 ratings2次元幾何モデル: コンピュータビジョンの理解と応用 Rating: 0 out of 5 stars0 ratings交通取締カメラ: 交通取締カメラのコンピュータビジョンの進歩 Rating: 0 out of 5 stars0 ratings3次元コンピュータグラフィックス: ビジョンと仮想世界の交差点を探索する Rating: 0 out of 5 stars0 ratingsカラーマッピング: コンピューター ビジョンにおける視覚認識と分析の探求 Rating: 0 out of 5 stars0 ratingsピラミッド画像処理: 視覚分析の深さを探る Rating: 0 out of 5 stars0 ratings
Reviews for 画像圧縮
0 ratings0 reviews
Book preview
画像圧縮 - Fouad Sabry
第1章:画像圧縮
デジタル写真は、データ圧縮の一種である画像圧縮を使用して圧縮することで、サイズを小さくし、保存と転送のコストを下げることができます。他のデジタルデータに使用される一般的なデータ圧縮方法よりも優れた結果を得るために、アルゴリズムは視覚と画像データの統計的特徴を利用する場合があります。
非可逆画像圧縮と可逆画像圧縮の両方が可能です。医用画像、製図、クリップアート、漫画の大部分は、長期保存のための可逆圧縮の恩恵を受けています。圧縮アーティファクトは、特に低ビットレートで作業する場合に、非可逆圧縮技術によって発生します。ビットレートの大幅な低下が望まれるが、品質の低下がわずか(多くの場合検出されない)で許容される場合は、非可逆アプローチが理想的です。これは、写真のような自然な写真の場合です。視覚的に可逆圧縮は、非可逆圧縮の形式を使用しており、知覚できないほどの品質低下をもたらします。
損失を伴う圧縮技術:
最もよく使用される手法は、変換コーディングです。
非可逆圧縮の最も一般的なタイプは、離散コサイン変換(DCT)です。1974 年に Nasir Ahmed、T. Natarajan、K. R. Rao によって発明され、フーリエ変換を含む変換ファミリーに属します。離散コサイン変換のグループのコンテキストでは、DCT はしばしば DCT-II
と呼ばれます (離散コサイン変換を参照)。ほとんどの場合、これは画像圧縮の最も効果的な方法です。
最も広く使用されている非可逆形式であるJPEGは、最新のHEIFと同様にDCTを使用します。
次に量子化とエントロピー符号化が続き、次に最新のウェーブレット変換が行われます。
カラー量子化は、画像のカラーパレットを「代表的な」色相の小さなセットに縮小するプロセスです。圧縮されたイメージのヘッダーには、イメージの作成に使用された色を指定するカラー パレットが含まれています。カラーインデックスは、各ピクセルで単に参照されます。ポスタリゼーションを防ぐために、この手法はディザリングと並行して使用できます。
GIFおよびPNGファイルで一般的に使用されるフルカラーパレットで、最大256色です。
BTC、CCC、S2TC、S3TCでは、4x4ピクセルブロックごとに2色または4色のブロックパレットが採用されています。
クロマサブサンプリングによる色空間の縮小。これは、画像内のクロミナンス情報の一部を平均化または除去することにより、人間の目が色の空間的明るさの変化よりも鋭敏に記録するという事実を利用します。
フラクタル圧縮。
多層パーセプトロン、畳み込みニューラルネットワーク、敵対的生成ネットワークなど、すべて機械学習の領域から、より現代的なアプリケーションで使用されています。
可逆圧縮技術:
PCX は既定でランレングス エンコードを使用しますが、BMP、TGA、および TIFF はすべてエンコードの代替モードとしてランレングス エンコードをサポートしています。
エリア画像圧縮
DPCMは予測コーディングを利用します。
数学的符号化とハフマン符号化は、エントロピー符号化の最も一般的な 2 つの形式です。
LZW は、GIF や TIFF で使用される一般的なアダプティブ辞書メソッドで、PNG、MNG、および TIFF ファイルで DEFLATE を使用します。
チェーンコード
拡散モデル
画像圧縮の主な目的は、特定の圧縮率(またはビットレート)で可能な限り最高の品質を得ることです。
ほとんどの場合、スケーラビリティの低下は、基になるビットストリームまたはファイルを (圧縮解除および再圧縮せずに) 操作して品質を犠牲にすることを意味します。プログレッシブ エンコードと埋め込みビットストリームは、スケーラビリティの別名です。ロスレスコーデックにもスケーラビリティがありますが、形状が異なり(多くの場合、粗いピクセルから細かいピクセルへのスキャン)、他の目的に使用されます。ダウンロード中に画像をプレビューしたり (Web ブラウザーなど)、リソース (データベースなど) にさまざまな品質のアクセスを提供したりすることは、どちらもスケーラビリティの大きなメリットがあります。スケーラビリティにはさまざまな種類があります。
品質または複雑さの段階的なエスカレーション: ビットストリームを反復するたびに、再構築されたイメージの品質が向上します。
イメージの高品質バージョンをエンコードするには、最初に低解像度バージョンをエンコードする必要があります。
以前にエンコードされた白黒バージョンから色を段階的にエンコードします。
関心のある領域によるコーディング。画像のさまざまな領域は、さまざまな品質レベルでエンコードされます。これにスケーリングする能力を追加することができます(これらの部分を最初にエンコードし、他の部分は後でエンコードします)。
データに関するデータ。画像は、圧縮データに存在する可能性のあるメタデータの助けを借りて、閲覧、検索、および分類できます。色とテクスチャのデータ、プレビュー画像、作成者/著作権情報はすべて、このタイプのデータの例です。
コンピューティング容量。圧縮方法には、さまざまなエンコードとデコードの計算要求があります。いくつかの高圧縮方法を実行するには、多くのCPUリソースが必要です。
ピーク信号対雑音比は、圧縮技術の有効性を評価するために使用される一般的な指標です。これは、画像の非可逆圧縮によって生成されるノイズの量を定量化しますが、視聴者の主観的な評価は、それ以上ではないにしても、不可欠であると見なされる場合があります。
現代のエントロピー符号化の先駆けであるシャノン・ファノ符号化は、1940年代後半に開発された「画像のデータ圧縮」です。
1974年1月、IEEE Trans. ComputersはNasir Ahmed、T. Natarajan、K. R. Raoによる「Discrete Cosine Transform」を90-93ページに掲載した。
Maayan, Gilad David (2021年11月24日).人工知能ベースの画像圧縮の「最先端」。データの科学に向けて。2023年4月6日抽出。
高品質のジェネレーティブ画像圧縮。2023年4月6日抽出。
^ Bühlmann, Matthias (2022年9月28日).
安定した拡散法で画像を圧縮します。
ミディアム。
2022年11月2日閲覧。
バート、P.;アデルソン、E.(1983年4月1日)。ラプラシアンピラミッドは凝縮された画像コードです。通信, IEEE, 31(4), pp.532-540.DOI: 10.1109/TCOM.1983.1095851;引用SeerX:10.1.1.54.299;S2CID:8018433です。
^ シャオ、ダン;クロパッチ、ウォルターG
(2010年2月3-5日)。
Špaček、Libor;フラン、ヴォイチェフ(編)。
不規則なラプラシアングラフのピラミッド
(PDF).
コンピュータビジョン冬季ワークショップ2010。
Nové Hrady、チェコ共和国:チェコパターン認識協会。
初版発行日:2013年5月27日(PDF)
おかげで:クロードエルウッドシャノン(1948)。アルカテル・ルーセント(編)。「対人相互作用の数学的理論」 (PDF)。27(3-4)ベルシステムテクニカルジャーナル、379〜423、623〜656ページ。参考文献: hdl:11858/00-001M-0000-002C-4314-2;DOI: 10.1002/j.1538-7305.1948.tb01338.x.2011年5月24日よりオリジナル(PDF)をご覧いただけます。アクセス日:2019年4月21日。
David Albert HuffmanによるA method for the creation of minimum-redundancy codes
のオリジナル(PDF)版は、2005年10月8日にProceedings of the IRE, vol. 40, no. 9, pp. 1098-1101 (doi:10.1109/JRPROC.1952.273898)からアーカイブされました。
参考文献: Hadamard transform image coding,
William K. Pratt, Julius Kane, and Harry C. Andrews, Proceedings of the IEEE 57.1 (1969), pages 58-68.
Nasir Ahmed (1991年1月).離散コサイン変換:その作成の背後にある物語。この記事を引用するには: Digital Signal Processing 1 (January): 4-5.
T.81: REQUIREMENTS AND GUIDELINES FOR THE DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES
(PDF) (英語)1992 年 9 月に CCITT に掲載されました。2000年8月18日、同日付のオリジナル(PDF)より取得。2019年7月12日にこれを入手!です。
BT.com にJPEG画像形式の説明があります。2018年5月31日、BTグループ。2019年8月5日現在。
^ "JPEG:なにそれ?気づかれない日用品」。2013年9月24日にThe Atlanticに掲載されました。2019年9月13日抽出。
Chris Baraniuk (2015年10月15日).BBCニュースによると、「JPEGにコピー制限がかかる可能性がある」とのことです。2019年9月13日にBBCから取得。
The GIF Debate: A Programmer's Viewpoint」、1995 年 1 月 27 日。2015年5月26日より入手可能。
著者: L. Peter Deutsch (1996年5月).要約。DOI: 10.17487/RFC1951.DEFLATE 圧縮データ形式仕様バージョン 1.3。IETFです。ページ 1.セクションの要約。これを入手してください: 2014-04-23.
参照: Taubman, David;マルセリン、マイケル(2012)。JPEG2000による画像圧縮の基本:推奨プラクティスと技術ガイドライン。ISBN: 9781461507994、Springer Science & Business Media発行。
^ a b Unser、M;ブルー、T。
(2003).
JPEG2000ウェーブレット