..


スポンサーリンク

ファイルを圧縮する。 比較のためのアルゴリズムとソフトウェア。

によって書かれた記事ダミアーノベルダ
ページ1の2

さらに熟練ユーザーのために役立つことが最も一般的な操作の中で間違いなく圧縮を識別する 実際にこの取引を通じて、お使いのコンピュータ上の任意のファイルがハードディスクよりもメモリの一部を占有するように、復元することができます。 我々は、現在のところ、かなり低価格で利用できる大容量のハードドライブがあることをただし、観察、 圧縮プログラムの有用性が縮小に表示されるので。 しかし、これは性急な結論です。

実際には、例えば、受信と送信の時間を短縮するために、電子メールで送信する前に1つまたは複数のファイルを圧縮して面白いかもしれません。 また、面白いと実用的なだけでなく、単一の圧縮ファイルに複数のドキュメントを格納する機能送信して操作するより実用的。

しかし、 ファイルまたはファイルを圧縮するためにユーザーが使用できる主なオプションは何ですか 何が利用できるさまざまなソフトウェアを区別する? 私たちはこのように圧縮アルゴリズムの主な特徴を示す最初のソフトウェア圧縮の理論的な基盤を調べてみましょう

圧縮アルゴリズム

圧縮アルゴリズムの中で最初の区別は、ディスクスペースの削減は品質の損失を伴うされている品質と非可逆のアルゴリズムのいずれかを失うことなく、すなわち無損失アルゴリズム、、の間に識別することができます。 の場合の例:それは、品質の劣化を知覚することは難しい場合が多いMP3エンコードオーディオファイルのため。

最も広く使用されているアルゴリズムの中でも、疑いもなく"ハフマンアルゴリズム、"シャノンファノアルゴリズム"アルゴリズムのLempel、Zivとウェルチを識別する 理論的な説明に入るものではないが、我々は、圧縮技術の歴史をマークしている"ハフマンアルゴリズム、の主な特徴を調べる。

我々は、 シャノンファノとこのトピックに関するより具体的には、Lempel - Ziv - Welchのリンクのテクニックについての詳細に興味のある読者を参照してください。

ハフマンアルゴリズム

'S アルゴリズムはカテゴリハフマン ロスレスに属しているすなわち、品質の損失を導入していません。 我々は5つ小学校のステップで操作をscomporne:

  • 分析し、圧縮するファイルの基本要素の出現回数カウントされます:テキストファイル内の個々の文字画像ファイルピクセルを。
  • 2つの要素はそれらの両方を表す頻度の低いカテゴリにまとめています。 XとYは8倍を7回発生したのであれば、例えば、それは15の再発で、カテゴリXYを作成します。 一方、コンポーネントのXとYは、各協会に入力された要素として、それらを識別する別のマーカーを受け取ります
  • 次の二つの項目がファイルにそれほど頻繁に同定され、手順2で説明した同じ手順を使用して、新しいカテゴリとして置かれている。 グループは、XYはで、例えば、に入ると、新しいアソシエーションを形成XYZのカテゴリを切り替えることができます。 これが起こるとき、XとYは一意に圧縮ファイル内の2つの文字のそれぞれが生成される識別コードを延長協会で終わる新しい識別子が付けられます
  • 要素はめったにより頻繁でないしながら、ファイル内の要素まれ、その後の組み合わせでより頻繁に出現している内に、次の手順で、 ツリーはバイナリ枝のシリーズで構成されてために作成されます。 説明されたメカニズムによると、これは非圧縮ファイルでは珍しい要素が新連合のすべての要素を拡大している識別コードの長さは、関連付けられていることを意味します 要素はその識別コードをできるだけ短くなるように、協会の"ツリー内に存在しない代わりに、元のファイルのより頻繁に繰り返されます。
  • 圧縮されたファイルは元のファイルの各要素はソースドキュメント内のその要素の頻度に基づいてアソシエーションのチェーンの最後に生成されたコードを置き換える、生成されます。
圧縮の末尾にスペースのゲインは、しばしば繰り返されている要素は、彼らの通常のエンコーディングを占有しているより少ないスペースを占有する短いコードで識別されるという事実によるものである。 逆に圧縮されたファイル元のファイルの希少元素は、それらのそれぞれについて、 非圧縮ファイルで占有されているよりもかなり大きな面積を必要とする可能性のある長いコードを、受け取る

空間の代数和から最も頻繁にして、"ハフマンのアルゴリズムによって生成された圧縮比を得る最も珍しい長いのエンコーディングで失われた空間の短い符号化することによって得られる 以上のことから、それは悪い結果が要素の分布が均一であるときに得られる間、圧縮のこのタイプは、元のファイルのコンポーネントの周波数の違いがより広い、より効果的であることになる。

同じカテゴリの...
E -ラーニング
HTML(コース) HTML(コース)
29€からWeb用のマークアップ言語。
ウェブマスター上級(コース) ウェブマスター上級(コース)
プロのウェブマスターになる。 39€から。
ウェブマスターベース(ファースト) ウェブマスターベース(ファースト)
ゼロからWebサイトを作成します。 29€から開始。
スポンサーリンク