バックアップの構成要素の1つである、バックアップソフトの技術について解説する。特に古典的かつ基本的なテープメディアへのバックアップを想定して、バックアップソフトに実装されてきた機能を中心に見ていこう。
バックアップ(リカバリ)機能
まずは、バックアップソフトの中核機能となる、バックアップおよびリカバリについて説明しよう。このうちリカバリは、バックアップの手法(バックアップの取り方)に依存するので、ここでは一括してバックアップ手法として説明する。バックアップ手法は複数あり、それぞれに長所と短所があるため、それらを理解して使い分けなければならない。
1.フルバックアップ
フルバックアップ(Full Backup)は、すべてのファイルを毎回バックアップする手法である(図1)。データをリカバリする時は、最後の1回分のバックアップデータから書き戻す。
- 長所
- リカバリの手間と時間が最小である。また、メディアの管理やスケジューリングも単純になる。
- 短所
- バックアップの時間が長い。また、数世代分のバックアップデータを保存する場合は、大量のメディアが必要になる。
2.差分バックアップ
差分バックアップ(Differencial Backup)は、初回はフルバックアップを行ない、以降は変更されたファイル(差分)だけをバックアップする手法だ(図2)。実際には差分のバックアップ量が徐々に増大するため、一定の間隔でフルバックアップを行ない、フルバックアップとフルバックアップの間だけ差分バックアップを行なうという運用が多い。データをリカバリする時には、まずフルバックアップしたファイルを書き戻し、次に最新の差分バックアップを書き戻す。
- 長所
- フルバックアップよりもトータルのバックアップデータ量は少なくて済む。同様にバックアップ時間も短くなる。リカバリの手間は、増分バックアップよりは簡単である。
- 短所
- リカバリに2回分のバックアップデータ(当初バックアップ+最後に取った差分)が必要。差分のバックアップ量が徐々に増大する。
3.増分バックアップ
増分バックアップ(Incremental Backup)は、前回のバックアップ以降に変更されたファイル(増分)だけをバックアップする手法である(図3)。こちらも一定の間隔でフルバックアップを行なうことを前提にしている。データをリカバリする時には、まずフルバックアップしたファイルを書き戻し、次にバックアップした順に沿って(古い順に)ファイルを書き戻す。
- 長所
- 差分バックアップよりもトータルのバックアップデータ量は少なくて済む。同様にバックアップ時間も短くなる。
- 短所
- リカバリに使用するバックアップデータが多数になり、リカバリ時の手間と時間が最大である。また、バックアップデータを書き込んだメディアの管理も複雑。
4.合成バックアップ
合成バックアップ(Synthetic Full Backup)は合成完全バックアップとも呼ばれ、バックアップ対象のデータは増分バックアップと同じである。あるタイミンでフルバックアップを行ない、次回からは増分バックアップを行なう。増分バックアップが完了したら、すでに得られたバックアップデータを合成し、バックアップ対象のサーバの最新状態(ディスクイメージ)を作り出し、テープなどのメディアに書き出す。このメディアに記録されたデータは、毎回フルバックアップを行なって取得するデータと同等である(図4)。つまり、リカバリの手間や時間は、1.のフルバックアップと同じで済む。
- 長所
- トータルのバックアップデータ量が少なく、リカバリの手順や時間も最小。
- 短所
- バックアップ処理とは別にバックアップデータを合成する処理が発生し、サーバの負荷が高くなる。
OS標準のバックアップツールを含め、たいていのバックアップソフトは、基本的な手法である「フルバックアップ」と「差分バックアップ」の2種類を実装している。最近のソフトでは、「増分バックアップ」を実装することが多くなってきた。「合成バックアップ」は、高機能な商用ソフトで実装が進んでいる。
メディア管理機能
メディア管理とは、フルバックアップとそれ以降の増分または差分のサイクルのバックアップデータを書き出したメディアを正しく把握し、適切なサイクルでの再利用(上書き)を行なうことを指す。すなわち、メディアの不適切な再利用によりバックアップデータが失われるのを防ぎ、リカバリ可能な状態を維持する機能である。リカバリに際しては、適切なメディアを正しい順番で読み込んだり、オペレータに対して次に装着するメディアを指示する、といった機能も含まれる。
また、メディアの世代管理-複数世代のメディアを保管し、各世代を正しく識別することにより、複数のリカバリポイント(復旧時点)の用意も可能になる。世代管理を行なえば、ウイルスやハッキングなどによりシステム領域が汚染されても、クリーンな時点のシステムに戻すといった処理が可能になる。
複数世代のバックアップデータを保管すると、世代数に比例してメディアの量が増えるため、人的管理では間違いが生じやすくなり、バックアップソフトのメディア管理機能の重要性・必要性が増大する。
(次ページ、「バックアップはスケジューリングしよう」に続く)
この連載の記事
-
最終回
データセンター
バックアップを賢く行なうための設定チェック -
第11回
データセンター
シンプルなバックアップを試してみる -
第10回
データセンター
ホストから始まったバックアップの歴史を振り返る -
第9回
データセンター
サーバー仮想化環境では、どうバックアップする? -
第8回
データセンター
データを長期間安全に保護するアーカイブとは? -
第7回
データセンター
災害対策のためのバックアップを知ろう -
第6回
データセンター
ディスクバックアップを支える新しい技術とは? -
第5回
データセンター
バックアップメディアはテープからHDDへ -
第4回
データセンター
バックアップに使うメディアはどう選ぶ? -
第2回
サーバー・ストレージ
バックアップをするには何が必要なの? - この連載の一覧へ