2001年3月26日
センター側(計算科学センターと新システム担当会社 IBM)が行なう、旧共通計算 機から新共通計算機へのデータの移行作業の概要は以下の通りである。
旧システム上にあるユーザ用のデータには次のようなものがある。
(1)D1:ユーザ・ディスク領域にあるデータ
総使用量 (GB) | 移行申告総量 (GB) | |
ccce | 67 | 16.1 |
ccps | 262 | 76.9 |
ccjlc | 75 | 58.2 |
ccint | 17 | 7.8 |
ccth | 66 | 55.3 |
ccmaf | 22 | 14.1 |
ccbsf | 12 | 9.6 |
合計 | 521 GB | 238.0 GB |
(2)D2:階層型ファイル・システム(VBFS)上のデータ
総使用量 (GB) | 移行申告総量 (GB) | |
ce | 163 | 14.5 |
jlc | 943 | 570.3 |
int | 140 | 44.2 |
ps | 994 | 496.0 |
合計 | 2240 GB | 1125.0 GB |
(3)D3:テープ上のデータ(MT直接アクセスにより作成されたデータ)
D3B:tar 等で作成されたデータ(基本的にカタログを利用しない)
D3AとD3Bを合わせて計510本
(ライブラリ内 300本、排出済み 210本)
D2およびホーム・ディレクトリのバックアップに使われている
130本(ライブラリ内にある)を加えると
総計640本のテープがある。
(4)D4:メイル・スプールにあるデータ
- 必要な部分はユーザ各自でホームディレクトリ等に移動しておくこと。
移動しても通常はメイルは他人に読めないようになっているので、
そのままだと移行の対象とならないので注意する。
この文書ではこれ以降D4データについては触れない。
(1)移行データの移行経路
新システムの一部が先行して10月初旬に搬入され、この中の3ノードの計算
機をデータ移行作業に使用する。この移行用システムは DTF ドライブ1台を
有しており、またこのシステムの上に IBM 3590 テープを2次媒体とする階層
型ファイル・システム(HSM ファイル・システム:TSM)3式が構築される。
移行データ(D1、D2)は旧システムからネットワーク経由でこの移行用シ
ステムへ転送される。また旧システムで磁気テープに直接書き出されたデータ
(D3)は、その一部は移行用システムの DTF ドライブ経由で移行用システ
ムに移され、その他は本運用開始後に新システムに接続された DTF ドライブ
を使って新システムに移行される。後者の段階で DTF ドライブが4台暫定的
に増設され、ドライブ数は計5台となる。
この移行システムの HSM に蓄積された移行のためのデータは、最終的に、
ディスク・キャッシュ部分は 8mm テープ等にコピーしてそれを物理的に移動
することにより、また2次媒体部分は 3590 テープそのものを物理的に移動す
ることにより、新システムで暫定的に用意された階層型ファイル・システム
(HSM ファイル・システム:TSM)へ移動される。さらに移行データはこの
HSM からデータサーバの特定のディスク領域に移動される。この移動が完了し
た時点で、暫定設置の HSM は撤去される。運用開始時点では、ユーザは特定
のディスク領域に保管された移行データを参照することになる。
移行されたデータは一定期間保管される。ユーザは必要に応じ、移行データ保
管場所から所望部分を自分のホーム・ディレクトリや HPSS(新システムのも
う一つの階層記憶システム)領域等へコピーして使用する。
なお、移行用システムは12月下旬には解体され、新システムの運用開始後は
開発システムとして使用される。ただし移行用システムに接続されていた DTF
ドライブは、その後もデータ移行作業に使用される。
(2)ネットワーク経由でのデータ転送
れネットワーク・パスを設定し、そこを通してデータの転送を行なう。こうし
てネットワーク・クラスタをまたがるデータの流れはないようにし、ネット
ワークへの負荷を軽減する。データの転送にはネットワーク・ユティリティを
使用する。特にD2データの転送には NFS を使用し、移行用システムの HSM
ファイル・システムを旧システムから NFS マウントする形態をとる。
(3)D2データの移行
migrate-in の頻発による旧システムの極端な性能低下を防ぐため、特別の
ツール(recover_tape)を使うことにし、2次媒体のテープに存在するファイ
ルをテープから直接ディスクへ展開する方式を取る。これを行なう際には当該
ファイル・システムの運用を一時停止することになる。展開先は NFS マウン
トした移行用システムの HSM ファイル・システムである。なおこの展開作業
は旧システムの担当会社(日立)が行なう。
(4)D3データの移行
リからテープを排出し、これを物理的に移行システムまたは新システムへ移動
し、それぞれの DTF テープ・ドライブへマウントして読み込む方法をとる。
その際、旧システム上のテープ・ボリューム情報およびテープ・ファイル情報
を移行システムおよび新システムに転送しておき、これによりテープ・ボ
リュームの所有者情報と属性情報を再構成し、テープ・ファイルのファイル
名、作成日付、参照日付を再構成できるようなツールを用意する。
なお、新システムでユーザが使用可能な DTF ドライブ(DTF-1)は1台であ
り、オープン利用室の I/O サーバに接続される。
(5)データ移行の範囲
グループ・ディスク等については、クラスタ運用責任者から移行対象パスと
して申告されたものを移行対象とする。しかしホーム・ディレクトリについ
ても、その所在が明確でない場合もあるので、クラスタ運用責任者に申告し
て頂くこととする。
(注意)所有者以外の者が参照できないようなファイルやディレクトリは、
今回の移行の対象とならない。(後の4(1)を参照のこと。)
象とする。
返却する。また既に排出すみのテープが210本ほどあると思われる。これ
らは本来所有者がすべて保管している筈のものであるが、引き取りがなされ
ないままセンターが保管しているものも60本ほどある。今回この分もあわ
せて所有者に返却する。センターが行なうコピー作業がすべて終了した後、
関係者にテープ引き取りの連絡をするので速やかに引き取っていただく。
これら返却されたテープまたは返却予定のテープの中から、所有者の判断に
より移行対象テープが決まることになる。
なお、D2データ用に使われていた2次媒体としてのテープ、およびホーム
・ディレクトリのバックアップに使用していたテープ、計130本はセン
ターで処分する。
センター側は関係するクラスタ運用責任者と相談し、全テープから利用度の
高いテープ20本(クラスT1)と、その次に利用度の高いテープ約245
本(クラスT2)を選択し、これら(計265本)についてはセンター側で
移行作業を行うこととする。
その他のテープ約245本(クラスT3)については、ユーザが必要に応
じ、自らドライブにテープを装着してデータの移行を行なうこととする。
(1)移行開始日
する。
なお、移行開始日以降に更新されたデータの移行はユーザ責任とする。
テムの運用停止日は12月15(金)である。一度移行対象データのすべて
を採取し、その後2日の周期で運用停止日まで、差分データを採取する。し
かし最後の回の差分データ採取が完結しない場合はそこで採取を打ち切る。
旧システムから移行システムへのデータ移行の結果を下記に記す。
http://cetrncw.kek.jp/dtran/chkdiskf.htm
ccjlc, ccint, ccps の4個の VBFS 運用クラスタについて、2〜3個のク
ラスタを同時に移行作業対象とする。
任意の時点で、その時移行作業が行なわれている VBFS ファイル・システム
の名前をユーザが参照できるように、また作業予定が分かるように、セン
ター側でこれらの情報を下記の WEB ページに掲載しておく。
http://kekcc.kek.jp/guide/next/trans/VBFS-current.html
また旧システムから移行システムへのデータ移行の結果を下記に記す。
http://www.cc.kek.jp/tebiki/ccriyou/dtfres.html
日に、テープのライブラリからの搬出を開始する。排出後、前記T1クラス
の20本については、その日の内に移行システム上に運びコピー作業を行な
い、新システムの本運用開始時に参照可能にする。
T1クラスのテープで、2GB以上の大きさのファイルを含むテープについ
ては、システム構成の都合上、T2クラスの先頭部分に移動し、その位置に
あるT2クラスのテープをT1クラスの末尾に編入する。(結果的にこのよ
うな置換が3本のテープについて行なわれている。)
残りのT2、T3クラスのテープ・データの移行は新システムの本運用開始
後に行なうこととする。前述の通り、T2テープの移行はセンターで行な
い、T3テープの移行は必要に応じユーザが行なう。センター側では、 DTF
ドライブ4台を占有してT2テープの移行作業を行なう。
(2)移行データの参照開始日等
テムの特定のディスク領域に置かれる。ユーザはこれを参照し、必要なもの
を各自のホーム・ディレクトリその他にコピーして使用する。これが可能と
なるのは本運用開始日(2001年1月19日)である。
クラスの約165本とに分け、この順で移行を行なう。これらについては、
あらかじめクラスタ運用責任者にテープの移行作業優先順位と移行先を指定
してもらい、本運用開始後、その順位にしたがってセンター側が直接ユーザ
指定の HPSS 領域にコピーする。
T2Aテープは2月初旬までに移行を終了し、T2Bテープは2月末までに
移行を終了する予定である。
T2テープの移行作業中も、ユーザはオープン利用室で DTF ドライブ1台
を使用できる。
室の DTF ドライブを使って移行を行なう。
システムの UNIX 環境のそれらが継承される。
D1およびD2データの参照パス
基本パス: /:/dtran/<cluster-name>/<dfs-path>
シンボリック・リンクによるパス:
(例)旧 ccjlc クラスタの /:/ea2/vtx/xxxxxx の場合
基本パス: /:/dtran/ccjlc/ea2/vtx/xxxxxx
シンボリック・リンクによるパス:
(実は ln -s /:/dtran/ccjlc/ea2 /:/dtran/ccjlc/ccjlc3/raid/ea2)
D3(T1)データの参照パス
基本パス: /:/dtran/d3/<DTF-volume-id>/<file-name>
シンボリック・リンクによるパス:
(例)旧システムの DTF テープ T-AI011 のファイル file01 場合
基本パス: /:/dtran/d3/T-AI011/file01
(3)移行データの保管期限
までとする。その後廃棄する。
いて資源の競合が厳しい状況に至った場合、このデータ領域を他に解放する
こととする。したがって当該データについては、できるだけ早期に所定の
ファイル領域へのコピーを完了して欲しい。
(1)移行対象とならないファイル
対象に含めるには、所定の属性ビット列に r, x を移行開始日までに設定して
おく必要があるが、これはセキュリティ等を十分考慮したうえで行なうべきで
ある(注)。
ファイルやディレクトリ。
(2)移行開始日以降に更新されたファイルについては、それの移行にセンター側
は責任を負わない。
(3)限られた時間内に大量のデータを移行する必要があり、センター側は上記
データの移行についてその完全性を保証できない。現在のところ、全ファイル
についてその存在の確認と容量の照合を行なうことまでが限度である。
重要度の高いディスク・データ(D1データ)については、ユーザ自らがネッ
トワーク経由で、各自のワークステーションまたはパソコンに接続された記憶
媒体にバックアップを取っておくことが望ましい。
また機密度の高いデータについても、同様にユーザ自らが移行を行なって欲しい。
(4)移行作業に伴い、それが惹起する旧システムへの負荷のため、旧システムの
運用に悪影響が生じ得る。またD2データ(VBFS データ)の移行作業時のよ
うに、明らかに運用を制限しなければならない状況もある。この点、ユーザの
方々の理解と協力が必要である。
(注)r, x を属性の others ビット列に設定するには次のようにするとよい。
% find <path-name> -type d -print | xargs chmod o+rx
読まれてはならないファイルなどがこの操作の対象にならないないようにす
る。特にホーム・ディレクトリの先頭からこれを行なうのは、きわめて危険で
ある。