日本語HOME > 英語HOME > GEO Gridとは > 技術詳細 > デザインコンセプト

地球を知るために地球をつなぐ

地球規模の問題解決へのIT の貢献
温暖化に代表される地球に関わる社会的問題は、全地球規模での問題解決が考えられなければなりません。このためには、さまざまな形での地球に関する知識の蓄積と科学的手法による正確な理解が必要です。
産総研の地質分野には綿密な調査に基づいて作成された地質図や衛星からのリモートセンシングによる膨大な地球観測データの蓄積があります。また、地球観測網の整備により日々刻々とデータが蓄積されており、インターネットを通じて全世界からアクセスが可能です。しかし、私たちはこうした膨大なデータの洪水に溺れているのではないでしょうか。しかも一方で必要なときに必要なものが見つからないというデータの渇水状態でもあるのではないでしょうか。
GEO Grid では地球観測に関わる多種多様なデータを研究コミュニティや事業者が安全・安心に利用できるIT環境を提供することで、地球科学に関わるさまざまな社会的問題に対して高度なIT利活用による貢献を目指しています。

地球観測のIT 環境に求められる要件
さて、このようなIT環境を実現するには、次のような技術的な要件を解決しなければなりません。

大規模データの提供
衛星からのリモートセンシングデータはその運用期間を通じると200テラバイト以上の容量になります(衛星TERRAに搭載されたセンサASTERの場合)。衛星ALOS搭載のPALSARではデータ量はさらに上がり、ASTERの10倍を超えます。

多様なデータの取り扱い
地球観測に関わるデータは多岐にわたります。衛星からの観測データ以外にも、例えば温度、水蒸気量、雲量といったさまざまな物理量のデータや地形、土地被覆、地質、都市情報といった地図データがあります。これらはそれぞれ異なる時空間分解能で得られ、異なる書式で蓄積されています。

データ提供ポリシの尊重
データには利用に制限が掛からないフリーなものも存在します。しかし、一般的にその所有者はデータアクセスの許可範囲、データ書式の選択、二次利用の可否、など利用許諾権とその条件を設定・変更する権限をもっています。

大規模シミュレーションとの統合
データはそのままでは価値を生みません。データの形式変更や事前処理などの簡便な計算からデ ータに基づいた火砕流到達範囲の計算、二酸化炭素収支量の計算、地震探鉱といった大規模シミュレーションや都市地下地質構造のモデル化などが可能な環境でなければなりません。

多様なコミュニティの支援
地球観測には災害監視、資源探査を始め地球科学に関係する多様なコミュニティや多数のプロジェクトがあり、柔軟な構成変更も求められています。同一のグループにおいては共通に利用できるツールやテンプレートになった処理フローなどを共有、相互利用できるようにする必要があります。

なぜグリッド技術が注目されるのか
平成14年に発足した産総研グリッド研究センターではビジネスや科学技術を支える次世代IT環境構築に関わる研究を行ってきました。グリッド技術は組織の壁、距離の壁、データの種類の壁などを乗り越える高度なネットワーク利用技術です。このようなグリッド技術がもつ基本的な機能は極めて素直に地球観測を支援するIT 環境構築に適用できることが判りました。ユーザ(コミュニティ)の要望に応じて地球上に分散された観測データやシミュレーションを実行するコンピュータを適切に組み合わせる事により、ユーザ主導でやりたいことを簡単に実現するIT環境を提供します。
具体的にGEO Grid の設計を見てみます(図)。まず、大規模データの提供においてはストレージグリッドを用います。多数の安価なディスク装置を内蔵するPC サーバをネットワークで接続し、仮想的に1台の大規模ストレージとしてデータを格納します。次に多様なデータの取り扱いにはデータグリッドを用います。データを類型に整理することで、統一的な検索や結果の提供が可能となります。この場合でもデータ提供側は基本的に変更する必要はありません。メタデータと呼ばれるデータのスキーマ(書式やアクセス方法)はデータ所有者から提供されますが、利用する側で分散管理します。また、グリッドにおける厳密な認証により利用者を峻別します。実際に誰がアクセスしているか把握できるため、データ提供のポリシを遵守したきめ細やかな認可を行います。もちろん、シングルサインオン機能によりログイン(認証)を個別に行う必要がありません。シミュレーションとの統合はグリッドが最も得意とするところです。特に大規模シミュレーションでは計算サーバの確保やそのサーバに対してデータを直接転送する機能などを提供します。グリッドにおいては仮想組織(VO: Virtual Organization)という考えがあります。技術的には「実体はネットワークで接続された複数の異なる管理ドメイン(例えばユーザアカウントを付与する組織)に跨った計算資源(コンピュータやデータ)群を束ねた仮想的な管理ドメイン」のことです。異なるVO間ではプライバシは確保されます。コミュニティごとにVOを作り研究や事業の推進を支援します。将来、GEO Grid が日々利用される際にはGOC (Grid Operation Center)を運営しコミュニティからのVO構築依頼や実運用支援サービスの提供が不可欠です。このVO内ではWebサイトやポータルサイトを開設して情報の共有を促進します。
GEO Grid を推進することはWEB2.0で言及されるCGM(Consumer Generated Media)を地球科学の分野にも展開させます。誰でも身近なデータを発信することができれば、例えば、陸域炭素収支モデルの実装により、京都議定書への参加が期待されるアジア途上国の炭素動態( GPP、NPP)の情報を行政側と市民が相互に提供し利用するといった可能性が期待できます。

GEO Grid への参加と計画
「GEO Gridに参加するにはどうすればいいか」という質問を受けます。データ提供者、VO管理者(プロジェクトやコミュニティのリーダ)、一般利用者という参加の形態によって導入する必要のあるソフトウエアパッケージが異なります。一般利用者は特殊な事を行わない限り通常のWebブラウザだけですが、自分が属するVOを決めて、管理者にアカウント等の作成を依頼する必要があります。これとは別に誰でも利用できるデータで構成された試用版VOの運用を検討しています。
細かくはアプリケーション提供や計算資源提供という参加形態もありますが、GEO Gridにおける特殊性は少ないと考えています。
現在はASTERデータのオンライン化を最優先で実施しており平成18年度中に過去のテープアーカイブ分を完了し、平成19年度中に高次プロダクトとしての地球全陸域DEM(数値標高モデル)の作成を行います。またASTERの詳細な設計データを有する利点から将来的には精度検証を十分に行った15m分解能の全球モザイクDEM の提供を予定しています。同時にGEO Gridソフトウエアパッケージ化を行い、必要な機能を搭載したプロトタイプを提供する計画です。

世界に広げる地球科学のE-サイエンス
人がひとりで一生の間に見ることができるデータ量はおのずと限界があります。地球観測データのような膨大な情報の中から本当に必要なものを抽出し、新たなイノベーションにつなげていかなければなりません。この実現には最先端のIT が不可欠です。GEOGridのような新しい手法ヘ第4の科学、E−サイエンスと呼びます。第3の科学である計算科学はスパコンが実験不能な高度な理論的計算をカバーしてきました。E−サイエンスはそれに加えて分散データの共有を行った上で高度なデータ処理を柱とする科学的手法です。
GEO Gridでは地球科学におけるE−サイエンスとして分散管理されている地球観測情報やデータ処理プログラムの融合的利用を可能とするシステムを構築しています。産総研のもつ地質情報と衛星情報との情報融合を進め、さらに広く地球観測情報との融合化を図ります。また、国際連携を積極的に推進し、特にアジアにおける高度利用を重点的に展開します。この際に国際的な標準動向に配慮し情報システムとデータの国際的な相互利用性を確保することを目指しています。

ページの先頭へ戻る