データ サービスにより、データ シチズンは BI 目的で使用できるデータ エステート全体のデータを効率的に使用できるようになります。これは、データを取得、変換し、最終的に提供するための統合されたツールセットを提供することによって行われます。
このリリースでは、IFS データ サービスは以下の主要なサービスの組み合わせです。
これらはマルチテナント サービスです。このリリースで開始された主なIFS Cloud Web 機能は、特定のユースケースに合わせて、データ パイプラインを介してデータ レイクにデータをロードし、強化、クレンジング、変換する機能を提供します。データ サービス関連の機能は、IFS.ai プラットフォームに依存します。
1) データ レイク
データ サービスの主なデータ ストアは、データ レイク (ADLS Gen 2) になります。このデータ レイクは、さまざまな要件 (分析ベースのソリューション、インデックス作成用のドキュメント) に基づいてデータを保持します。生データはデータ レイクに取り込まれ、ESG / Copilot の特定のユース ケースに合わせてデータ パイプラインを介して強化および変換されます。
2) データ ポンプ
データ ポンプ は実際のデータの移動と Parquet ファイルの生成を実行します。Oracle データベースからデータを読み取ります。作成された Parquet ファイルは、 データ レイク サービスに送信され、その後、特定のデータ レイクに送信されます。
3) データ レイク サービス
Data Lake サービスを使用すると、指定したファイルを Cloud Storage からアップロードまたはダウンロード、Cloud Storage でメタデータ関連の詳細を追加、更新、取得したり、Cloud Storage 内の指定したコンテナーとパスに従ってストレージ階層を一覧表示したりできます (現在は Azure Data Lake Storage のみをサポートしています)。テナント情報はサービスによって決定されます。
4) データ パイプライン サービス
データ パイプライン サービスは、複数のスクリプトをオーケストレーションできるデータ パイプライン (ワークフロー) を開始するために使用されます。テナント情報はデータ パイプライン サービスによって決定され、データ レイクと接続情報がワークフローに渡されます。
5) ワークフロー
データ サービスは、ワークフローを使用してスクリプトの実行フローを調整します。
6) ワークロード ジョブ定義
IFS Cloud Web のワークロード ジョブ定義ページを使用して、データ レイクにデータをロードし、データ パイプライン サービスを介してデータ パイプラインを開始できます。ワークロード ジョブ定義は、データソースとワークフロー (アクション) で構成されます。さらに、カスタム ワークロード ジョブ定義を作成して、データソースのセットのみをターゲット データ レイクにロードすることもできます。
IFS Cloud Web で利用できるその他の機能は次のとおりです。