Data Workbench のクラスター

検索

最終更新日 : 2021年4月27日 | 次にも適用 : Insight

この記事は、製品の単純なイラストです。これは、どのエンティティが役割をもたらすかを視覚化できるように、アナリストを支援する目的で導入されています。この記事に記載されている詳細については、弊社のドキュメントをお勧めします。

メイン実行者

これまでは、データの個人訪問者ここに組み入れる方法をこちらでおよび訪問者のデータがどのようにデータセットされているかをここで説明されています。この記事では、さらに詳細に戻ってクラスター全体を確認しています。

DPU - データセットの管理者 -

DPU（データ処理装置）は、クラスターを管理します。処理サーバーの役割を担っている場合、DPU がローカルの temp.db（カードホルダー）上に、クエリ可能なデータセットを生成します。

また、DPU はクライアントアプリケーションから他の DPU への単一コンタクトポイントとして機能するクエリーサーバーの役割を果たしています。

プライマリサーバーとしての FSU - データセットのコーディネーター-

サーバーのチームにはスーパーバイザーと、プライマリサーバーとしての役割を担う FSU（ファイルサーバーユニット）が１つ必要です。データセットアーキテクチャ（スキーマ）、設定およびパフォーマンスパラメーターのマスターコピーを格納します。プライマリサーバーは同期サーバーとしても知られています。

非プライマリロールの FSU

プライマリサーバーの負荷を軽減するために、役割の一部を追加の FSU に委任できます。デコードされたデータの索引化（正規化）、データセットの書き出し（セグメント書き出し）、およびローログファイルの変換（トランスフォーム）を簡潔にカバーします。

小規模なクラスターでは、多くの場合、一つの FSU で十分にすべての管理役割を満たされます。クラスターが大きくなると、プライマリサーバーが圧倒されます。アドビでは、追加の FSU の使用をボトルネックにすることを推奨しています。

注意：

他の FSU 役割（ログインサーバー、ソースリストサーバー、ファイルサーバー）およびコンポート（センサーとリピーター）、についてはここにある当社が作成した文書を確認してください。

クライアント

Data Workbench のクライアントは、フロントエンドアプリケーションです。アナリストは it を使用してクエリーサーバーに対するクエリーを実行し、設計者はそれを使用してプライマリサーバー上のスキーマを設定し、管理者はさまざまなサーバーを管理します。

レポートサーバ

レポートサーバーは、クライアントアプリケーションのレポート機能を自動化します。レポートセットからクエリーを実行し、さまざまなチャネルから出力を配信します。

クエリ可能なデータセットの構築

同期 - 命令の共有 -

まず始めに、DPU は様々な素材の検索方法や処理方法を知りません。同期を行うと、命令、スキーマ、プライマリサーバ（FSU）からのリソースマップが取得されます。

命令は提供されますが、カードホルダーはまだ空です。

ログ処理 - データセット構築 -

同期命令とマップを使用すると、各 DPU はログファイルを検索し、デコードを開始します。

デコードされたイベントが既存の訪問者に属する場合は、そのイベントがカードに追加されます。ビジターが他の DPU に属する場合は、それが転送されます。最後に、イベントが既存のビジターに属していない場合は、新しいカードが作成されます。

訪問者はすべての DPU に均等に配分されます。例えば、500 万のビジターを持つ 10- DPU クラスターでは、各 DPU は 50 万のビジターのデータを保有します。ただし、各ビジターのデータサイズが異なるため、temp.db のサイズは DPU 全体で等しくはなりません（かなり近い数になる傾向がありますが）。

標準化 - デコードされたデータの索引化 -

各 DPU プロセスが入力を処理するたびに、標準化サーバー上でディメンションの要素の索引が同時に作成されます。

通常、１つの FSU はプライマリサーバーと標準化サーバーの両方の役割を果たします。

ログプロセスが完了すると、クエリ可能型データセットが発生します。

Data Workbench クライアントをインタラクティブ分析

最後に、データセットは分析の準備が整っています。詳細分析の場合、1 つの質問が他の質問を導くように一連のクエリーが実行されるため、Data Workbench クライアントを使用することをお勧めします。

1.クエリーサーバーの割り当て

最初に、Data Workbench クライアントがプライマリサーバーに接続し、DPU の 1 つがそのクエリーサーバーとして割り当てられます。

これで、クライアントアプリケーションがデータセットプロファイル付の「Online」になります。この時点以降、この DPU はこのクライアントのコンタクトポイントになります。

2.クエリーの実行

クライアントはクエリーサーバーにクエリー文字列を送信します。クエリを受信すると、Query Server は他の DPUs に同じリクエストを転送します。また、自分の temp.db（カードホルダー）に対するクエリーも実行され、他の DPUs の結果と共にクライアントに結果が戻されます。

クライアント側では、クエリの結果は、ストリーム内の様々な形式に変換されます。完成したワークスペースは、レポートサーバーのテンプレートとして保存することもできます。

レポートサーバーとの予定レポート

レポートサーバーがクエリの実行を自動化することができます。指定された時間に、プライマリサーバーからレポートセットを取得し、そのレポートを実行してから、電子メールなど様々な方法で配信します。

セグメント書き出しを使用したデータセットの書き出し

データセットの特定のセグメントは、区切りテキストファイルとして書き出すことができます。書き出し定義ファイル（*.export）に基づいて、各 DPU フィルタはデータを共有し、それらをセグメント書き出しサーバーに送信します。

DPU から書き出されたデータはセグメントエクスポートサーバー上で1つのファイルに結合されて指定した場所にアップロードされます。ファイルは通常、様々なサードパーティ分析ツールまたはカスタムアプリケーションに読み込まれ、さらに分析されます。

注意：

正規化サーバーの役割と同様に、1 つの FSU では、小規模なクラスターにプライマリとセグメントエクスポートロールの両方を適用できます。ただし、大規模なデータ送信のバッチがあるため、セグメントの書き出しによって FSU のリソースに負担がかかる場合があります。

ログを変更してソースと変形

FSU は変換サーバーとして機能することができます。セグメントの書き出し（つまり、データセットからテキストへの変換）とは異なり、トランスフォームは単純なテキストからテキストへの変換です。また、1つまたは複数のタイプの入力テキストを取得し、センサーのデータ（.vsl）、ログファイル、XML ファイル、ODBC（テキスト）データなど、単一のファイルに結合されます。多くの場合、未処理の生データをデータセットにフィードする前に、未処理の状態にするために使用されます。

変換サーバー（FSU）操作を使用すると、データセットあるいは DPU なしで実行できます。このため、Transform サーバーは、個別で実行されます。

ヘルプをすばやく簡単に入手

新規ユーザーの場合