DPU(データ処理装置)は、クラスターを管理します。処理サーバーの役割を担っている場合、DPU がローカルの temp.db(カードホルダー)上に、クエリ可能なデータセットを生成します。
また、DPU はクライアントアプリケーションから他の DPU への単一コンタクトポイントとして機能するクエリーサーバーの役割を果たしています。
この記事は、製品の単純なイラストです。これは、どのエンティティが役割をもたらすかを視覚化できるように、アナリストを支援する目的で導入されています。 この記事に記載されている詳細については、弊社のドキュメントをお勧めします。
DPU(データ処理装置)は、クラスターを管理します。処理サーバーの役割を担っている場合、DPU がローカルの temp.db(カードホルダー)上に、クエリ可能なデータセットを生成します。
また、DPU はクライアントアプリケーションから他の DPU への単一コンタクトポイントとして機能するクエリーサーバーの役割を果たしています。
サーバーのチームにはスーパーバイザーと、プライマリサーバーとしての役割を担う FSU(ファイルサーバーユニット)が1つ必要です。データセットアーキテクチャ(スキーマ)、設定およびパフォーマンスパラメーターのマスターコピーを格納します。 プライマリサーバーは同期サーバーとしても知られています。
プライマリサーバーの負荷を軽減するために、役割の一部を追加の FSU に委任できます。 デコードされたデータの索引化(正規化)、データセットの書き出し(セグメント書き出し)、およびローログファイルの変換(トランスフォーム)を簡潔にカバーします。
小規模なクラスターでは、多くの場合、一つの FSU で十分にすべての管理役割を満たされます。クラスターが大きくなると、プライマリサーバーが圧倒されます。アドビでは、追加の FSU の使用をボトルネックにすることを推奨しています。
他の FSU 役割(ログインサーバー、ソースリストサーバー、ファイルサーバー)およびコンポート(センサーとリピーター)、についてはここにある当社が作成した文書を確認してください。
Data Workbench のクライアントは、フロントエンドアプリケーションです。アナリストは it を使用してクエリーサーバーに対するクエリーを実行し、設計者はそれを使用してプライマリサーバー上のスキーマを設定し、管理者はさまざまなサーバーを管理します。
レポートサーバーは、クライアントアプリケーションのレポート機能を自動化します。レポートセットからクエリーを実行し、さまざまなチャネルから出力を配信します。
まず始めに、DPU は様々な素材の検索方法や処理方法を知りません。 同期を行うと、命令、スキーマ、プライマリサーバ(FSU)からのリソースマップが取得されます。
命令は提供されますが、カードホルダーはまだ空です。
同期命令とマップを使用すると、各 DPU はログファイルを検索し、デコードを開始します。
デコードされたイベントが既存の訪問者に属する場合は、そのイベントがカードに追加されます。ビジターが他の DPU に属する場合は、それが転送されます。最後に、イベントが既存のビジターに属していない場合は、新しいカードが作成されます。
訪問者はすべての DPU に均等に配分されます。例えば、500 万のビジターを持つ 10- DPU クラスターでは、各 DPU は 50 万のビジターのデータを保有します。ただし、各ビジターのデータサイズが異なるため、temp.db のサイズは DPU 全体で等しくはなりません(かなり近い数になる傾向がありますが)。
各 DPU プロセスが入力を処理するたびに、標準化サーバー上でディメンションの要素の索引が同時に作成されます。
通常、1つの FSU はプライマリサーバーと標準化サーバーの両方の役割を果たします。
ログプロセスが完了すると、クエリ可能型データセットが発生します。
最後に、データセットは分析の準備が整っています。詳細分析の場合、1 つの質問が他の質問を導くように一連のクエリーが実行されるため、Data Workbench クライアントを使用することをお勧めします。
最初に、Data Workbench クライアントがプライマリサーバーに接続し、DPU の 1 つがそのクエリーサーバーとして割り当てられます。
これで、クライアントアプリケーションがデータセットプロファイル付の「Online」になります。この時点以降、この DPU はこのクライアントのコンタクトポイントになります。
クライアントはクエリーサーバーにクエリー文字列を送信します。 クエリを受信すると、Query Server は他の DPUs に同じリクエストを転送します。 また、自分の temp.db(カードホルダー)に対するクエリーも実行され、他の DPUs の結果と共にクライアントに結果が戻されます。
クライアント側では、クエリの結果は、ストリーム内の様々な形式に変換されます。 完成したワークスペースは、レポートサーバーのテンプレートとして保存することもできます。
レポートサーバーがクエリの実行を自動化することができます。 指定された時間に、プライマリサーバーからレポートセットを取得し、そのレポートを実行してから、電子メールなど様々な方法で配信します。
データセットの特定のセグメントは、区切りテキストファイルとして書き出すことができます。書き出し定義ファイル(*.export)に基づいて、各 DPU フィルタはデータを共有し、それらをセグメント書き出しサーバーに送信します。
DPU から書き出されたデータはセグメントエクスポートサーバー上で1つのファイルに結合されて指定した場所にアップロードされます。ファイルは通常、様々なサードパーティ分析ツールまたはカスタムアプリケーションに読み込まれ、さらに分析されます。
正規化サーバーの役割と同様に、1 つの FSU では、小規模なクラスターにプライマリとセグメントエクスポートロールの両方を適用できます。ただし、大規模なデータ送信のバッチがあるため、セグメントの書き出しによって FSU のリソースに負担がかかる場合があります。
FSU は変換サーバーとして機能することができます。セグメントの書き出し(つまり、データセットからテキストへの変換)とは異なり、トランスフォームは単純なテキストからテキストへの変換です。 また、1つまたは複数のタイプの入力テキストを取得し、センサーのデータ(.vsl)、ログファイル、XML ファイル、ODBC(テキスト)データなど、単一のファイルに結合されます。多くの場合、未処理の生データをデータセットにフィードする前に、未処理の状態にするために使用されます。
変換サーバー(FSU)操作を使用すると、データセットあるいは DPU なしで実行できます。 このため、Transform サーバーは、個別で実行されます。
アカウントにログイン