参加する

参加する

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。





共通の列を使って、参加するトランスフォームで2つのデータセットを結合できます。

Info
例えば、店舗の購入データを持つデータセットと顧客情報のデータセットがあるとします。これらのデータセットは、顧客IDなどの共通の列を使って組み合わせることができ、両方のデータセットからデータを特定・照合できます。

DataPrepでは、inner参加する、left参加する、right参加する、outer参加するの4種類の結合方法を提供しています。参加するトランスフォームの使い方を紹介する短い動画をご覧ください。



参加するトランスフォームを実行する方法

1.Transformメニューをクリックし、Combineをクリックして、参加するを選択します。

2.参加するデータセットダイアログで、現在のデータセットと結合するデータセットおよび結合の種類を選択できます。

3.参加するデータセットの選択ドロップダウンで、現在のデータセットと結合したいデータセットを選択します。

Info
参加するトランスフォームの結果として新しいデータセットが作成されます。



DataPrepは、現在のデータセットとワークスペース内の他のデータセット間の結合可能性を自動的に計算し表示します。結合可能性はパーセンテージ(%)で表示されるため、結合トランスフォームに使用するデータセットを簡単に選択できます。この値は、列内の一致データの量や、データセット間の一致する列名など、さまざまな要素に基づいて計算されます。

4.参加する種類オプションで結合のタイプを選択します。Transformパネル内の参加する種類メニューからも種類の変更が可能です。



5.Transformパネルの新規データセット名欄に新しいデータセットの名前を入力します。

6.照合済み列セクションで、2つのデータセットを結合する際に使用する列を選択します。

重複した列名の解決


7. プレビューするボタンをクリックします。重複した列名の解決ダイアログが表示され、結合しようとしている両方のデータセットに同じ名前の列が存在する場合に表示されます。列の名前を変更または削除してから続行できます。

8. プレビュー画面で、列ヘッダーのチェックボックスを使って含めたくない列の選択を解除できます。

9. 参加するをクリックして、2つのデータセットを結合します。



10. 2つのデータセットの結合が正常に完了したら、結合済みデータセットを開くことができます。

 

11. 結合設定を表示したい場合は、結合済みデータセットのRulesetペインからData データ元 configurationを開くことができます。


12. 編集 参加するをクリックして、結合設定を更新することも可能です。



結合は通常、2つの異なるデータセットを共通の項目で組み合わせるために使用します。各種の結合方法とその例を見ていきましょう。

Inner 参加する

Inner 参加するは、共通の列を使用して2つのデータセットを結合し、一致しない行はすべて除外します。

Inner 参加するは次のように表せます:



次のデータセットの例を見てみましょう。

注文データセット



顧客データセット



ここでは順番IDが共通の列です。Inner 参加するでは、順番ID列で値が一致する2つのデータセットの行を結合し、一致しない値は注文および顧客データセットの両方から除外しています。



Left 参加する


Left 参加するは、現在のデータセットと他のデータセットを共通の列で結合し、他のデータセットで一致しない行をすべて破棄します。

Left 参加するは次のように表現されます:



次のデータセットを例に見てみましょう:

注文 データセット



顧客 データセット



Left 参加するは、順番ID列で値が一致している2つのデータセットの行を結合します。一致しない値は顧客データセットのみから破棄されます。



Right 参加する


Right 参加するは、現在のデータセットと他のデータセットを共通の列で結合し、現在のデータセットで一致しない行をすべて破棄します。
Right 参加するは次のように表現されます:



次のデータセットを例として考えます:

注文 データセット



顧客 データセット



Right 参加するは、順番ID列で値を共有している2つのデータセットの行を結合します。一致しない値は注文データセットのみから破棄されます。


Outer 参加する

Outer 参加するは、共通の列を使用して2つのデータセットを結合し、両方のデータセットから一致しない行も含めます。Outer 参加するは次のように表現されます:



次のデータセットを例として見てみましょう。

注文 データセット



顧客データセット



Outer 参加 2つのデータセットの注文ID列で値が一致する行を結合します。一致しない値も注文データセットおよび顧客データセットの両方から保持されます。



関連情報


Before Updated