データクレンジング

データクレンジング

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

不整合を修正する方法

  1. [Data]>[Fix Inconsistencies]に移動します。
  2. 表示されるサイドパネルで、不整合を修正したい列を選択します。
  3. このツールでは、大文字・小文字の誤り、タイプミス、表記ゆれが一覧表示されます。たとえば、Tyler Smith、tylersmith、TylerSmith などです。
  4. [Replace and Group]をクリックして、同じ語の複数の表記を1つにまとめます。
 

欠損値を入力する方法

  1. [Data]>[Fill Missing Values]に移動します。
  2. 表示されるサイドパネルで、欠損値を補完したい列を選択します。
  3. 空のセルが一覧表示されたら、3つのオプションのいずれかを選択し、任意の値でセルを埋めます。
  4. すべての欠損値を特定の値で埋める、直前のセルの内容で埋める、列内で最も頻出する値で埋める、のいずれかを選択できます。
 

データセットから重複を検出して削除する方法

  1. [Data]>[Find Duplicates]に移動します。
  2. 表示されるサイドパネルで、重複を検出したい列を選択します。
  3. 重複レコードが一覧表示されたら、データセットに適用する3つのオプションのいずれかを選択します。
  4. 重複データを削除、ハイライト、移動、コピーすることができます。
 

ユニーク値と出現頻度を確認する方法

ユニーク値を確認するには:
  1. Data> Other Tools > Uniques をクリックします。
  2. ユニーク値を確認したい範囲を選択します。
  3. ユニーク値と重複が一覧表示されたら、重複データを移動、削除、コピー、またはスタイル適用できます。
 


出現頻度を確認するには:
  1. Data> Other Tools > Frequencies をクリックします。
  2. 出現頻度を確認したい範囲を選択します。
  3. 各値の出現頻度がサイドペインに表示されます。