データクレンジング
データクレンジング
お知らせ:
当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の
英語版
を参照してください。
不整合を修正する方法
[Data]>[Fix Inconsistencies]に移動します。
表示されるサイドパネルで、不整合を修正したい列を選択します。
このツールでは、大文字・小文字の誤り、タイプミス、表記ゆれが一覧表示されます。たとえば、Tyler Smith、tylersmith、TylerSmith などです。
[Replace and Group]をクリックして、同じ語の複数の表記を1つにまとめます。
欠損値を入力する方法
[Data]>[Fill Missing Values]に移動します。
表示されるサイドパネルで、欠損値を補完したい列を選択します。
空のセルが一覧表示されたら、3つのオプションのいずれかを選択し、任意の値でセルを埋めます。
すべての欠損値を特定の値で埋める、直前のセルの内容で埋める、列内で最も頻出する値で埋める、のいずれかを選択できます。
データセットから重複を検出して削除する方法
[Data]>[Find Duplicates]に移動します。
表示されるサイドパネルで、重複を検出したい列を選択します。
重複レコードが一覧表示されたら、データセットに適用する3つのオプションのいずれかを選択します。
重複データを削除、ハイライト、移動、コピーすることができます。
ユニーク値と出現頻度を確認する方法
ユニーク値を確認するには:
Data
>
Other Tools
>
Uniques
をクリックします。
ユニーク値を確認したい範囲を選択します。
ユニーク値と重複が一覧表示されたら、重複データを移動、削除、コピー、またはスタイル適用できます。
出現頻度を確認するには:
Data
>
Other Tools
>
Frequencies
をクリックします。
出現頻度を確認したい範囲を選択します。
各値の出現頻度がサイドペインに表示されます。