重複排除

重複排除

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。




データのDeduplicate変換を使用して、重複データを削除または複製できます。この処理は、行単位または列単位の2通りで実行できます。

行単位

この方法では、重複したデータを含む行を削除し、データセット内に一意の行のみが残るようにします。

行単位で重複排除を適用するには:

1. 変換メニューをクリックし、Deduplicateをクリック、次に行単位を選択します。

2. 重複行を削除する際、重複の判定方法を詳細に指定するため、以下の設定を有効にできます:

大文字と小文字を無視 - このオプションを有効にすると、大文字・小文字を区別せず、同じとみなして重複と判断します。

空白を無視 - このオプションでは、単語間や文頭・文末の複数スペースを無視し、重複とみなします。

重複データにフラグを付与 - このオプションでは、新しい列に重複データのフラグが付与されます。後から新規追加列で重複データをフィルタできます。重複がない場合、「重複フラグ」列は空のままです。これにより、元データと重複データの両方を保持しつつ、重複データを識別できます。すぐに削除せず、確認・検証・他の変換適用後に、残すか破棄するかを決めることも可能です。

以下はスナップショットです。



Notes
メモ: サンプルデータセットに重複が存在しない場合もありますが、全データセットをエクスポート時に処理することで、重複行の削除ルールを適用できます。

3. 有効なプレビュー画面が表示され、重複行は赤色でハイライトされます。



4. 重複を削除をクリックします。

列単位

1つまたは複数の列を選択し、重複排除を実行できます。 Deduplicate > 列単位変換を使うことで、選択した列に存在する重複値に基づき行を削除できます。

つまり、(例:地域、住所、商品など)縦方向に同じ値が入った列をすべて選択します。列単位の重複排除では、選択した列で縦方向に同じ値がある行を削除します。

列単位で重複排除を適用するには:

1. 変換メニューをクリックし、Deduplicateをクリック、次に列単位を選択します。

2. 重複行を削除する際、重複の判定方法を詳細に指定するため、以下の設定を有効にできます:

大文字と小文字を無視 - このオプションを有効にすると、大文字・小文字を区別せず、同じとみなして重複と判断します。

空白を無視 - このオプションでは、単語間や文頭・文末の複数スペースを無視し、重複とみなします。

Flag 複製する データ- このオプションを選択すると、複製するデータに新しい列でフラグが付与されます。追加された列を使って、後から出力の重複をフィルタリングできます。重複がないデータについては「複製するFlag」列は空欄のままです。この方法により、マスターと複製データの両方を保持しつつ、複製データを特定できます。すぐに重複を削除するのではなく、保持・破棄を決定する前に確認、検証、変換の適用が可能です。

以下はそのスナップショットです。



3. 選択済みの列に基づき、データセットを重複排除する2つの方法のいずれかを選択できます:自動重複排除または手動条件指定

4. 自動重複排除を選択すると、DataPrepが選択済みの列に基づいてデータを自動的に重複排除します。



5. 手動条件指定を選択した場合は、条件や式を入力し、if明細を作成します。その後、条件が真の場合は各複製クラスター内で保持する行や削除する行を選択できます。
 

6. 以下の表は、すべてのデータ型で利用可能なIf条件を一覧にしたものです。データ型の詳細についてはこちらをクリックしてください。

テキスト

数値

日時

期間

ブール値

リスト

マップ

を含む

=次の値と等しい

= 次の値と等しい

最小である

真である

値を持つ

キーを持つ

含まれていない

!= not 次の値と等しくない

!= not 次の値と等しくない

最大である

無効である

空のリストである

空のmapである

で始まる

> その他よりも

最も早い

= 次の値と等しい

含む

が次の値と等しくない 空である list

が次の値と等しくない 空である map

で終わる

< 次の値より小さい

最新である

!= not 次の値と等しい

含まれていない

is 空である

is 空である

である

>= その他以上

が次の値より後

が空である

で始まる

が次の値と等しくない または空である

が次の値と等しくない または空である

が次の値と等しくない

<= 次の値以下

が次の前

が次の値と等しくない、空である

で終わる

regexを使用

regexを使用

is 空である

が最小

オン または が次の後

regex を使用

である

patterns を使用

patterns を使用

が次の値と等しくない 空である

最大である

オン または が次の前

patterns を使用

が次の値と等しくない

 

 

regex を使用

空である

空である

 

空である

 

 

使用するパターン

次の値と等しくない 空である

次の値と等しくない 空である

 

次の値と等しくない 空である

 

 

 

使用する正規表現

使用する正規表現

 

使用する正規表現

 

 

 

使用するパターン

使用するパターン

 

使用するパターン

 

 


7. また、ANDやOR演算子を使用してその他の条件を追加し、条件の組み合わせで重複排除を適用できます。

Idea
例えば、次のような条件を記述できます:「メール列にZoho.comが含まれている場合、その行を残す」。つまり、保持したい行を選択する条件を入力します。f メール contains Zoho.com

8. 詳細 オプションを利用すると、関数を挿入し、重複を削除するための条件を指定できます。



9. プレビューする ボタンをクリックすると、変換時に削除される行を確認できます。

10. また、「Columns to de-複製する」で(+)を使い、複数の列を選択して重複排除を行うことも可能です。

よくある質問

1. 「Flag duplicates」オプションで行ごとに重複排除を適用するたびに、重複の数が減少するのはなぜですか?

「Flag」オプション付きで重複排除を適用するたびに、新しい列が追加され、重複データがマークされます。再度適用すると、このフラグ列も重複チェックの対象となります。すべてのフラグ付きデータは同じフラグ値となるため、グループ化されます。そのため、適用するたびに重複の数が減っていきます。

例:
1回目 → 5件のデータ → 4件が重複、1件がマスター
2回目 → 3件が重複、1件がマスター
3回目 → 2件が重複、1件がマスター

この現象を回避するためには、再び変換を適用する前に、出力データをフィルターし、重複データを削除してください。

関連情報

    Zoho CRM 管理者向けトレーニング

    「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。

    日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。

    Zoho CRM Training



              Zoho Campaigns Resources

                Zoho WorkDrive Resources




                  • Desk Community Learning Series


                  • Digest


                  • Functions


                  • Meetups


                  • Kbase


                  • Resources


                  • Glossary


                  • Desk Marketplace


                  • MVP Corner


                  • Word of the Day


                  • Ask the Experts









                                  • Related Articles

                                  • データセットの変換

                                    お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。 データセット変換は、データセットを組み合わせたり変換したりして、ニーズに合わせて調整することです。データセットでは、以下の変換を適用できます。 重複排除 行単位 列単位 結合 追加 ピボット アンピボット 計算列 データセットの派生 個人データとして設定 ...
                                  • 参加する

                                    お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。 共通の列を使用して、2つのデータセットを参加する変換で結合できます。 例えば、店舗の購買データを含むデータセットと顧客情報を含む別のデータセットがあるとします。これらのデータセットは、顧客IDなどの共通の列を使って結合し、両方のデータセットからデータを特定・照合することができます。 ...
                                  • Zoho DataPrepとは何ですか?

                                    お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。 Zoho DataPrepとは? Zoho ...
                                  • Zohoディレクトリへのデータエクスポート[プライベートプレビュー]

                                    お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。 Zoho DataPrepは、データをZoho Directoryへエクスポートすることに対応しています。Zoho Directoryは、複数の商品への認証やアクセス権限の管理を行えるアイデンティティおよびアクセス管理ソフトウェアです。 メモ: ...
                                  • Zoho DataPrep - ユーザーガイドの概要

                                    お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。 Zoho ...

                                  Resources

                                  Videos

                                  Watch comprehensive videos on features and other important topics that will help you master Zoho CRM.



                                  eBooks

                                  Download free eBooks and access a range of topics to get deeper insight on successfully using Zoho CRM.



                                  Webinars

                                  Sign up for our webinars and learn the Zoho CRM basics, from customization to sales force automation and more.



                                  CRM Tips

                                  Make the most of Zoho CRM with these useful tips.