オンプレミスのPostgreSQLデータベーステーブルmarket_leadsからクラウドデータベーステーブルall_leadsへデータを同期したいとします。Zoho DataPrepの インクリメンタルフェッチ機能を使い、新規および更新済みデータのみをクラウドデータベースへ同期します。
データをクラウドデータベースへエクスポートする際、Zoho DataPrepではテーブルに新しく追加する行の方法を選択できます:
Zoho DataPrepは追加(Append)オプションを使用する場合、PostgreSQLの更新済みデータを更新しません。その代わり、更新済みの行を宛先テーブルへ追加します。このため、データが複製される場合があります。この問題を回避するには、以下の解決策を実施してください。
クラウドデータベース内の更新済みデータを更新するには、出力テーブルのデータと受信データを比較し、DataPrepでデータをマージして、マージ後のデータで出力テーブルを上書きします。手順は以下の通りです。
クラウドデータベースからmarket_leadsテーブルのデータを 増分方式でDataPrepにインポートします。これは新規および更新済みリードデータを含むデータ元テーブルであり、all_leads出力テーブルにマージする必要があります。
タイムスタンプ付きの新規列を追加するFormula変換:
クラウドデータベース(例: PostgreSQL)から出力テーブル all_leads をDataPrepにインポートします。このデータはデータ元と比較して、どのデータが新規または更新されたかを特定するために使用されます。
次に、両方のテーブルを追加し、ZDP_timestamp列を含めます。
追加されたデータセットから重複を特定し、古いまたはいいえのタイムスタンプを持つデータを削除します。Deduplicateトランスフォームを
で使用してください。
列単位で重複排除を適用するには:
1. Transformメニューをクリックし、Deduplicateをクリック、その後列単位を選択します。
2. 重複を識別するためにID列を選択します。大文字小文字や空白を無視して重複を検出することも可能です。
3. Manual conditionsを選択し、ZDP_timestamp列が最新のタイムスタンプを持つ場合に行を残す条件を入力します。
次に、クリーンアップ済みテーブルを既存テーブル、つまりAll_leadsマスターテーブルへエクスポートします。ここにはすべての見込み客データがクラウドデータベースに保存されており、上書きを選択します。
エクスポート失敗を防ぐため、ターゲット照合が完了していることを確認してください。こちらをクリックするとターゲット照合の詳細を確認できます。
この宛先設定により、パイプライン実行ごとに完了したデータセットがエクスポートされ、新規追加データと更新済みデータの両方を含み、宛先テーブルが上書きされることで重複が発生しません。
これにより、マスターテーブルは常に最新のリードデータで保たれます。
この方法は、Zoho DataPrepとクラウドデータベースを組み合わせて活用します。
これにより、手動での挿入・更新・削除作業を行わずに、出力データセットが常にクリーンな状態に保たれます。
クラウドデータベース(例:market_leadsテーブル)から 増分でDataPrepにインポートします(例: PostgreSQL)。
このテーブルには新規および更新済みリードデータが含まれています。
market_leadsテーブルに、Formula関数を使用して、現在のタイムスタンプを持つ新規列(ZDP_timestamp)を追加します。これにより、各新規または更新済みデータがZoho DataPrepから最終更新された時刻を追跡できます。
タイムスタンプ付きの新規列を追加するためのFormula変換:
テーブルをクラウドデータベース(例: PostgreSQL)にエクスポートし、all_leads_rawテーブルに追加オプションを使用して保存します。
この時点で、テーブル(all_leads_raw)には、同じIDごとに異なるタイムスタンプの複数のバージョンのデータが含まれています。
ビューを作成し、all_leads_cleanが各IDごとに最新のデータのみを常に返すように、ウィンドウ関数を使用します。
all_leads_cleanをクエリする際は、常に重複排除され、最新のデータセットを取得できます。
例:
このテーブルには、すべてのデータ(重複や更新を含む)がタイムスタンプ付きで格納されています。
id |
名前 |
modified_time |
ZDP_timestamp |
1 |
アラン |
2025-06-20 12:22:00 |
2025-08-10 10:15:00 |
2 |
フランシス |
2024-06-20 12:25:00 |
2025-08-10 10:15:00 |
3 |
Dan |
2024-06-20 12:27:00 |
2025-08-10 10:15:00 |
1 |
Al |
2024-06-21 01:29:00 |
2025-08-11 09:45:00 |
4 |
Gaja |
2024-06-21 01:30:00 |
2025-08-11 09:45:00 |
5 |
John |
2024-06-21 01:35:00 |
2025-08-11 09:45:00 |
この表示は各IDごとに最新のデータのみを返品します。
ID |
名前 |
更新日時 |
ZDPタイムスタンプ |
1 |
Al |
2024-06-21 01:29:00 |
2025-08-11 09:45:00 |
2 |
Francis |
2024-06-20 12:25:00 |
2025-08-10 10:15:00 |
3 |
Dan |
2024-06-20 12:27:00 |
2025-08-10 10:15:00 |
4 |
Gaja |
2024-06-21 01:30:00 |
2025-08-11 09:45:00 |
5 |
John |
2024-06-21 01:35:00 |
2025-08-11 09:45:00 |
id = 1 の場合、最新のZDP_timestampを持つAlのみが保存されます。
「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。
日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。