インクリメンタルデータフェッチは、前回の同期以降にデータ元に追加された新規ファイルをインポートする方法です。Zoho DataPrep では、詳細選択機能を利用して SharePoint からインクリメンタルデータをインポートできます。
1. 左側のペインからCloud storageカテゴリを選択し、SharePointをクリックします。SharePointは検索ボックスで検索することもできます。
2. 接続を追加済みの場合は、既存の接続をクリックしてデータのインポートを開始します。
3. SharePointアカウントを認証します。初めて行う場合は、ファイルへアクセスするためにDataPrepの認証が必要です。
4. データを増分インポートするには、詳細選択リンクをクリックします。
詳細選択では、正規表現(regex)に基づき動的なファイル選択を行うことができます。これにより、SharePointサイトから新規または増分データの取得が可能です。新たに追加または更新され、ファイルパターンに一致するファイルは、前回の同期以降にSharePointサイトから取得されます。
詳細の必須項目は次の通りです:
サイトを選択: データをインポートしたいサイトを選択します。
ドライブを選択: サイト内でデータをインポートするドライブを選択します。
フォルダーパス: ファイルを検索したいフォルダーパスを指定します。例: 2023/
ファイルがサイト内のどのフォルダーにも格納されていない場合は、この項目を空欄にできます。
情報:フォルダーパスは大文字と小文字が区別されます。
サブフォルダーを含める: ファイルを検索する際にサブフォルダーも含めたい場合は、サブフォルダーを含めるチェックボックスを選択できます。
メモ: ファイルパターン照合はシンプルな正規表現タイプの照合です。例えば、Sales_2022。csv、Sales_2023。csv、Sales_2024。csv のようなファイル名を取得したい場合は、パターンSales_.*を入力できます。
同様に、PublicData1。csv、PublicData2。csv、PublicData3。csvなどのファイルを取得したい場合は、公開する.*を使用してください。
単一ファイルをインポートしたい場合は、正確なファイル名でパターンを指定してください。
例: leads_jan_2022.*
ファイルの解析形式 : ファイルを解析するために必須の拡張子を選択してください。ファイル形式がよく使われるものと異なる場合は、このオプションを利用して、データを読み取り可能な形式へインポートする前に、次のいずれかの形式(CSV、TSV、JSON、XML、TXT)へ変換できます。
5. データのインポートが完了すると、データセットが開き、すぐにデータの準備を開始できます。
6. データセットの準備ができたら、次回の更新前に必須の宛先へエクスポートしてください。
メモ:ワークスペース内のデータセットに対して、インポートするのスケジュールオプション、またはDataPrep Studioページ上部のインポートするメニューから、インポートのスケジュールを設定できます。こちらをクリックして詳細をご覧ください。
パイプラインの複雑さに応じてデータセットのスケジュールを設定してください。インポート、データ処理、およびエクスポートに十分な時間を確保しましょう。
7. データセットがインポートするためにスケジュールされると、インポートした時間または最後にスケジュールされた時間が記録されます。最初は、最も古いファイルのみが取得されます。以降、同期が成功するたびに、最後の同期日時が新しい値で更新され、同期時間以降に作成または更新されたファイルがインポートされます。SharePointに新規または更新ファイルがない場合は、データはインポートされません。データが同期されなかった場合でも、試行されたため同期時間は更新されます。次回は、この同期時間以降に作成または更新されたファイルが取得されます。
SharePoint の差出人から取得済みデータの番号は、Operations 履歴パネルや Sync ステータスページで確認できます。
各 sync ステータスの横にあるOperations 履歴アイコンをクリックすると、データセットへの変更履歴や、過去の都道府県、インポート・エクスポートのスケジュールをタイムライン形式で表示・追跡できます。
また、Processing 履歴パネルで頻度同期の処理済みデータも確認できます。 Processing 履歴オプションをクリックすると、サイドパネルが開き、データセットに利用可能なすべての処理済みデータIDと作成時間が一覧表示されます。
さらに、データにカーソルを合わせると表示されるアイコンをクリックすることで、処理済みデータのダウンロードや確認も行えます。
8. 最後の同期日時の後にある次のファイルを手動で取得するには、データ元からデータを更新するオプションを使用できます。
DataPrep studioページで、上部の棒グラフ内にあるインポートメニューを選択し、データ元からデータを更新するをクリックします。このオプションを利用することで、データ元からデータを再読み込みし、最新のファイルでデータセットを更新できます。
手動更新では、最後の同期日時以降に新規追加または更新されたファイルのみがデータセットにインポートされます。
メモ: 新規追加または更新されたすべてのファイルは、グリニッジ標準時(GMT)/ UTCに基づき段階的に取得されます。
例えば、SharePoint内のフォルダに合計10件のファイルがある場合で、ユーザーが3から5のファイルをスキップしたい場合、インクリメンタル取得時にこれら特定のファイルをスキップする手順は以下の通りです。
増分フェッチの途中でファイルをスキップするには、以下の手順に従ってください。
1. 汎用ファイルパターンを使用してファイルをインポートします。例:見込み客.*
2. 最初は、最も古いファイルのみが取得済みとなります。例:leads1_2024-01-29_13-02-04.csv
同期が正常に行われるたびに、最後の同期日時が新しい値で更新され、その同期時間以降に作成または更新されたファイルがインポートされます。
3. データのインポート後、今すぐエクスポートするオプションをエクスポートするメニューからDataPrep Studioページでクリックし、再読み込みの前に必須の保存先へエクスポートしてください。これを行わないと、データが失われる可能性があります。
4. DataPrep studioページで、上部の棒グラフにあるインポートするメニューからデータ元からデータを更新するをクリックします。
5. 次のファイル、すなわち leads2_2024-01-29_13-10-20.csv は段階的に取得済みとなります。再度、エクスポートする前に必須の保存先へ移動してください。リロードするとデータが失われます。
6. をクリックし、DataPrep Studio ページ右上のルールセットアイコンから Ruleset ペインを表示します。
7. Ruleset ペインで、データ元設定アイコンをクリックし、Data データ元 詳細ページを開きます。
8. Data データ元 詳細ページで、インポートする次のファイルパターンをFile pattern項目に入力し、更新するをクリックします。例:leads6_2024-02-21_12-32-51.csv.*
9. 移動先DataPrep studioページで、上部のインポートするメニューを選択し、更新する data 差出人 データ元をクリックします。
ファイル leads3、leads4、leads5 はスキップ済みとなり、leads6 は取得済みとなります。更新済み時間も記録されます。
このファイルを必須の保存先にエクスポートします。
10. 次に再度、data データ元詳細ページへ移動し、ファイルパターンを汎用形式に変更します。例:見込み客.*
11. データのインポートおよびエクスポートをスケジュールして、パイプラインを設定します。
12. インポートをスケジュールするには、
a. Schedule インポートするリンクをクリックします。
b. Schedule config セクションで、繰り返し方法(頻度「N」時間ごと、毎日、週1回、月1回)を選択します。Perform 頻度オプションで繰り返しの時間(すなわち頻度)を設定します。
タイムゾーンをデータのエクスポート用に選択します。初期設定では、ご利用中のローカルタイムゾーンが選択されています。
c. データ元のデータで新規に見つかったカラムをインポートする場合は、チェックボックスを選択します。
d. 保存をクリックして、データセットのインポートスケジュールを設定します。
13. インポートするをスケジュールした後、エクスポートするをスケジュールして、データセットの保存先を設定してください。設定しない場合、インポートするは継続的に完了しますが、エクスポートするがないとデータは失われます。
14. スケジューリング後は、同じパターンの新規ファイルが最後に同期された時間を基準に増分で取得済みとなります。例えば、leads7、leads8 などは増分でインポートされ、通常の間隔でエクスポート済みとなります。
増分取得時に途中からファイルをインポートするには、下記の手順に従ってください。
1. 特定のファイルパターンを使ってインポートするを実施します。
例:leads6_2024-02-21_12-32-51.csv.*
2. 最初は、指定されたファイルのみが取得済みとなります。例:leads6_2024-02-21_12-32-51.csv
頻度の同期が成功すると、最後の同期日時が新しい値に更新され、同期時間以降に作成・更新されたファイルがインポートされます。
3. データのインポート後、エクスポートする nowオプションをエクスポートするメニューからDataPrep Studioページでクリックし、リロード前に必須の宛先へエクスポートしてください。そうしないとデータが失われます。
4. 右上のrulesetアイコンをDataPrep Studioページでクリックし、Rulesetペインを表示します。
5. Rulesetペインで、データ元設定アイコンをクリックして、Data データ元詳細ページを開きます。
6. データ データ元 詳細ページで、次回インポートしたい汎用ファイルパターン差出人をFile pattern項目に入力します。更新するをクリックします。例:見込み客.*
7. データのインポートとエクスポートをスケジュールして、パイプラインを設定します。
インポートをスケジュールするには、
a) Schedule インポートするリンクをクリックします。
b) Schedule configセクションで、繰り返し方法(頻度 'N' 時間、頻度 day、週1回、月1回)を選択します。Perform 頻度オプションで繰り返しの時間(頻度)を設定します。
タイムゾーンを選択し、データのエクスポートを行います。初期設定では、お使いのローカルタイムゾーンが選択されています。
c) データ元データで新規に見つかったカラムをインポートしたい場合は、チェックボックスを選択します。
d) 保存をクリックして、データセットのインポートをスケジュールします。
8. インポートのスケジューリングが完了したら、エクスポートのスケジュール先をデータセットに設定してください。エクスポートを設定しない場合、インポートは継続的に完了しますが、エクスポートを行わなければデータが失われます。
9. スケジューリング後、同じパターンの新規ファイルは、最後に同期された時間をもとに随時取得されます。例:leads7、leads8など。新規ファイルはすべて段階的にインポートされ、通常の間隔でエクスポートされます。
関連情報
cloud databasesからデータをインポートする方法
「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。
日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。