Web オートメーションは Zoho RPA の主要機能であり、Web ベースの作業を簡素化し、自動化するために設計されています。Web ページとの対話、データの抽出、アクションの自動実行が可能になり、手作業から解放されてプロセスを大幅に効率化できます。
利用可能なアクション
1. URL を開く
指定した URL を Web ブラウザーで開きます。
例:このアクションを使用して、ワークフローの開始点となる Web サイトや Web アプリケーションに移動します。
設定
ブラウザーの選択:RPA フローの実行に使用する Web ブラウザーを選択します。
バックグラウンドで実行:ブラウザーを前面に表示するか、バックグラウンドで自動化を実行するかを選択します。
URL: 移動先の Web サイトの URL を入力します。
開く方法: 新しい URL を開く方法を指定します。新しいタブで開くか、同じタブで開くかを選択します。
2. クリック
Web ページ上の要素(ボタン、リンクなど)をマウスクリックで操作したようにシミュレートします。
例: EC サイトを自動化する場合、ボットに「カートに追加」ボタンをクリックさせて、商品をショッピングカートに追加できます。
設定
クリック種別:実行するクリックの種類(シングルクリック、ダブルクリック、右クリック)を選択します。
3. ホバー
Web ページ上の要素にマウスカーソルを合わせ、ツールチップを表示したり、非表示メニューやドロップダウン メニューを表示したりします。
例:Web ページのナビゲーション メニュー項目にカーソルを合わせると、そのメニューの機能を説明するツールチップが表示されることがあります。
設定
4. テキストを設定
Web ページ上の指定した UI 要素のテキスト属性に文字列を書き込みます。テキスト フィールドや入力ボックスへの文字入力に使用できます。
例: Web サイトの「お問い合わせ」フォームで、名前フィールドに値を入力します。
設定
入力テキスト: 入力フィールドに入力するテキストです。
入力フィールドに既にテキストがある場合:入力フィールドに既存のテキストがある場合の扱いを指定します。次のいずれかを実行できます。
- テキストを置換:既存のテキストを新しいテキストで置き換えます。
- テキストを追加:既存のテキストの末尾に指定したテキストを追加します。
5. テキストを取得
Web ページ上の指定した UI 要素からテキスト コンテンツを抽出します。
例: 天気予報サイトで、「テキストを取得」アクションを使用して現在の気温を抽出し、表示できます。
6. チェックボックスを設定
Web ページ上のチェックボックスやトグル スイッチをオンまたはオフにします。
例: Web サイトや Web アプリケーションでは、プッシュ通知、メール通知、アプリ内通知など、さまざまな通知タイプごとに通知設定をカスタマイズできることがよくあります。これらの設定は通常、チェックボックスやトグル スイッチで管理されます。このアクションを使用すると、その操作を自動化できます。
設定
UI 要素セレクター: UI 要素セレクターを使用して Web ページ上の特定のチェックボックス要素を特定し、その要素の状態に応じて true または false の値を設定します。
利用可能な UI 要素セレクターの詳細
チェックボックス値:チェックボックス項目に設定する値(オン/オフ)を指定します。
7. チェックボックスの状態を取得
チェックボックスがオンかオフかを判定します。
例:Web サイトのフォームで、ユーザーが利用規約に同意しているかどうかを確認します。
設定
UI 要素セレクター:UI 要素セレクターを使用して Web ページ上の特定のチェックボックス要素を特定し、その要素の状態に応じて true または false の値を取得します。
利用可能な UI 要素セレクターの詳細
8. 項目を選択
Web ページ上のドロップダウン リストからオプションを選択します。
例: オンライン旅行サイトでは、出発地と到着地がドロップダウン リストで表示されることがよくあります。「項目を選択」アクションを使用して、この選択作業を自動化できます。
設定
操作:対象要素に対して実行する操作を選択します。利用可能な操作は次のとおりです。
- 値で項目を選択:項目の値に基づいてリスト項目を選択します。
- 値:選択したい要素の値を入力します。
- インデックスで項目を選択:リスト内での位置(インデックス)に基づいてリスト項目を選択します。
- インデックス:選択したい要素のインデックスを指定します。インデックスは 1 から始まります。
- すべてクリア:リストで選択されている項目をすべて解除します。
Web ページ上の HTML テーブルからデータを抽出します。
例:配送サイトでは、送料が重量や配送先に応じてテーブル形式で表示されることがあります。「テーブル データを抽出」アクションを使用して、この情報の取得を自動化できます。
設定
UI 要素セレクター: UI 要素セレクターを使用して、Web ページ上の指定した対象テーブルからデータを抽出します。この値は HTML DOM 内の <table> 要素に対応している必要があります。 利用可能な UI 要素セレクターの詳細
抽出するデータ行数
HTML テーブルの先頭行から、抽出したいデータ行数を指定します。
- 値を設定しない場合、利用可能なすべてのデータ行が抽出されます。
- 先頭から特定の行数だけ抽出したい場合は、その行数を入力します(例:10)。
- 指定した行数がテーブルの総行数を超えている場合は、利用可能なすべての行が抽出されます。
例:テーブルに 15 行あり、20 と指定した場合は、利用可能な 15 行すべてが抽出されます。
Web ページ上のラジオボタンを選択します。
例: EC サイトのチェックアウトページでは、顧客は表示されているラジオボタンから希望する支払い方法を選択します。この操作を自動化するには、「ラジオボタンを選択」アクションを使用します。
Web ページを自動でスクロールし、特定のコンテンツを表示したり、長いページを移動したりできます。
例: EC サイトで、「スクロール」アクションを使用して商品一覧をスクロールし、すべての商品が読み込まれてデータ抽出できるようにします。
設定
スクロールタイプ:Web ページでどのようにスクロールを行うかを定義します。次のオプションを利用できます。
- UI 要素セレクター:UI 要素セレクターに基づいて、ページ上の特定の要素までスクロールします。利用できる UI 要素セレクターの詳細
- ピクセル数でスクロール:指定したピクセル数に基づいてページをスクロールします。
- スクロール方向:縦方向または横方向のどちらにスクロールするかを選択します。
- ピクセル数:スクロールするピクセル数を指定します。上方向または左方向にスクロールする場合は、負の値を使用できます。
12. ホットキーを送信
Web アプリケーション内で特定の操作やコマンドを実行するためのキーボードショートカットを自動化します。
例: 現在開いている Web ページをブックマークするために、Ctrl + D を使用する場合などです。
設定
- セレクタータイプ:XPath、ID、Name、CSS セレクターなど、さまざまなセレクタータイプをサポートしています。
- セレクター: 対象とする要素の Web コンポーネントまたはロケーターの値を入力します。この値は HTML DOM 内の要素に対応している必要があります。
修飾キー: ホットキーで使用する修飾キーを選択します。利用可能な修飾キーは Ctrl、Alt、Shift、Win です。
キー: 修飾キーと組み合わせてホットキーを構成するキーを選択します。
生成されたホットキー:作成されたホットキーの組み合わせが、この項目に表示されます。
13. テキストを入力
Web ページ上の入力フィールドやフォームに、テキストやデータを入力する操作を自動化します。
例:「テキストを入力」アクションを使用して、オンラインストアのポータルアプリにログインするためのユーザー名とパスワードの入力を自動化できます。
設定
- セレクタータイプ: XPath、ID、Name、CSS セレクターなど、さまざまなセレクタータイプをサポートしています。
- セレクター:対象とする要素の Web コンポーネントまたはロケーターの値を入力します。この値は HTML DOM 内の要素に対応している必要があります。
入力テキスト:フィールドに入力するテキストを指定します。
キーを挿入:Enter、Tab、Esc などの特殊キーを入力テキスト内に含める場合に使用します。
入力フィールドに既存のテキストがある場合:入力フィールド内の既存テキストをどのように扱うかを選択します。
- テキストを置き換え:既存のテキストを新しいテキストで置き換えます。
- テキストを追加:既存のテキストの末尾に新しいテキストを追加します。
入力前にクリック: 入力を行う前に、対象の UI 要素がアクティブになるようクリックしておく場合に使用します。
キー入力間の遅延(ミリ秒):より自然なタイピング速度を再現するために、各キー入力の間隔(ミリ秒)を設定します。
14. 要素の存在を確認
Web ページ上に特定のテキストまたは UI 要素が存在するかどうかを確認します。
例: 注文のチェックアウトページで、クーポンコードを適用する前に、「クーポンを適用」フィールドが存在するかどうかを確認できます。
設定
Web ページを確認:Web ページに対象の要素またはテキストが含まれているかを確認します。
テキスト: 検索したいテキストを入力します。
15. 切り替え
Web アプリケーション内で、開いている別のウィンドウやフレームにフォーカスを切り替えます。
例:複数の旅行サイト間で価格や空き状況を比較しながら、顧客の航空券やホテル予約を自動化する場合などに使用します。
設定
切り替え先: 現在アクティブなタブ内で、タブに切り替えるか iframe に切り替えるかを選択します。
タブインデックス: 切り替え先のタブのインデックスを指定します。たとえば、ブラウザーの最初のタブに切り替える場合は 1 を指定します。
iframe の選択: 次のいずれかの方法で iframe を選択できます。
- iframe インデックス:ページ上での iframe の順序
- Name または Id: 対象の iframe の Name または ID。
- UI 要素セレクター:UI 要素セレクターを使用して、ページ上の特定の iframe 要素を特定し、切り替えます。
16. Webページを更新する
Webページを再読み込みまたは更新して、最新のコンテンツにアクセスする処理を自動化します。
例: Webスクレイピングのシナリオで最新のデータを取得するために、金融ニュースサイトを定期的に更新します。
17. 要素セレクターを取得する
ページ上の特定の検索テキストに対応するHTMLセレクターを取得します。現在は、一致したHTML要素のXPathのみが取得されます。id や特定のクラス名などの一意な属性が存在しない、または不安定な場合や、要素の位置がページ上で固定されていない場合に主に有用です。
例: オンラインバンキングポータルでは、口座明細に「Download Statement」リンクがあるものの、その正確な位置は明細期間やページバージョンによって異なる場合があります。このような場合、「要素セレクターを取得」アクションで検索テキストに「Download Statement」と入力して要素のXPathを取得し、その後のアクションで利用できます。
検索テキスト: 要素セレクターを取得したい、Webページ上に表示されているテキストを入力します。
完全一致:入力したテキストと表示テキストが完全に一致する要素のみを一致として扱います。
部分一致: 入力したテキストを含む(部分文字列として含む)表示テキストを持つ要素を一致として扱います。
出力例: (複数のセレクターが一致した場合)
- {
- selectors_list : [
- {
- full_xpath : '/html/body/div/div/div/div/section/ol/li/p'
- },
- {
- full_xpath : '/html/body/div/div/div/div/section/ol/li[3]/p'
- },
- {
- full_xpath : '/html/body/div/div/div/div/section/ol/li[5]/p/b'
- },
- {
- full_xpath : '/html/body/div/div/div/div/section[2]/div/a'
- },
- {
- full_xpath : '/html/body/div/div/div/div/section[2]/div/a[2]'
- },
- {
- full_xpath : '/html/body/div/div/div/div/section[2]/div/a[3]'
- }
- ]
- }
18. 1 ページ進む
Webブラウザーの閲覧履歴で、次のページへ進みます。
例:ページ分割された商品一覧などで、次のページに移動します。
19. 1 ページ戻る
Webブラウザーの閲覧履歴で、前のページに戻ります。
例:ECサイトで特定の商品詳細を表示した後、「1 ページ戻る」アクションを使用して商品一覧に戻ることができます。
20. ブラウザーを閉じる
Webブラウザーセッションを終了し、開いているすべてのタブを閉じます。
例:すべての処理が完了したら、「ブラウザーを閉じる」アクションを使用して自動化プロセスを終了します。
UI 要素セレクター
UI 要素セレクターを使用すると、Webページ上の特定の要素を正確に特定して操作できます。これらのセレクターを使うことで、自動化処理はボタンやテキストフィールドなどを見つけて、クリック、入力、データ抽出といった操作を実行できます。Zoho では、要素を適切に特定できるよう、さまざまな種類のセレクターをサポートしています。
セレクターの種類:
ID
このセレクターは、HTML 要素の一意のid属性を使って要素を特定します。この属性は、HTML ドキュメント全体で一意になるよう設計されています。
使用タイミング: 明確で安定した id を持つ要素に最適です。利用できる場合は、一般的に最も信頼性が高く、高速なセレクターです。
例:id='myLoginButton'
Name
このセレクターは、HTML 要素の name 属性を使って要素を特定します。name 属性は、入力フィールド、ラジオボタン、チェックボックスなどのフォーム要素で一般的に使用されます。
使用タイミング:フォームコントロールを操作する際に便利です。特に、複数の要素が同じ name を共有している場合(例: ラジオボタングループ)に有効です。
例:name='usernameField'
CSS セレクター
CSS セレクターは、HTML 要素を選択してスタイルを適用するためのパターンです。タグ名、クラス、ID、属性、さらには他の要素との位置関係に基づいて、要素を簡潔に指定できます。
使用タイミング:見た目のスタイルや共通の属性に基づいて要素を特定したい場合に便利です。多くの一般的なケースでは、XPath よりも読みやすく効率的なことがよくあります。
例:div.product-card > h2.title(class が product-card の div の直下にある、class が title の h2 要素を選択)
XPath
XPath は、HTML(および XML)ドキュメント内の要素をナビゲートして選択するための言語です。絶対パスや相対パス、属性、テキスト内容、複雑な条件などを使って、ドキュメント構造をたどりながら要素を特定できます。
使用タイミング: 他のセレクターでは対応が難しい複雑なケースに有用です。一意の ID やクラスを持たない要素や、DOM 内の他の要素との関係に基づいて要素を選択する場合に利用できます。
例://input[@type='text' and @placeholder='Enter your email'](type が 'text' で、placeholder が 'Enter your email' の input 要素を選択)
Shadow DOM
Shadow DOM は、カプセル化された非表示の DOM 構造を作成するための Web 標準です。主に次の 3 つの要素で構成されます。
Shadow Host: 非表示の Shadow DOM を保持する通常の HTML 要素
Shadow Root: JavaScript によって Shadow Host にアタッチされる分離されたエントリポイントで、独立した DOM の境界を作成します。
Shadow Tree: Shadow Root 内にある、実際にカプセル化された HTML、CSS、JavaScript コンテンツです。
この Shadow Tree 内の HTML、CSS、JavaScript は、メインドキュメントの DOM とは分離されており、スタイルの競合を防ぎ、再利用性を高めます。
使用タイミング:Shadow DOM 内の要素を操作する必要がある場合に必須です。これらの要素はカプセル化されているため、メインドキュメントから標準的なセレクターでは直接アクセスできません。
メモ: Shadow DOM 内の要素を操作する場合は、UI 要素(Shadow Tree 内の要素)への XPath のみを使用する必要があります。セレクタータイプは Shadow DOM を選択し、セレクター値には対象要素への XPath を指定してください。
セレクター:
対応するセレクタータイプの具体的な値を入力します。
遅延設定
遅延設定を使用すると、UI 要素とのやり取りの際に、意図的な待機時間を挿入できます。このオプションにより、読み込み中や UI 要素が画面にまだ表示されていないことが原因で、アクションが失敗しないように遅延を設定できます。
アクション前の遅延(ミリ秒): ターゲットの UI 要素の準備状況に関係なく、次のアクションを実行する前に、ボットが待機する固定時間(ミリ秒)を設定します。
アクション後の遅延(ミリ秒):現在のアクションが完了した直後に、自動化処理が実行する固定の待機時間(ミリ秒)を設定します。これは、データ保存、画面遷移、ファイルのダウンロードなど、次のステップに進む前に後処理のための短い待機が必要な場合に役立ちます。
要素の待機(ミリ秒): 特定の UI 要素が画面上に表示されるまで、自動化処理が待機する最大時間(ミリ秒)を定義します。固定遅延とは異なり、これは動的な待機です。指定したタイムアウト時間内に対象要素が表示された場合、自動化処理はその時点ですぐに続行されます。たとえば、タイムアウトを 15000 ミリ秒(15 秒)に設定していて、要素が 10 秒後に表示された場合、自動化処理は 10 秒後に続行されます。要素がタイムアウト時間内に表示されない場合、そのアクションはエラーになる可能性があります。
メモ : 一般的な待機時間が必要な場合に、一定で予測可能な待機を行うには、アクション前の遅延を使用してください。特定の UI 要素の読み込みに必要な時間だけ待機して実行時間を最適化するには、要素の待機を使用すると、自動化をより効率的にできます。