データ予測

データ予測

Zoho Analyticsには、データの予測機能が用意されています。グラフ内のデータをもとに、今後のデータの傾向を予測することができます。データ予測は、高度な演算処理/アルゴリズムをもとに行われます。グラフ内の既存のデータが詳細に分析され、分析結果をもとに最適な予測データが算出されます。データの予測機能の設定はとても簡単です。専門知識や複雑な設定は必要ありません。



このページでは、Zoho Analyticsのデータ予測機能の概要や設定方法について説明します。


1.予測機能とは?

予測機能とは、過去のデータの傾向に基づいて今後のデータ傾向を予測する機能です。データ予測は、高度な演算処理/アルゴリズムをもとに行われます。グラフ内の既存のデータが詳細に分析され、分析結果をもとに最適な予測データが算出されます。


2.予測機能に対応しているグラフの種類は?

予測機能に対応しているグラフの種類は、以下のとおりです。 

  • 折れ線グラフ
  • 棒グラフ
  • 積み上げ棒グラフ
  • 散布図
  • 面グラフ
  • 積み上げ面グラフ
  • 複合グラフ(バブルチャートを除く)

3.予測機能を設定するには?

予測機能は、グラフの設定画面から設定できます。予測機能を設定するには、以下の手順を実施します。

  1. 対象のグラフを編集モードで開きます(予測機能に対応しているグラフの種類については、 こちら をご参照ください)。 
  2. 画面右上の [分析] アイコンをクリックします。
  3. [予測] を選択します。 
  4. [予測を追加する] をクリックします。予測の対象となるY軸のデータ系列がすべて表示されます。
  5. 一覧から予測するY軸のデータ系列を選択します。予測の設定項目が表示されます。[]
  6. [予測の長さ] の欄で、予測するデータポイントの件数を選択します。
  7. [最新データの除外] の欄で、予測データの計算に使用しないデータポイントの件数を選択します。グラフ内の最後のデータポイント(日付の新しいデータポイント)から、選択した件数分のデータポイントが計算から除外されます。
  8. [信頼区間の割合] の欄で、算出する予測データの精度(信頼区間)の割合を指定します。信頼区間の割合は70%から95%の範囲で選択できます。また、信頼区間の割合を指定しないことも可能です。その場合は[なし]を選択します。この設定は、対象のグラフが折れ線グラフの場合にのみ表示されます。
  9. [凡例名] の欄で、グラフ上に表示する予測データの凡例の名前を入力します。 
  10. [書式設定] の欄で、予測データの表示形式を指定します。線の色やスタイルを選択できます。
  11. [適用する] をクリックします。予測データが新しいデータ系列としてグラフ上に表示されます。
    凡例の欄には、予測データの項目が追加されます。凡例の項目をクリックすると、予測データの表示/非表示を切り替えることができます。


4.複数のY軸を持つグラフで予測機能を設定できますか?

はい。予測機能は複数のY軸を持つグラフでも設定できます。



5.[色]の欄に列が指定されているグラフにおいて予測機能を設定できますか? 

はい。 [色] の欄に列が指定されているグラフにおいて予測機能を設定できます。 予測機能 は、 [Y軸] の欄で指定した列の値に基づきます。そのため、色分けされた列の値にも予測機能が適用されます。



6.グラフの設定画面に[予測]タブが表示されません。なぜですか?

予測機能は、一定の条件を満たしている場合にのみ設定できます。主な条件は以下のとおりです:

  • 予測機能を設定するにあたって、対応しているグラフは次のとおりです。その他の種類のグラフで予測機能を設定することはできません:
    線グラフ、棒グラフ、積み上げ棒グラフ、散布図、面グラフ、積み上げ面グラフ、レーダーチャート、複合グラフ
  • グラフのX軸には、データの種類が日時または数値の列を配置する必要があります。
  • 予測機能を設定するにあたって、X軸に配置できるデータ系列は1つのみです。テキスト、色、サイズ、ツールチップのいずれかに列が指定されている場合、予測機能を設定することはできません。
  • Y軸の値には、集計関数が適用されている必要があります。データ予測を適用できるのは、集計関数が適用されている値に対してのみです。なお、グラフ内で、すべてのY軸の列の値に累計などの高度な集計関数が適用されている場合、予測機能は無効になります。
  • グラフ内で数値の列のデータに対してフィルターを適用した場合、予測機能は無効になります。抽出したデータに基づいた予測では、精度が低下する可能性があるためです。



7.予測機能の仕組みは?

データ予測は、高度な演算処理/アルゴリズムをもとに行われます(例:ARIMA…自己回帰和分移動平均、ETS…指数平滑法など)。グラフ内の既存のデータが詳細に分析され、分析結果をもとに最適な予測データが算出されます。予測機能では、さまざまな設定をカスタマイズできます。予測するデータポイントの件数、データ予測の計算に使用しないグラフ内のデータポイントの件数、予測データの表示形式など、要件に合わせて予測機能を設定することが可能です。

予測機能の仕組みは、主に以下のとおりです:

  1. 予測機能により、グラフ内の既存のデータが分析されます。
  2. 既存のデータの分析結果をもとに、グラフ内のデータにおける周期性が識別されます。周期性は、自己相関分析によって識別されます。
  3. 同様に、傾向、ランダム性が算出されます。
  4. データの分析処理を繰り返しながら、算出された周期性、傾向、ランダム性が微調整されます。
  5. 予測モデルをもとにデータ予測が実施され、既存のデータとの整合性が検証されます。予測モデル:ARIMA(自己回帰和分移動平均)、ETS(指数平滑法)、回帰分析など。
  6. 算出された予測データの精度が、ハインドキャストという手法によって検証されます。ハインドキャストでは、過去のデータポイントをもと予測データを事後的に算出し、予測データと実際の過去のデータを比較して整合性を検証します。
  7. すべての検証が完了した後、最終的な予測データが作成されます。

8.共有したグラフでは、グラフ上に表示される予測データが異なります。なぜですか?

グラフを共有した際に、元のグラフでは適用されていないフィルター条件が適用されている可能性があります。フィルター条件を適用してグラフを共有すると、グラフ内のデータポイントの件数が変化します。データ予測が設定されているグラフにフィルター条件を適用して共有すると、算出される予測データも変化します。

9.グラフ上の予測データのデータポイントで元データを表示したり、ドリルダウン(データの掘り下げ)を実施したりできません。なぜですか?

予測データのデータポイントには、対応する元データがありません。そのため、グラフ上の予測データのデータポイントで元データを表示したり、ドリルダウン(データの掘り下げ)を実施したりすることはできません。

10.  データに適用されている予測モデルを確認できますか?

はい。適用されている予測モデルの詳細情報を確認できます。確認するには、以下のいずれの手順を実施します。

  1. グラフの表示画面で、予測データのいずれのデータポイントをクリックします。



  2. グラフの設計画面予測データの凡例をクリックし、[予測の情報]を選択します。



  3. グラフの設定画面から[予測]タブに移動し、対象の予測モデルにカーソルを合わせて[予測の情報]アイコンをクリックします。



予測モデルの詳細情報の画面には、以下の情報が表示されます。

  1. 一般情報
  2. モデル情報
  3. 評価指標

一般情報

一般情報では、以下の内容を確認できます。 

  • 学習期間: 予測データを算出するにあたって使用されたデータの期間を表します。 
  • 予測期間:  予測データの期間を表します。 

モデル情報

モデル情報では、適用されている予測モデルの詳細情報を確認できます。確認できる内容は、以下のとおりです。


項目  説明
一般項目
予測モデル グラフに適用されている予測モデル名を表します。
モデルの詳細情報 グラフに適用されているサブの予測モデルを表します。
頻度 時系列の頻度を表します。 
データ項目 予測データにおける傾向/変動周期の有無を表します。  
ARIMA
ARIMA係数
対象のデータにおける、過去の観測値の重みを表します。現在に近いほどゼロに近い値が係数として使用されます。現在の観測値(算出される予測データ)は、過去の観測値よりも最新の観測値に関連しているためです。
メモ:予測データを算出するにあたって、自己回帰、移動平均、季節性自己回帰、季節性移動平均の値がない場合、この項目は表示されません。
STL
分解値  グラフ内のデータから算出された傾向、周期性、ランダム性(残差)の各値を表します。
ETS
  周期性と傾向の組み合わせに応じた、指数関数のパラメーターを表します。
パラメーター名/説明
決定係数(R square) 算出モデルによって算出された値が、実際のデータとどの程度一致しているかを表します。
自由度調整済み決定係数(Adjusted R squared) 自由度を考慮した上で、算出モデルによって算出された値が実際のデータとどの程度一致しているかを表します。通常の決定係数に比べて、データの一致する度合いをより正確に把握することができます。
F統計量(F Statistic) 傾向線に対する実際のX軸の値の影響度を表します。値が大きいほど、影響度が高いことを表します。
P値(P Value) 実際のデータが正しいと仮定した場合において、正しくない値が算出される割合を表します。算出された値が、実際のデータと矛盾していないかどうかを示す値です。P値が小さいほど、算出された値に矛盾がない(値が正しい)ことを表します。

評価指標

評価指標では、以下の内容を確認できます。 


  • RMSE(Root Mean Square Error/平均平方二乗誤差):予測値と実際のデータの差分(誤差)を表します。



  • MAPE(Mean Absolute Percentage Error/平均絶対誤差率):予測値と実際のデータの差分(誤差)における割合を表します。

  • WMAPE(Weighted Mean Absolute Percentage Error/加重平均絶対誤差率):MAPEの割合を算出する際に、実際の値に重み付けして算出した割合を表します。

  • 品質:予測データの品質を表します。品質として、以下のいずれかが表示されます。 
    • GOOD(高)
    • ACCEPTABLE(中) 
    • POOR(低)
  • AICC(赤池情報量規準/有限修正):予測データの品質を確認するための値を表します。


  • BIC(ベイズ情報量基準):予測データの品質を確認するための値を表します。数式は以下のとおりです。


    パラメーター:
    L:尤度を表します。
    K:パラメーター数を表します(例:アルファ、ベータ、ガンマが使用されている場合は「3」)。
    n:サンプルのサイズを表します。

    • LEPS(Linear Error in Probability Space):予測データの累積分布の値(CDF)と予測データの値の差分における絶対値の平均を表します。


トラブルシューティングのヒント

1.グラフの設定画面に[予測]タブが表示されません。なぜですか?

予測機能は、一定の条件を満たしている場合にのみ設定できます。上記の質問と回答を参照し、条件を満たしているかどうかご確認ください。


2.以前設定した予測データが表示されません。なぜですか?

グラフの種類や内容が変更され、予測機能の利用条件が満たされなくなった可能性があります。


3.グラフで予測機能を設定しましたが、データが完全に無視されているため予測機能が無効になっている旨のメッセージが表示されます。なぜですか?

予測設定の[最新データの除外]の欄で、グラフ内のすべてのデータポイントをデータ予測の計算から除外するように指定した可能性があります。


4.グラフで予測機能を設定しましたが、パターンを識別するのに十分なデータがないため予測機能が無効になっている旨のメッセージが表示されます。なぜですか?

グラフ内において、予測データを算出するのに必要なデータ量がない可能性があります。


5.グラフで予測機能を設定しましたが、空の値が40%以上あるため予測機能が無効になっている旨のメッセージが表示されます。なぜですか?

予測データの計算に使用する既存のデータに空の値(null値)が多く含まれる場合、算出される予測データの精度が低下する可能性があります。予測データの精度を維持するため、既存のデータ内の空の値(null値)が40%を超える場合、予測機能は無効になります。


6.グラフで予測機能を設定しましたが、5件を超えるデータポイントが必要なため予測できない旨のメッセージが表示されます。なぜですか?

予測データを算出するには、予測データの計算に使用するデータポイントが必要です。予測データの精度が低下する可能性があるため、データポイントが5件以下の場合、予測機能を利用することはできません。解決策として、X軸に配置した日付の列において適用する関数を変更することで、データポイントの件数が増える可能性があります。たとえば、日付の列において[年]の関数が適用されている場合、[年と月]の関数に変更すると、データポイントの件数が増加します。