このページでは、Zoho Analyticsのデータ予測機能の概要や設定方法について説明します。
予測機能とは、過去のデータの傾向に基づいて今後のデータ傾向を予測する機能です。データ予測は、高度な演算処理/アルゴリズムをもとに行われます。グラフ内の既存のデータが詳細に分析され、分析結果をもとに最適な予測データが算出されます。
予測機能に対応しているグラフの種類は、以下のとおりです。
予測機能は、グラフの設定画面から設定できます。予測機能を設定するには、以下の手順を実施します。
はい。予測機能は複数のY軸を持つグラフでも設定できます。
予測機能は、一定の条件を満たしている場合にのみ設定できます。主な条件は以下のとおりです:
データ予測は、高度な演算処理/アルゴリズムをもとに行われます(例:ARIMA…自己回帰和分移動平均、ETS…指数平滑法など)。グラフ内の既存のデータが詳細に分析され、分析結果をもとに最適な予測データが算出されます。予測機能では、さまざまな設定をカスタマイズできます。予測するデータポイントの件数、データ予測の計算に使用しないグラフ内のデータポイントの件数、予測データの表示形式など、要件に合わせて予測機能を設定することが可能です。
予測機能の仕組みは、主に以下のとおりです:
グラフを共有した際に、元のグラフでは適用されていないフィルター条件が適用されている可能性があります。フィルター条件を適用してグラフを共有すると、グラフ内のデータポイントの件数が変化します。データ予測が設定されているグラフにフィルター条件を適用して共有すると、算出される予測データも変化します。
予測データのデータポイントには、対応する元データがありません。そのため、グラフ上の予測データのデータポイントで元データを表示したり、ドリルダウン(データの掘り下げ)を実施したりすることはできません。
予測モデルの詳細情報の画面には、以下の情報が表示されます。
| 項目 | 説明 |
| 一般項目 | |
| 予測モデル | グラフに適用されている予測モデル名を表します。 |
| モデルの詳細情報 | グラフに適用されているサブの予測モデルを表します。 |
| 頻度 | 時系列の頻度を表します。 |
| データ項目 | 予測データにおける傾向/変動周期の有無を表します。 |
| ARIMA | |
| ARIMA係数 |
対象のデータにおける、過去の観測値の重みを表します。現在に近いほどゼロに近い値が係数として使用されます。現在の観測値(算出される予測データ)は、過去の観測値よりも最新の観測値に関連しているためです。
メモ:予測データを算出するにあたって、自己回帰、移動平均、季節性自己回帰、季節性移動平均の値がない場合、この項目は表示されません。
|
| STL | |
| 分解値 | グラフ内のデータから算出された傾向、周期性、ランダム性(残差)の各値を表します。 |
| ETS | |
| 周期性と傾向の組み合わせに応じた、指数関数のパラメーターを表します。 | |
| パラメーター名/説明 | |
| 決定係数(R square) | 算出モデルによって算出された値が、実際のデータとどの程度一致しているかを表します。 |
| 自由度調整済み決定係数(Adjusted R squared) | 自由度を考慮した上で、算出モデルによって算出された値が実際のデータとどの程度一致しているかを表します。通常の決定係数に比べて、データの一致する度合いをより正確に把握することができます。 |
| F統計量(F Statistic) | 傾向線に対する実際のX軸の値の影響度を表します。値が大きいほど、影響度が高いことを表します。 |
| P値(P Value) | 実際のデータが正しいと仮定した場合において、正しくない値が算出される割合を表します。算出された値が、実際のデータと矛盾していないかどうかを示す値です。P値が小さいほど、算出された値に矛盾がない(値が正しい)ことを表します。 |
評価指標
評価指標では、以下の内容を確認できます。
パラメーター:
L:尤度を表します。
K:パラメーター数を表します(例:アルファ、ベータ、ガンマが使用されている場合は「3」)。
n:サンプルのサイズを表します。
予測機能は、一定の条件を満たしている場合にのみ設定できます。上記の質問と回答を参照し、条件を満たしているかどうかご確認ください。
グラフの種類や内容が変更され、予測機能の利用条件が満たされなくなった可能性があります。
予測設定の[最新データの除外]の欄で、グラフ内のすべてのデータポイントをデータ予測の計算から除外するように指定した可能性があります。
グラフ内において、予測データを算出するのに必要なデータ量がない可能性があります。
予測データの計算に使用する既存のデータに空の値(null値)が多く含まれる場合、算出される予測データの精度が低下する可能性があります。予測データの精度を維持するため、既存のデータ内の空の値(null値)が40%を超える場合、予測機能は無効になります。
予測データを算出するには、予測データの計算に使用するデータポイントが必要です。予測データの精度が低下する可能性があるため、データポイントが5件以下の場合、予測機能を利用することはできません。解決策として、X軸に配置した日付の列において適用する関数を変更することで、データポイントの件数が増える可能性があります。たとえば、日付の列において[年]の関数が適用されている場合、[年と月]の関数に変更すると、データポイントの件数が増加します。