AAのワークスペースには異常値検出やら貢献度分析やら、何やらすごそうな機能がついているぞ、と以前から思っていました。
しかしヘルプを見てみたところ、統計学がうんぬんよくわからない数式が、、、そっと閉じます。
今回それを使って解決できそうな問題に取り掛かることになり、食わず嫌いの領域をちょこっと調べました。おさらいしようと思います。
解決したいこと
ウェブサイトで内部検索キーワードを取得していました。
あるキーワードで異常が生じたら、そのタイミングで自動でアラートを飛ばしたい。
(異常とは、例えば前日の検索数が10件だったけれど、今日は100件も検索されている、等)
これは異常値検出なるものを使えば解決できるのでは?という背景があります。
異常値検出について
①何ができるか
過去のデータから独自のアルゴリズムを用いて、異常値かどうかを判断する。
ワークスペースでテーブルを作った時に、時どき、セルの右上にちょこんと黒い三角形マークがついているのを見たことがあると思います。
あれが、異常値検出でした。カーソルを合わせると、異常値~という文言が出てきます。
また、異常値かどうかということを条件にして(90%、95%、99%、99.75%、99.9%のしきい値、変化率、超過/未満)、アラートを飛ばすことも可能、(インテリジェントアラート)
②どうやって使うか
基本利用できる条件であれば自動で動いているようでした。
ワークスペースのテーブルの指標のとこにカーソルを合わせて出てくる歯車マークを押すと、異常値検出の項目があり、そこにチェックを入れる/入れないでオンオフを設定できます。
③制約条件
ワークスペースでの利用の場合、時系列系のテーブルもしくは折れ線グラフでのみ利用可能。
時系列系のテーブルとは、ディメンションに時間/日/週/月etcも持ってきたテーブルです。
試しに、ディメンションに検索キーワードを持ってきて、適当な指標をこしらえて異常値検出が使えるか試してみましたが、無理でした。
解決できるのか
結論からいうと、部分では可能だが、全体としては無理、という形に落ち着きました。
というのも、異常値検出を行うには、ディメンションに時系列系のものを持ってくる必要がありますが、仮にそうした場合、指標の列の箇所に個別の検索キーワードをずらっと並べていく形になります。
キーワードの数は膨大であり、かつ今後新しいキーワードが出現することも考慮すると、それは無理です。
とはいえ、個別のキーワードごとにインテリジェントアラートで異常値を条件にアラートを飛ばすことは可能です。
なので、部分ではできるが全体ではできない、、という結論になりました。
余談 ピカッと閃いたアイデア
一瞬これでいけるんじゃないかと思ったアイデア
ディメンション:「検索キーワード」
指標:「訪問回数」×「昨日」
指標に、「列の最大値」関数を使って昨日の検索キーワードでもっとも検索されたものの検索回数を取得。
→その指標の列は、皆同じ値になる。
そこからインテリジェントアラート作成
、、、できるかと思ったのですが、結局個別のキーワードごとのアラートになってしまうためボツでした。
おわり