# インターバル分析
# 1、インターバル分析の意義
インターバル分析は、ユーザーが2つの指定されたイベント間の時間インターバルを分析する分析モデルで、インターバル分析モデルを通じて、分析者はユーザーのある核心的な行動の発生頻度を知ることができ、あるいは前後の因果関係を持つ2つのイベントの転換時間を得ることができる。
インターバル分析では、次のビジネスシナリオを解決できます
- ユーザー登録後の初回支払いへの変換に時間がかかる
- ユーザーが2回の支払いを生成する間のインターバル時間を分析します
- ユーザーが初めて2つのレベル間を通過するインターバルを分析します
# 2、インターバル分析の位置と必要な権限
上部ナビゲーションバーの「行動分析」で「インターバル分析」を選択すると、インターバル分析モデルに入ります。以下は各役割タイプでのインターバル分析モデルの使用権限です
ルートアカウント | 管理者 | アナリスト | 一般メンバー | |
---|---|---|---|---|
インターバル解析モデル | ● | ● | ▲ | △ |
権限の説明:
●:必須
▲:デフォルトであり、なくてもよい
△:デフォルトではなく、あります
○:必ずなし
# 三、インターバル分析のページ概要
インターバル分析モデルは「指標設定区」、「展示選別区」、「展示グラフ区」、「表詳細区」で構成
- 「指標設定区」は「インターバルの始点イベント」、「インターバルの終点イベント」、「インターバル上限」、「インターバル関連属性」、「グローバル選別」、「グループ項目」など
- 「展示選別区」はアイコンと表の計算展示ロジックを設定でき、「分析時間帯」、「時間粒度」、「グループ設定」、「グラフスタイル」など
- 「グラフ表示区」にはインターバルデータのグラフ表示形式を選択でき、現在「箱須図」(つまり「箱型図」)と「ヒストグラム」の2種類のグラフ表示形式
- 「表展示区」には現在のグラフ展示形式の表データが展示され、「箱須図」と「ヒストグラム」には対応する2つの異なる表
# 四、インターバル分析の使用シーン
# 4.1指標設置区の設置
# 4.1.1指標設定区の概要
デフォルトの状態:
- 「起点事件」と「終点事件」は時間インターバルの起点と終点を表し、起点事件から終点事件までの時間差を計算することに相当する2つの異なる事件または同じ事件を選択でき、両者はアルゴリズム的に異なる
- 「グローバル選別」は「起点事件」と「終点事件」を同時に選別することができ、「起点と終点事件の事件属性交差」、「ユーザー属性」、「ユーザーグループ」と「ユーザーラベル」
- 「グループ化項目」は「起点イベントのイベント属性」、「ユーザー属性」、「ユーザーグループ」、「ユーザーラベル」
- 「インターバル上限」は計算されたインターバルデータを制限し、上限を超えるデータを除外し、デフォルトは1時間で、ドロップダウンボックスで日別、時間別、分別の時間上限
- 「インターバル関連属性」は、インターバルの始点と終点イベントの属性上の関連関係を約束している。例えば、始点と終点の属性値が一致し、計算時に属性値が一致する始点イベントと終点イベント
# 4.1.2インターバルアソシエーションプロパティ
いくつかの分析シーンでは、計算インターバルの始点と終点の2つのイベントを約束する必要があり、それらの属性値は一定の条件を満たす必要がある。例えば、同じ商品の2回の購入インターバルを計算し、商品の購入頻度を分析するには、2回購入した商品が一致することを約束する必要があり、システムでは、始点と終点の2つの行為の商品IDが一致することを設定でき、約束インターバルは同じ商品の購入インターバルである。
関連属性は、始点イベントと終点イベントからそれぞれのイベント属性を選択する必要があり、2つのイベントの関連属性は異なるが、属性タイプは一致する必要がある。
「始点イベントの関連属性」は始点イベントのすべてのタイプのイベント属性を選択でき、「終点イベントの関連属性」は終点イベントの「始点イベントの関連属性」タイプと一致するイベント属性しか選択できない。タイプを切り替える場合は、「開始イベントの関連プロパティ」から切り替える必要があります。切り替えると、「終点イベントの関連属性」も自動的に対応するタイプのイベント属性に切り替わります。
関連属性のタイプも選択可能な関連関係を決定し、すべてのタイプは2つの関連属性が等しいことを選択でき、数値型の関連属性は属性値がどれだけ異なるかを設定でき、より多くの分析シーンに適応できる。
# 4.1.3インターバルの上限
インターバルの上限はインターバルデータの範囲に相当し、上限は最大値に相当する。インターバルデータの算出が完了すると、インターバル上限に基づいて上限を超えるデータを
現在の上限の配置は「日(24時間に換算)」、「時間」、「分」の3種類の粒度をサポートし、各粒度はカスタム数値の入力
実際の使用中、インターバルの上限は何度も調整し、グラフと組み合わせて設定する必要があるかもしれない。参考になるデバッグフローは、「箱須図」の上位4桁と最大値との距離で調整が必要かどうかを判断し、「ヒストグラム」の最大値に近い区間で調整が必要かどうかを判断する。
# 4.2箱須図のグラフと表
# 4.2.1箱須図の展示選別区
ボックス図は、異なるデータ系列(日付とグループ)のインターバルデータの分布集約データを示し、その表示フィルタ領域の操作コントロールは以下の通り
- 分析期間
- 時間粒度
- グループ化オプション
- グループソート
- チャート切り替え
分析期間と時間粒度
「分析期間」は計算の時間範囲を制御し、始点イベントと終点イベントはその期間内に、時間帯の影響を受ける必要がある。
「時間粒度」は計算結果の最後の時間集約ルールを制御し、「日別」、「時間別」、「週別」、「月別」および「合計」を選択でき、「週別」は週の開始日をカスタマイズでき、「合計」は全期間を1つの結果に集約することに相当する。
特に、分析の「時間粒度」が「合計」を選択し、「グループ項目」を設定すると、「表示選別区」のグラフグループオプションの選択上限が開放され、デフォルトで300個が選択される。
グループ化オプションとグループ化ソート
計算に「グループ項目」が使用された場合にのみ「グループオプション」と「グループソート」が表示される。
「グループ化オプション」はグラフがどのデータ系列を示すかを制御し、「全体」とすべてのグループ項目を選択でき、テーブルには無効で、デフォルトで「全体」を含む上位4項目を選択し、上限も4項目である。
特に、「時間粒度」が「合計」の場合、「グループオプション」の上限は開放され、デフォルトは上位300個で、上限は設けられない。
「グループソート」は「グループオプション」のソートルールを制御でき、間接的にグラフの展示内容に影響し、選択できる項目は「データ量昇順」、「データ量降順」、「グループ項目昇順」、「グループ項目降順」で、デフォルトは「データ量降順」である。
# 4.2.2箱須図のグラフ展示エリア
ボックス図が示す時間インターバル分布の集約データは、ボックス図が示す「最大値」、「上4分位」、「中央値」、「下4分位」と「最小値」を示し、ホバリングフロートも同じ内容を示す。「時間粒度」が「合計」でない場合、時間次元はグループ間次元となり、データは時間ごとにクラスタ分けされ、横座標も時間次元を示し、グループ項目はグループ内次元である。
特に、「時間粒度」が「合計」で、「グループ項目」が設定されている場合、グラフの横座標は、次の図に示すように、日付からグループ項目に置き換えられます
# 4.2.3箱須図の表展示エリア
ボックス図の表は上図のように、表示されるデータはインターバルの「人数」、「インターバル数」、「平均値」、「最大値」、「上4分位」、「中央値」、「下4分位」と「最小値」で、人数はクリックして「ユーザーリスト」に入る。そのほか、全時間帯の集計データも展示する。
表データをエクスポートする必要がある場合は、表の右上にある「エクスポート」ボタンをクリックして、表形式で表データをエクスポートできます(表データは最初の1000件しか表示されず、エクスポートも最初の1000件しかエクスポートされず、ページ右上の「データダウンロード」を使用してより大量のデータをダウンロードできます。
「グループ項目」が設定され、「時間粒度」が「合計」でない場合、グループデータは時間列の前のプラスをクリックしてフローティングウィンドウで表示。
「グループ項目」が設定され、「時間粒度」が「合計」の場合、時間列はグループ列に置き換えられ、グループデータは表に直接表示
# 4.3ヒストグラムのグラフと表
# 4.3.1ヒストグラムの表示選別区
ヒストグラムは、あるデータ系列(日付とグループ)のインターバルデータの分布状況を示しており、その表示フィルタ領域の操作コントロールは以下の通りで
- 分析期間
- 時間粒度
- グループ化オプション
- 時間オプション
- 人数の切り替え
- チャート切り替え
分析期間と時間粒度
「分析期間」は計算の時間範囲を制御し、始点イベントと終点イベントはその期間内に、時間帯の影響を受ける必要がある。
「時間粒度」は計算結果の最後の時間集約ルールを制御し、「日別」、「時間別」、「週別」、「月別」および「合計」を選択でき、「週別」は週の開始日をカスタマイズでき、「合計」は全期間を1つの結果に集約することに相当する。
グループ化オプションと時間オプション
計算に「グループ項目」が使用された場合には「グループオプション」が表示され、「時間粒度」が「合計」でない場合には「時間オプション」が表示される。
ヒストグラムは1つのデータ系列しか表示しないので、「グループ化オプション」と「時間オプション」は単独でしか選択できず、2つのコントロールは表示するデータ系列を指定した。
「グループオプション」はデータ系列のグループ項目を制御し、「合計」とすべてのグループ項目を選択でき、テーブルには無効で、デフォルトで「合計」を選択する。
「時間オプション」はデータ系列の時間を制御し、「合計」と分析期間のすべての時間を選択でき、テーブルには無効で、デフォルトで「合計」を選択する。
人数の切り替え
「人数回数切替」コントロールは、ヒストグラムのデータが人数を示すかインターバルを示すかを切り替えることができる。
# 4.3.2ヒストグラムのグラフ表示域
ヒストグラムが示すデータ系列のインターバル分布状況は、グループインターバルが等しい頻度分布ヒストグラムで、データ範囲は0からインターバル上限までで、グループ数は現在12グループに制限されており、グループにデータがあるかどうかに関係なく図に示す。
「人数回数切替」コントロールでは、ヒストグラムが示す頻度がインターバル人数かインターバル人数かを切り替えることができる。
# 4.3.3ヒストグラムの表表示域
ヒストグラムの表は上図のように、表示されるデータは各時間インターバル区間の「人数」と「インターバル数」で、人数はクリックして「ユーザーリスト」に入る。そのほか、全時間帯の集計データも展示する。
表データをエクスポートする必要がある場合は、表の右上にある「エクスポート」ボタンをクリックして、表形式で表データをエクスポートできます(表データは最初の1000件しか表示されず、エクスポートも最初の1000件しかエクスポートされず、ページ右上の「データダウンロード」を使用してより大量のデータをダウンロードできます。
「グループ項目」が設定され、「時間粒度」が「合計」でない場合、グループデータは時間列の前のプラスをクリックしてフローティングウィンドウで表示。
「グループ項目」が設定され、「時間粒度」が「合計」の場合、時間列はグループ列に置き換えられ、グループデータは表に直接表示
# V.インターバル分析の計算ロジック
インターバル分析の計算論理は、2つのカテゴリに分けられ、1つは通常のインターバル計算で、始点と終点の事件が異なる場面に適用されるもう一つのカテゴリは特殊で、始点と終点の事件が完全に一致している、つまり同じ事件の場面に適用され、この章ではこの2つの計算論理を紹介する。
# 5.1始点と終点イベントの異なるインターバル
# 5.1.1最短インターバルの原則
インターバルの開始イベントがA、終了イベントがBであると仮定すると、ユーザーの行動シーケンスは次のとおりです
行動シーケンス | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
行動イベント | A | A | B | A | B | B |
インターバルを計算するとき、我々は「最短インターバル原則」を維持し、「近近近原則」とも呼ばれ、2つの始点事件が連続して発生した場合、前の始点事件を除外し、後の始点事件からインターバルを計算する一方、1つの始点事件の後に2つの連続した終点事件が発生した場合、前の終点事件とインターバルを計算するだけである。この原則に基づいて、インターバルが最短であることを保証できる。
上記の行為系列は、以下の2つのインターバルが生じる。
行動シーケンス | 2 | 3 |
---|---|---|
行動イベント | A | B |
行動シーケンス | 4 | 5 |
---|---|---|
行動イベント | A | B |
TIP
「最短インターバル原則」を採用する理由は二つある。一つは、インターバルが転換の意義をより表現できるようにするためで、転換の中で最もよく使われるのは最近の原則、つまり最近の行為が後続の行為に与える影響が最も大きい。第二に、データが欠落した場合、インターバルデータが受ける影響を低減するために、行為シーケンスが標準的なA-B交替行為フローであれば、近在原則は行為の一つが失われたことによるデータ異常問題を最大限に回避できる。
# 5.1.2時間除重の原則
複数の開始イベントのトリガー時間が完全に一致している場合、それは同じ動作と見なされ、1回のインターバルしか計算されません。
開始イベントと終了イベントのトリガー時間が完全に一致している場合、終了イベントはスキップされ、終了イベントを後方に探し続け、インターバルを続けます。
「時間除重原則」を採用するのは、実際には、インターバルの両端の行為は同時にトリガーできないと考えている。そうでなければ、インターバルを計算できず、転換の意義も体現できない。時間精度の問題で時間が同じ場合は、ミリ秒記録動作を推奨します。
# 5.1.3始点と終点のイベントが異なる計算ロジック
インターバルの開始イベントがA、終了イベントがBであると仮定すると、同じ時点で複数のアクションが発生しないことが保証されます。ユーザーのアクションシーケンスは次のとおりです
行動シーケンス | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
行動イベント | A | B | A | A | B | C | B | A | C | B |
各始点イベントAは終点イベントBを後方に探し、その間に「最短インターバル原則」と「時間除重原則」に従うと、4対のA-B行為に3つのインターバルが生まれ、それぞれ:
行動シーケンス | 1 | 2 |
---|---|---|
行動イベント | A | B |
行動シーケンス | 4 | 5 |
---|---|---|
行動イベント | A | B |
行動シーケンス | 8 | 10 |
---|---|---|
行動イベント | A | B |
シーケンス3のA事件とシーケンス7のB事件は「最短インターバル原則」によって除外された。
# 5.2始点と終点のイベントが同一イベントであるインターバル
始点事件と終点事件は同じ事件である必要があり、選別条件も一致している必要があるが、選別順序は異なる。
しかし、論理的な同一は必ずしも同一の事件とは考えられないことに注意する必要がある。例えば、起点事件は事件と選別の方式を採用し、終点事件は論理的に一致する仮想事件を選択した場合、異なる事件と見なし、前のアルゴリズムを採用する。
インターバルの始点イベントと終点イベントがAであると仮定すると、同じ時間に複数の行為が発生しないことが保証され、ユーザーの行為シーケンスは以下の通りで
行動シーケンス | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
行動イベント | A | B | A | A | B | C | B | A | C | B |
それぞれのイベントAは別のイベントAを後方に探し、イベントAはインターバルの始点としても、インターバルの終点としても、「時間除重原則」に従うと、4つのAイベントは3つのインターバルを発生し、それぞれ:
行動シーケンス | 1 | 3 |
---|---|---|
行動イベント | A | A |
行動シーケンス | 3 | 4 |
---|---|---|
行動イベント | A | A |
行動シーケンス | 4 | 8 |
---|---|---|
行動イベント | A | A |
「時間除重原則」の下では、何個のイベントAがあるかを考えると、A-1個のインターバルが生じる。
# 5.3関連属性とパケットの導入
関連属性とパケットの導入は、上記の計算のコアロジックを変更しない。この2つの機能は論理的には類似しているが、処理が異なる。
関連属性の導入はインターバル計算の前に行われ、まずすべての元データを関連属性でグループ化し、各グループ内でインターバルの計算を行う。パケット項目は、インターバル計算が完了した後に行われるインターバルデータパケットである。グループ化のタイミングが異なり、互いに干渉しないため、関連属性とグループも同時に使用できる。
# 5.4インターバルの上限
インターバルの上限は、インターバルの算出が完了した後に行われ、上限を超えるインターバルのデータは除去され、データが除去された後にグループ化および集約処理が行われる。
# VI。ベストプラクティス
# 6.1新規ユーザーの有料コンバージョンインターバル
インターバル分析は漏斗の補充として、重要な転換、例えば新しいユーザー登録後に初めて支払う。インターバル分析を通じて転換時間を細かく分析し、転換時間を理解し、砕氷有料の効果を評価することも、この指標を新しいユーザーの転換を評価する重点注目指標とすることもできる。
# 6.2行動に時間がかかる
実際の行為が行為の開始と終了を記録している場合、例えば商品ページに入る、商品ページを出る、あるいはもっとよく見られる場合は、アプリケーションを開いて閉じる。このような実際の行為はすべてインターバル分析によって時間のかかる計算を行うことができ、行為の開始と終了行為をインターバルの起点事件と終点事件に設定すればよい。
# 6.3滞在期間の長さ
ユーザーは、ゲームやアプリ内で、ランク付けされたメンバーシップシステムのように、ランク付け/ランク付けされた状態に長くなる可能性があります。このような等級制/階段制のシステムは極めてよく見られ、前述の会員等級、初心者の誘導手順、プレイレベルの進度、コースの完成の進度などを含めて、各種類の製品に採用されている。我々は、このようなシステムでユーザーがある段階から次の段階に入る時間インターバルを常駐時間と呼ぶことができ、つまり、ユーザーがある段階にどのくらい滞在したか、インターバル分析を通じて、関連属性とグループを合理的に使用することで、このような常駐分析を簡単に構築することができる。