# データ検証
データ収集プランで構成され、既にデータを送信しているプロジェクトについては、保存されたデータの品質が期待を満たしているか否かを検証できます。データ検証に、システムは指定された範囲のデータ品質をバッチでスキャンし、検証基準を満たさないイベントまたはプロパティを識別します。
検証には主に次のものが含まれます。
- 送信されたデータとデータ収集プランで策定されたデータ処理ルールとの違い;
- プロパティのnull値率、プロパティのnull率が指定した値よりも大きい場合、異常として識別されます;
注意:データの検証範囲には、イベントとカスタムプロパティが含まれ、プリセットプロパティは検証されません。
# データ検証ルールの構成
ページの右上にある「データ検証」 をクリックして検証ルールを設定すると、イベントデータまたはユーザーデータの検証を選択できます。
(1)イベントデータ検証
検証の範囲は、イベントの時間、イベントの範囲、およびフィルター条件に従って構成できます。
- イベント時間:検証イベントの時間範囲。デフォルトは前日で設定されていますが、カスタマイズも可能です。尚、注意点として、この時間は送信されたデータの #time フィールドを参照しており、プロジェクトのタイムゾーンオフセットに影響されません;
- イベント範囲:検証の必要があるイベント。デフォルトの設定ではすべてのイベントが対象ですが、イベント範囲はカスタマイズもできます。例えば:データ検証のために新しいバージョンで追加された収集プランを選択する等;
- フィルター条件:イベントデータをフィルタリングできます。クライアントSDKを介してデータを収集および送信する場合、特定のソースからのデータを指定して検証することができます;
プロパティのNull率の検証ルールを設定します。 Null率の限界値と統計ルールを含む:
- Null率の限界値:送信されたプロパティのNull率が限界値を超えると、検証結果に異常と表示されます。
- 統計ルール:プロパティのNull値率に空の文字列を含めるかどうかを選択できます。
(2)ユーザーデータ検証
ユーザーデータの検証範囲とプロパティNull率の検証ルールを設定します。検証イベントデータと同じです。
# 検証結果
検証計算が完了すると、検証レポートを表示できます。
イベントデータの検証結果:
検証結果 | 説明 |
---|---|
成功 | 送信されたデータはデータ収集プランと一致しており、プロパティのヌル値率は設定された限界値よりも低くなっています |
未送信 | 選択した検証範囲内では、イベントデータは送信されません |
異常 | 以下の条件に該当する場合、異常として記録されます: 1. データ収集プランにないイベントあります。 2. データ収集プランには含まれていないが、実際にプロパティが送信されています。 3. 欠落しているプロパティがあります。つまり、データ収集プランにありますが、実際には送信されたデータにはありません。 4. 送信されたプロパティタイプとデータ収集プランのプロパティタイプの間に矛盾があります。 5. プロパティヌル値は設定した限界値を超えています。 |
ユーザーデータの検証結果:
検証結果 | 説明 |
---|---|
成功 | 送信されたプロパティデータはデータ収集プランと一致しており、プロパティのヌル値率は設定された限界値よりも低くなっています。 |
異常 | 以下の条件に該当する場合、異常として記録されます。 1. データ収集プランにないユーザープロパティがあります。 2. プロパティの欠落:データ収集プランでは、ユーザープロパティが送信されていません。 3. 送信されたプロパティタイプは、データ収集プランのプロパティタイプと一致しません。 4. プロパティのヌル率が設定された限界値を超えています。 |