# 用户标签

# 一、用户标签的定义

用户标签是具有某一系列特征的人群集合,标签值是“一组相似人群”的集合,通过标签和标签值可以方便将人群结构化。

如:用户标签为“付费用户”,标签下有标签值分别为“大 R”、“中 R”、“小 R” 的 3 种群体。

# 二、用户标签的意义与作用

通过某种创建方式,将相似特征用户按特征值汇总后组成标签。方便在各种模型中使用用户标签进行细分分析。

(1)提供多种创建方式,适合更深度的用户群体下钻分析

(2)同一维度下的多个相似人群组成标签,每种人群作为一个标签值,实现关联人群间的联结。

# 三、用户标签的设置入口和快速使用

具有用户标签查看权限的用户从“用户分析-用户标签”进入,设置用户标签

选择一种标签创建方式创建用户标签

查看标签中用户的详细信息

在模型筛选、分组项查看中使用标签

# 四、用户标签的使用场景

# 4.1 用户标签与标签值

用户标签是一组具有“同一维度下,多组相似人群”的集合,标签值是“一组相似人群“的集合。

如:用户标签为“付费用户”,标签下有标签值分别为“大 R”、“中 R”、“小 R”的 3 种群体。

属于某一标签的用户有且只有唯一的标签值

# 4.2 用户标签的创建

新建时,可选择“自定义条件”、“ID 上传”、“首末次特征”“指标值”,选择后进入具体创建配置页面。

# 4.2.1 自定义条件

筛选特定行为条件或用户属性的用户,并赋予标签值;用户优先匹配至满足条件且顺序靠前的标签值中。

比如,可以创建付费用户标签,再通过自定条件将用户分为高消费用户、中消费用户、低消费用户。这样,后续可通过分组该标签,实现同时分析三种类型用户。

(1)自定义条件时,所有用户将按照标签值的先后顺序依次判断组成。即同一用户满足上层标签值后,将不再参与下层标签值筛选。

(2)所有标签值中的组成用户,合成了标签用户。

(3)新增标签值始终在最后一个标签值后。创建时一个标签最多设置 20 组标签值。达到 20 时,无法新增。

(4)条件创建的标签上限为 200 个。

(5)更新方式选择动态更新数据时,可以设置延迟时间。

# 4.2.2 ID 上传

上传 ID 定义标签用户,并同时赋予标签值

选择某一用户属性作为判断用户的关联字段,根据模板要求的规范上传

(1)第二列值相同的用户将组成同一个标签值

(2)如果用户没有标签值,那么该用户将被摒弃,并在最后一步结果展示时给到提示

(3)ID 上传创建的标签值,记录的独立标签值个数没有上限

# 4.2.3 首末次特征

指定时段内,用户完成首/末次事件的属性,作为标签值

比如,埋点层面没有记录用户的首次登录时间,当需要通过首登日期去做分组或筛选时。

那么可以选取从开服日至今作为分析时段,以首次登录的时间作为用户的标签值。

# 4.2.3.1 创建时的标签条件设置

完成条件的用户将属于标签(无标签值除外)

1、分析时段:默认选中动态的“过去 7 日”,可选择动态或静态时间

2、完成事件:可选择任意一个物理事件或虚拟事件

事件的筛选条件:可以筛选事件属性或用户属性

事件类型 可筛选的事件属性
物理事件 事件属性
虚拟事件 虚拟事件的事件属性(并集)

选择时间型属性作为筛选条件时,按照项目的时区计算时间

即使完成了事件,当标签值为空时,该用户依然将会被剔除出标签

# 4.2.3.2 创建条件的标签值确定

首末次信息
首次
末次

分析属性:可选发生时间或事件的属性

事件的虚拟属性、维度表属性都可以进行选择

属性 数据类型
发生时间* 时间
数值型属性 数值
列表型属性 列表
布尔型属性 布尔
时间型属性* 时间
字符串型属性 字符串

数据类型将决定标签的数据类型,及使用标签时的关键字。

发生的时间按照项目的时区计算,非个人配置的时区。

# 4.2.4 指标值

指定时段内,用户完成事件的聚合指标,作为标签值。

比如,需要记录用户在一段时间内的累计付费数据,通过这个数据为用户分层。

那么可以将这段时间的付费金额总和作为标签值。再通过筛选或分组对用户进行全面分析。

# 4.2.4.1 创建时的标签条件设置

完成事件的用户将属于标签(指标为空的用户被剔除)

分析时段:默认选中动态的”过去 7 天“,可选择动态或静态时间

完成事件:可选择任意一个物理事件或虚拟事件或任意事件

事件的筛选条件:可以筛选事件属性或用户属性

事件类型 可筛选的事件属性
物理事件 事件属性
虚拟事件 虚拟事件的事件属性(并集)

选择时间型属性作为筛选条件时,按照项目的时区计算时间

# 4.2.4.2 创建条件的标签值确定

通过属性值确定用户的标签值

分析特征:分析角度

分析角度:由角度+角度的选项构成

事件的虚拟属性、维度表属性都可以进行选择

属性 角度
总次数
天数
小时数
数值型属性 总和、均值、中位数、最大值、最小值、去重数
列表型属性 列表去重数、列表元素去重数
布尔型属性 为真数、为假数、去重数
时间型属性* 去重数
字符串型属性 去重数

发生的时间按照项目的时区计算,非个人配置的时区。

# 4.2.4.3 编辑公式场景

每一个公式需要编辑显示名,公式中元素通过四则运算组成公式

(1)公式计算中各个组成部分的组成规范

事件描述 指标描述/数据类型 分析角度
任意事件 次数、天数、小时数
元事件 次数、天数、小时数
元事件 事件属性(数值型) 总和、均值、最大值、最小值、去重数
元事件 事件属性(列表型) 列表去重数、元素去重数
元事件 事件属性(布尔型) 为真数、为假数、为空数、不为空数、去重数
元事件 事件属性(其他类型) 去重数

(2)整体筛选条件与细分筛选条件

整体筛选条件的可选属性为:公式所有组成部分的公有事件属性或全部用户属性。

属性的筛选逻辑与事件分析一致。

所有用户样本为:满足整体筛选条件,且参与过组成部分中任一事件

(3)未参与事件的取值

用户在公式中的未参与事件的分析角度,值记为 0

(4)计算结果的异常情况

当使用除法时,可能出现除数为 0 的情况,此时数值无法计算。将定义为“未知”,该名用户将被剔除出标签。

# 4.3 创建过程中的限制

左半部分为标签信息部分

(1)标签名称、显示名会默认代入,用户创建时可修改

(2)备注选填,最多可输入 50 字。

右半部分为标签值信息部分

(1)数据更新方式

更新方式默认选择为:手动更新

手动更新时:创建后将不会自动更新用户,可手动点击“更新”按钮更新用户。

自动更新时:前一日标签信息将在凌晨进行更新。由于产品数据在 TA 集群外的流转及推送可能存在延迟,故设置更新延迟,以确保数据完整性。例如更新延迟设为 30 分钟,则将于每日 00:30 执行前一日的标签更新任务。

自动更新后:可配置延迟时间(分钟),默认配置为“0”,可设置“0~1440”之间的整数。

# 4.4 用户标签在模型中的使用

# 4.4.1 用户标签下的筛选条件

用户标签筛选,进一步选择“标签值”的场景

用户标签中选择“标签”作为筛选项目时,属性逻辑、关联值与“字符串”类型相同

关于标签筛选逻辑的列表

标签的数据类型 可选项
字符串 等于、不等于、包括、不包括、有值、无值、正则匹配、正则不匹配
数值 等于、不等于、小于、大于、有值、无值、区间
时间 绝对时间、相对当前日期、相对事件发生时刻、有值、无值
列表 存在元素、不存在元素、元素位置、有值、无值
布尔 为真、为假、有值、无值

# 4.4.2 用户标签分组项使用

选择用户分群、用户标签作为分组项时

分组项选项 分组下的分组项
用户标签 标签值、“(未知)”

用户标签下的分组为“标签值”与“未知”(相当于不属于标签)

# 4.5 用户标签列表页

(1)通过点击切换标签名,切换右侧标签详细信息部分内容

(2)新增条件创建标签或 ID 上传创建标签

(3)点击用户标签人数,向右进入用户标签详情页

(4)可进入详情进入标签定义

# 4.6 用户标签详情页

用户标签详情页,包含基础标题、标签筛选框、人数表格信息等元素

左半部分

沿用列表页标签详细信息,去除标签值下详细人数信息。

右半部分

(1)标签信息:创建方式、标签值数量、合计人数

(2)自定义条件时,可点击“>”打开条件详情弹窗。查看具体标签值下的创建条件

(3)ID 上传创建时,无交互,不能打开详情弹窗

条形图:

(1)仅展示数量最多的前 5 项的人数及占比,剩余项由“其他”表示

(2)鼠标移入时,展示该标签值下的备注信息,移入“其他”时无内容。

用户详情信息:

(1)第一二三列为:账户 ID、访客 ID、标签值。其余列为选中的用户属性

用户列表页,仅在该场景下有标签值信息

(2)下载用户列表与配置展示属性

按照当前选中的展示属性下载列表

(3)标签值列的筛选:自定义条件标签,支持在指标值中筛选