# 用户标签
# 一、用户标签的意义
用户标签是具有某一系列特征的人群集合,标签值是“一组相似人群”的集合,通过标签和标签值可以方便将人群结构化。
如:用户标签为“付费用户”,标签下有标签值分别为“大 R”、“中 R”、“小 R” 的 3 种群体。
通过某种创建方式,将相似特征用户按特征值汇总后组成标签,方便在各种模型中进行细分分析;同时,可以在看板内添加标签,日常数据监控更加方便
提供多种创建方式,适合更深度的用户群体下钻分析
同一维度下的多个相似人群组成标签,每种人群作为一个标签值,实现关联人群间的联结
标签可以创建不同日期的历史版本(备份),可以看不同标签值用户数随日期变化的情况
标签可以切换不同的分析主体,对应不同的计算逻辑和分析场景
# 二、用户标签的位置和适用角色
具有用户标签查看权限的用户从“用户分析-用户标签”进入,设置用户标签
公司超管 | 管理员 | 分析师 | 普通成员 | |
---|---|---|---|---|
查看标签列表 | ● | ● | ● | ○ |
新增、编辑、删除自建标签 | ● | ● | △ | ○ |
编辑、删除其他人的标签 | ● | ○ | ○ | ○ |
权限说明:
● 角色必有 ▲ 角色默认有,可以没有 △ 角色默认没有,可以有 ○ 角色必没有
# 三、用户标签的页面概览
选择一种标签创建方式创建用户标签
查看不同用户的标签情况
在模型筛选、分组项查看中使用标签
# 四、用户标签的使用场景
# 4.1 用户标签与标签值
用户标签是一组具有“同一维度下,多组相似人群”的集合,标签值是“一组相似人群”的集合。
如:用户标签为“付费用户”,标签下有标签值分别为“大 R”、“中 R”、“小 R”的 3 种群体。
属于某一标签的用户有且只有唯一的标签值,如果某一标签有历史版本则用户在该标签下的每份历史版本(每个日期)内的标签值可能不同
# 4.2 用户标签的创建
新建时,可选择“自定义条件”、“ID 上传”、“首末次特征”、“指标值”四种标签类型之一,选择后进入具体创建配置页面。
# 4.2.1 标签基本属性设置
(1) 标签信息
无论什么类型的标签,都需要提供以下基本信息
标签名:不超过24个字符,必须以字母开头;可输入数字、下划线或小写字母;标签创建后,标签名不可修改
分析主体:从已配置的分析主体中选择,默认选择预置分析主体(TA用户ID);标签创建后,分析主体不可修改
显示名:不超过24个字符
备注(选填):最多可输入50个字符
(2) 数据更新方式
仅当标签类型不为“ID 上传”时可设置,默认选项为“手动更新”
手动更新:创建后将不会自动更新用户,可手动点击“更新”按钮更新用户。
自动更新:自动更新任务默认在每日服务器时间零点执行,可设置延迟时间兼容数据在TA集群外的流转及推送,确保数据完整。
举例:更新延迟设为 30 分钟,则将于每日 00:30 执行前一日的标签更新任务。
(3) 数据备份方式
仅当数据更新方式选择自动更新时可设置
不备份:标签自动更新时,不会将数据备份为标签的历史版本
自动备份:标签自动更新时,会将标签数据同步到标签前一日的历史版本中
注意:自动备份必须在设置「自动更新」的情况下才能生效,如果更新方式选择的是「手动更新」,则无论自动备份是否关闭,都不会进行0点的自动备份
# 4.2.2 自定义条件
筛选特定行为条件或用户属性的用户,并赋予标签值;用户优先匹配至满足条件且顺序靠前的标签值中。
比如,可以创建“付费用户标签”,再通过自定义条件将用户分为高消费用户、中消费用户、低消费用户。后续可将该标签作为分组项,同时分析三种类型用户。
自定义条件时,所有用户将按照标签值的先后顺序依次判断组成。即同一用户满足上层标签值后,将不再参与下层标签值筛选
所有标签值中的组成用户,合成了标签用户
新增标签值始终在最后一个标签值后。创建时一个标签最多设置 20 组标签值。达到 20 时,无法新增
条件创建的标签上限为 200 个
如果标签的分析主体是事件属性则只能选择「做过某事」条件,不能选择「没做过某事」,也不可选择「用户属性满足」条件。 同时,事件下拉列表里只有包含该属性的事件。
# 4.2.3 ID 上传
根据模板要求的规范上传 ID 定义标签用户,并同时赋予标签值,可以选择某一用户属性作为判断用户的关联字段
第二列值相同的用户将组成同一个标签值
如果用户没有标签值,那么该用户将被摒弃,并在最后一步结果展示时给出提示
ID 上传创建的标签值,记录的独立标签值个数没有上限
ID 上传类型的标签,不可设置“数据更新方式”和“数据备份方式”
如果分析主体选择的是TA用户ID(#user_id),可以选择某一用户属性作为判断用户的关联字段,上传当时符合选择的用户属性(第一列)的TA用户ID都将被赋予对应的标签值;如果选择的是其他分析主体,则会直接将上传文件里的第一列作为分析主体ID,且不会进行校验,在上传前请仔细检查。
# 4.2.4 首末次特征
指定时段内,用户完成首/末次事件的属性,作为标签值
举例:埋点层面没有记录用户的首次登录时间,但又需要通过首登日期去做分组或筛选条件
可以选取从开服日至今作为分析时段,以首次登录的时间作为用户的标签值。
1.分析时段:默认选中动态的「过去 7 天」,可选择动态或静态时间
2.首末次信息:可选择首次或者末次
3.完成事件:可选择任意一个物理事件或虚拟事件,可以筛选事件属性或用户属性
事件类型 | 可筛选的事件属性 |
---|---|
物理事件 | 事件属性 |
虚拟事件 | 虚拟事件的事件属性(并集) |
选择时间型属性作为筛选条件时,将按照项目的默认时区计算时间
4.分析属性(标签值):可选发生时间或事件的属性,事件的虚拟属性、维度表属性都可以进行选择;数据类型将决定标签的数据类型,及使用标签时的关键字。
属性 | 数据类型 |
---|---|
发生时间* | 时间 |
数值型属性 | 数值 |
列表型属性 | 列表 |
布尔型属性 | 布尔 |
时间型属性* | 时间 |
文本型属性 | 文本 |
发生的时间按照项目的时区计算,非个人配置的时区。
注意:即使有完成事件,当标签值为空时,该用户依然将会被剔除出标签;如果标签的分析主体是事件属性,则事件下拉列表仅可选择包含该事件属性的事件
# 4.2.5 指标值
指定时段内,用户完成事件的聚合指标,作为标签值。
比如,需要记录用户在一段时间内的累计付费数据,通过这个数据为用户分层。
那么可以将这段时间的付费金额总和作为标签值。再通过筛选或分组对用户进行全面分析。
# 4.2.5.1 创建时的标签条件设置
完成事件的用户将属于标签(指标为空的用户被剔除)
分析时段:默认选中动态的「过去 7 天」,可选择动态或静态时间
完成事件:可选择任意一个物理事件或虚拟事件或任意事件
事件的筛选条件:可以筛选事件属性或用户属性
事件类型 | 可筛选的事件属性 |
---|---|
物理事件 | 事件属性 |
虚拟事件 | 虚拟事件的事件属性(并集) |
选择时间型属性作为筛选条件时,按照项目的时区计算时间
注意:如果标签的分析主体是事件属性,则事件下拉列表仅可选择包含该事件属性的事件
# 4.2.5.2 创建条件的标签值确定
通过分析指标确定用户的标签值,即(「事件」+「属性」+「计算方法」)或直接(「事件」+「计算方法」)
属性 | 计算方法 |
---|---|
总次数 | |
天数 | |
小时数 | |
数值型属性 | 总和、均值、中位数、最大值、最小值、去重数 |
列表型属性 | 列表去重数、列表元素去重数 |
布尔型属性 | 为真数、为假数、去重数 |
时间型属性* | 去重数 |
文本型属性 | 去重数 |
发生的时间按照项目的时区计算,非个人配置的时区。
# 4.2.5.3 编辑公式场景
每一个公式需要编辑显示名,公式中元素通过四则运算组成公式
1.公式计算中各个组成部分的组成规范
事件描述 | 指标描述/数据类型 | 分析角度 |
---|---|---|
任意事件 | 次数、天数、小时数 | |
元事件 | 次数、天数、小时数 | |
元事件 | 事件属性(数值型) | 总和、均值、最大值、最小值、去重数 |
元事件 | 事件属性(列表型) | 列表去重数、元素去重数 |
元事件 | 事件属性(布尔型) | 为真数、为假数、为空数、不为空数、去重数 |
元事件 | 事件属性(其他类型) | 去重数 |
2.整体筛选条件与细分筛选条件
整体筛选条件的可选属性为:公式所有组成部分的公有事件属性或全部用户属性。
属性的筛选逻辑与事件分析一致。
所有用户样本为:满足整体筛选条件,且参与过组成部分中任一事件
3.未参与事件的取值
用户在公式中的未参与事件的分析角度,值记为 0
4.计算结果的异常情况
当使用除法时,可能出现除数为 0 的情况,此时数值无法计算。将定义为“未知”,该名用户将被剔除出标签。
# 4.3 历史版本的操作
# 4.3.1 自动备份
如果自动备份开启,则在标签自动更新时,将更新的数据写入到过去那一天的历史版本中,即当日的自动更新任务同时完成了两件事情
# 4.3.2 手动备份
除了自动备份,还可主动对指定日期的历史版本进行计算,主要用于补充缺失版本、重算失败任务或更新标签计算逻辑等场景。
重新计算:对于已经计算(备份)过的日期,可以点击“重新计算”按钮对该日期的数据进行计算
批量计算:点击“批量计算”按钮,可以选择日期范围内的全部历史版本或者异常版本进行计算
注意:历史版本批量计算可能耗时较长,请选择合适的时间进行
TA系统在手动备份时会尽可能还原当时的数据,如果标签规则中使用了用户属性(包括使用了用户属性的虚拟事件属性或维度表属性),需要在对话框内选择选项:
是否使用用户历史数据:使用用户属性时,是否使用对应日期的用户属性备份数据
用户历史数据缺失时的处理方式:该选项需要在勾选“是否使用用户历史数据”时才可以选择,如果该天的用户历史数据缺失,使用用户当前数据代替还是相对最近的数据代替
# 4.3.3 清理历史版本
如果该标签之前保存的历史版本已经不需要了,可以点击“清理历史版本按钮”,所选日期范围内全部的历史版本都将被清理
注意:清理历史版本的操作不可逆,在清理前请务必注意;如果不小心清理,可以参考前面的“批量计算”操作补回缺失版本的数据
# 4.4 用户标签在模型中的使用
# 4.4.1 用户标签下的筛选条件
用户标签筛选,进一步选择“标签值”的场景
用户标签中选择“标签”作为筛选项目时,属性逻辑、关联值与“文本”类型相同
关于标签筛选逻辑的列表
标签的数据类型 | 可选项 |
---|---|
文本 | 等于、不等于、包括、不包括、有值、无值、正则匹配、正则不匹配 |
数值 | 等于、不等于、小于、小于等于、大于、大于等于、有值、无值、区间 |
时间 | 绝对时间、相对当前日期、相对事件发生时刻、有值、无值 |
列表 | 存在元素、不存在元素、元素位置、有值、无值 |
布尔 | 为真、为假、有值、无值 |
# 4.4.2 用户标签分组项使用
选择用户分群、用户标签作为分组项时
分组项选项 | 分组下的分组项 |
---|---|
用户标签 | 标签值、(null) |
用户标签下的分组为“标签值”与(null)(相当于不属于标签),如果不想在数据中看到(null),可以在筛选条件里选择该标签“有值”
# 4.4.3 历史标签的使用
如果所使用的标签有历史版本,可以在筛选条件或者分组项使用时指定所需的版本
最新版本:按用户最新的标签值计算
动态匹配:按用户在事件发生当日的标签值计算
历史版本:按用户在某个特定日期的标签值计算,仅可选择有数据的历史版本(日期)
注意:目前事件分析、留存分析、漏斗分析、分布分析、路径分析、间隔分析支持标签选择版本,属性分析仅能使用标签的最新版本
# 4.5 用户标签列表页
通过点击标签名,可以进入用户标签详情页(数据详情);点击标签名旁边的icon可进入用户标签详情页(历史版本管理)
点击右上角“新建标签”按钮可创建标签
点击操作栏icon可以进行各种操作
点击「编辑标签」可进入标签编辑页面
点击「另存为」可将当前标签的条件带入标签新建页面
点击「更新数据」会以当前日期作为基准更新日期重新计算标签最新版本
点击「下载」可以直接下载用户标签数据(仅ID上传标签有该按钮)
点击「删除」可以删除该标签。请注意,标签删除后使用该标签的报表、虚拟属性将不可用
# 4.6 用户标签详情页
用户标签详情页,包含标签基础信息、数据详情和历史版本管理三部分
# 4.6.1 标签基础信息
展示标签基础信息,和用户标签列表页展示内容基本一致
- 点击「查看配置」即可打开详情弹窗,查看具体的创建条件
- 点击标签名称旁边的「更多」按钮,可以进行操作,同用户标签列表页一致
# 4.6.2 数据详情
展示标签最新版本和历史版本的数据,最新版本将以「今天」的日期展示,默认会展示最近31天的数据(过去30天+最新版本),如果历史版本的时间跨度不到30天,即最早一份历史版本的日期在30天内,则展示从该日期到今天的数据。
如果标签值的类型是数值型、列表型或时间型,可以自定义数据的汇总方式
(1)表格展示
表格内展示按标签值分组后的用户数量及占比,同时展示「全部」,即有标签值的所有用户。点击带下划线的数字可以进入用户列表,和分析模型一致,用户列表除了属性外,还会展示标签值和标签日期。
表格支持两种展示样式,默认为按分组查看
按分组查看
按日期查看
(2)图表展示
如果标签有历史版本,则支持所有图表类型;如果标签没有历史版本,则只能按柱状图、饼图展示。当有历史版本的标签切换到柱状图或者饼图时,需要从日期范围内选择需要展示的版本
折线图
数值堆积图
百分比堆积图
柱状图
饼图
# 4.6.3 历史版本管理
1.历史版本概览
展示历史版本宏观数据,包括跨越的时间段、包含天数、版本数,以及异常状态的版本数等等
2.历史版本列表
展示跨度内的每一天的历史版本信息以及状态,可在列表中进行操作
版本状态及说明:
- 正常
- 缺失:该日期没有历史版本
- 过时(条件变更):该历史版本使用的标签逻辑和当前的标签逻辑不一致
- 过时(类型变更):该历史版本的标签值的数据类型和当前的标签逻辑不一致
- 计算中:正在计算中,计算完成后会有消息通知
- 计算失败:计算发生异常,未成功计算
- 排队状态:等待计算
# 五、最佳实践
# 5.1 获取历史行为指标
通过“指标值”标签,可以计算出每个用户历史行为的指标,比如历史总付费金额(即全生命周期付费额),启动应用的总次数以及总时长等等。这些总体指标,能够很好地对用户进行分层,无论是在属性分析中直接查看标签值的分布情况,还是在分析模型中使用标签做分组和筛选,标签都可以起到非常强大的作用。
# 5.2 获取首次行为
通过“首末次特征”标签,可以计算出每个用户首次产生某行为的时间,搭配虚拟属性可以获取首次事件标识(将标签中的首次时间和事件时间相比,相等则为首次,反之则不为首次)。在创建标签增加更多筛选条件,可以获取更为定制化的首次事件。
# 5.3 使用历史标签准确还原事件发生时的用户状态
同一个用户,随时间推移可能从“小R”变为“大R”,按用户付费级别分组的时候,应该把该用户昨天产生的行为,认为是小R产生的,今天产生的行为,认为是大R产生的。所以计算历史上用户的“总充值金额”标签后,将该标签作为分组项,按照“动态匹配”的方式,查看每日的数据,就能得到想要的结果了。
# 5.4 查看每天回流用户的表现
通过“自定义条件”标签,可以按以下条件筛选出当日回流用户:
今天有登录
过去7天没有任意事件(即未登录)
# 5.5 按账号统计累计充值金额
创建标签时,可以使用自定义分析主体作为标签对象,切换后逻辑也将相应调整;以付费事件为例,创建指标值标签:
分析时段为自1月1日至今
标签值为付费事件的付费金额总和
分析主体为账号(用户属性,预置分析主体为角色,一个账号下可以有多个角色)
该逻辑代表的含义是,以1月1日至今,单个账号下所有角色的付费金额总和作为该账户ID的累计充值金额
关于分析主体的更多说明,可以参考分析主体