# Trino SQL 进阶函数介绍
本章节将介绍 Trino SQL 中进阶函数的用法,如果希望了解 Trino SQL 的更多内容,可以访问 Trino 的官网文档 (opens new window)
# try 函数 与 try_cast 函数
try(expression)
try
函数会其中表达式的异常情况,并将异常值返回为 NULL,如果不使用try
函数,则语句出现异常时将直接报错导致查询失败。
您还可以搭配coalesce
函数使用特定值替换 NULL 值,比如下列,将字段a
转换为整数,转换失败则可转换为 0
coalesce(try(cast("a" as integer)), 0)
以上类型转换可以使用 try_cast 函数来实现,try_cast
的作用与cast
函数一致,都是对值进行类型转换,区别在于try_cast
在类型转换错误时会返回 NULL,避免造成查询失败。
coalesce(try_cast("a" as integer), 0)
# 时间/日期函数
使用current_date
、current_time
、current_timestamp
、localtime
与localtimestamp
时不用加圆括号,Trino 也不支持加圆括号的写法,使用时请注意。
字符串与时间的转换
可以直接在字符串格式的时间表达式前加关键字timestamp
,比如timestamp '2020-01-01 00:00:00'
,即可直接获得对应的时间
date_parse
与date_format
分别是字符串转时间以及时间转字符串,用法都是传入需要转化的字段以及对应的 format,如下分别是字符串$part_date
转时间以及时间#event_time
转字符串:
date_parse("$part_date", '%Y-%m-%d')
date_format("#event_time", '%Y-%m-%d %T')
以上函数的 format 格式使用的是 MySQL 的格式,如需使用 JAVA 格式,可使用函数format_datetime
与parse_datetime
时间计算函数
函数date_add
可对时间进行偏移,unit
为单位,value
为偏移量,如果value
为负数,则为往前偏移
date_add(unit, value, timestamp)
函数date_diff
,用来计算两个时间的差值,算法是timestamp2 - timestamp1
,返回的是单位为unit
的整数
date_diff(unit, timestamp1, timestamp2)
两个函数的unit
的取值范围,可以参考以下表格
单位 | 描述 |
---|---|
millisecond | 毫秒 |
second | 秒 |
minute | 分钟 |
hour | 小时 |
day | 日 |
week | 周 |
month | 月 |
quarter | 季度 |
year | 年 |
# 开窗函数
Trino 支持开窗函数,窗口函数中有不少非常实用的函数,如 first_value 与 last_value 很适合计算一段时间内第一次或最后一次做某事的值。
比如计算每名用户首次产生购买商品行为时购买的物品:
SELECT user_id,first_purchase_product FROM
(SELECT user_id,first_value(product_name) over(partition by user_id order by time) AS first_purchase_product FROM log.purchase)
GROUP BY user_id,first_purchase_product
first_value
与last_value
需要搭配over
子句使用,over
子句中的partition by
类似于group by
,即按照所给字段分组,order by
则会决定进行排序的字段。
# JSON解析
如果您上报的数据或导入的历史数据中存在JSON类型的字段,在入库时都会转为文本类型(字符串),您可以在查询语句中提取使用。
字符串转JSON
json_parse
可以将符合JSON格式的字符串转成JSON类型数据:
json_parse(JSON '{"abc":[1, 2, 3]}')
JSON转其他类型
您可以通过CAST
将JSON转化为类型的数据,比如将刚刚转成JSON的字符串再次转成 MAP:
CAST(json_parse('{"abc":[1, 2, 3]}') AS MAP(varchar,array(integer)))
如果希望将字符串重新转成JSON,可以使用json_format
:
json_format(json_parse('{"abc":[1, 2, 3]}'))
直接提取JSON数据
在很多情况下,您可能只需要提取JSON中的部分数据,此时可以使用json_extract_scalar
,通过json_path表达式找到所需内容:
json_extract_scalar(json, json_path)
您也可以使用json_extract_scalar
直接对JSON字符串进行提取,无需手动转化为JSON类型,比如提取abc
的第一个元素:
json_extract_scalar('{"abc":[1, 2, 3]}','$.abc[0]')