[clickhouse] Clickhouse 关键特性的版本支持与演变

news/2024/9/29 18:55:32

clickhouse 21.10

Feature : UDF

  • 用户可通过添加lambda表达式,创建自定义Function
CREATE FUNCTION linear_equation AS (x, k, b) -> k*x + b;
SELECT number, linear_equation(number, 2, 1) FROM numbers(3);CREATE FUNCTION parity_str AS (n) -> if(n % 2, 'odd', 'even');
SELECT number, parity_str(number) FROM numbers(3);

Feature : intersect

  • 求多个数据集在某一维度上的交集,适合在用户分群等类似业务场景使用
select count( 1) from (select id as create_user from app.user_model  where 1=1  and product_count>=10 and product_count<=300   intersect select create_user from app.work_basic_model  where total_uv>=100 and total_uv<=350 intersectselect create_user  from app.work_basic_model  where total_uv>=200 and total_uv<=350 
)

类似:

with (select groupUniqArray(u_i)  from (select id as u_i from (select *from app.user_model  where 1=1  and product_count>=10 and product_count<=300    ) )) as u0, (select groupUniqArray(create_user)  from (select create_user from (select * from app.work_basic_model  where total_uv>=100 and total_uv<=350    ) )) as u1 ,(select groupUniqArray(create_user)  from (select create_user from (select * from app.work_basic_model  where total_uv>=200 and total_uv<=350    ) )) as u2
select length(arrayIntersect(u0,u1,u2)) as u

Feature : except

用第一个查询子集与后面所有子集求差集

select arrayJoin([1,2,3,4]) 
except 
select arrayJoin([1,2]) 
except 
select arrayJoin([4,5])

Feature : leftPad/rightPad(字符串左/右补齐)

  • 可用于对某些敏感信息进行脱敏处理
SELECT leftPad(substring(phone,-3,3), length( phone ), '*') 
from  (select '13126966152' phone)

Feature : splitByRegexp

  • 按照正则表达式对文本进行分割,分割后返回一个数组
-- 提取html中的所有去标签后的文本信息
select splitByRegexp('<[^<>]*>', x) 
from (select arrayJoin(['<h1>hello<h2>world</h2></h1>', 'gbye<split>bug']) x) 

Feature : mapContains/mapKeys/mapValues

  • 新增map数据类型相关处理函数
select map( 'aa', 4, 'bb' , 5) as m, mapContains(m, 'aa'),mapContains(m, 'cc'), mapKeys(m), mapValues(m)

Feature : countMatches

  • 基于正则表达式统计匹配数
select countMatches('foo.com bar.com baz.com bam.com', '([^. ]+)\.([^. ]+)')

Feature : accurateCastOrNull

  • 对字段值进行类型转换校验,转换成功返回转换后的类型数据,否则Null
SELECT accurateCastOrNull(2, 'Int8'), accurateCastOrNull('ss', 'Int8')

Feature : countSubstrings/countSubstringsCaseInsensitive

  • 计算某个字符串中包含特定字符的数量
select countSubstrings('com.foo.com.bar.com', 'com') ,countSubstringsCaseInsensitive('BaBaB', 'A')

X 参考文献

  • clickhouse新增函数介绍 - jianshu

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/66271.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

RTE 大会报名丨智能编解码和 AI 生成视频 ,RTE2024 技术专场第五弹!

AI 视频的爆炸增长,给新一代编解码技术提出了什么新挑战?语音 AI 实现 human-like 的最后一步是什么?当大模型进化到实时多模态,又将诞生什么样的新场景和玩法?所有 AI Infra 都在探寻规格和性能的最佳平衡,如何构建高可用的云边端协同架构?AI 加持下,空间计算和新硬件…

在docker安装Python环境提供给其他docker使用

1. 在宿主机新建一个目录 2. 在app目录下新建一个Dockerfile文件 本文永久更新地址:1. 在宿主机新建一个目录 在宿主机上新建一个目录如app/,在app目录里面导入项目需要依赖的包 在项目根目录下输入命令,导出python项目所有的依赖包 pip freeze > requirements.txt把导出的…

南沙C++信奥赛陈老师解一本通题 1942:【08NOIP普及组】ISBN号码

​【题目描述】每一本正式出版的图书都有一个ISBN号码与之对应,ISBN码包括9位数字、1位识别码和3位分隔符,其规定格式如“x-xxx-xxxxx-x”,其中符号“-”是分隔符(键盘上的减号),最后一位是识别码,例如0-670-82162-4就是一个标准的ISBN码。ISBN码的首位数字表示书籍的出版…

9.29每日总结

今天做完了“四则运算”和“生成验证码”,其中“生成验证码”这道题暑假的时候跟着网课做过初级版的,今天又加以改进了不少,为此把黑马的字符串章节差不多看完了,收获比较大的除了StringBuilder和StringJoiner之外,就是“验证码”这道题中用到的字符串转为字符数组(toCha…

《密码系统设计》第四周

第四周预习报告 学习内容Head First C 嗨翻 C 语言 第5章 《Windows C/C++加密解密实战》第 6,8,13,14 章 重点第14 章,第 6 章了解 ,第 8,13 参考 课程 mindmap 报告内容参考第一周AI 对学习内容的总结(1分) 要求让AI阅读学习内容并进行总结总结 1. Head First C 嗨翻 …

自然资源领域的组件报批:守护绿水青山的智慧钥匙

在追求绿色发展的今天,自然资源的合理利用与有效保护成为了社会关注的焦点。组件报批作为自然资源开发与保护的前置门槛,如同一把精密的钥匙,解锁着可持续发展的大门。本文将带您走进自然资源领域的组件报批世界,探析其背后的逻辑、重要性以及如何在实践中更好地守护我们的…

GIS在构建虚拟世界中的新机遇

地理信息系统(GIS)技术在构建虚拟世界中扮演着越来越重要的角色。随着数字孪生、虚拟现实(VR)、增强现实(AR)和混合现实(MR)等技术的发展,GIS为虚拟世界提供了地理信息和数据支持,增强了虚拟环境的真实感和交互性。1. 虚拟空间构建GIS技术可以获取地球表面的高程、坡…