您的位置 首页 > 数码极客

“聚合数据如何使用教程“聚合助手使用教程…

大数据分析

Elasticsearch是一个实时的分布式搜索分析引擎,它不仅能够让你高效快速的查询你的数据(大数据),而且还能及时响应你对数据的简单分析,进行对数据的聚合查询。这类似于SQL中的聚合,使用GROUP BY分组,使用COUNT、SUM、AVG、MAX、MIN等获取数据的分组条目数量、汇总求和、平均值、最大值和最小值。下面就对ES的聚合查询进行简单介绍。

Aggregations

聚合允许我们可以向数据提出一些复杂的请求,虽然功能完全不同于搜索,但它使用相同的数据结构,这意味着聚合的执行速度很快并且就像搜索一样几乎是实时的。这对报告和仪表盘的展示是非常强大的,你可以实时显示你的数据,让你立即回应,而不是对你的数据进行汇总,因此你可以让你的报表展示随着你的数据变化而变化,提高数据的处理分析效率。

Buckets&Metrics

要掌握聚合,就先要明白有关聚合的两个概念,分别是Buckets(桶)和Metrics(指标),也可以理解为SQL中的分组和聚合函数。如下代码所示:

SELECT COUNT(color) FROM table GROUP BY color

其中GROUP BY color就相当于桶(分组),COUNT(color)就相当于指标(聚合函数)。每个聚合都是有Buckets和Metrics组合而成的,聚合中所有的操作都是在一个请求内完成并且只遍历一遍数据,因此它的效率非常高。

Buckets:简单来说就是满足特定条件的文档的集合,根据人的姓别、年龄等可以分别进行分组,当聚合开始被执行时,每个文档里面的值通过计算来决定符合哪个分组的条件。如果匹配到,文档将放入相应的组并接着进行聚合操作,Buckets也支持嵌套,提供层次化的或者有条件的划分方案。

Metrics:大多数指标是简单的数学运算,和SQL的聚合函数一样,有获取汇总、平均值、已经最大、最小值,这些都是通过文档的值来计算。

聚合使用

学习聚合的最佳途径就是用实例来说明,因此我们要多运用聚合查询。下面就简单说明如何使用ES中的聚合。依然使用前面安装ES时的数据进行说明介绍,使用Elasticsearch-head这个插件进行简单的请求,如下图所示:

简单聚合查询

通过POST方式发起一个数据请求,由请求的参数可以看出,我们配置了一个“aggs”字段(也可以使用“aggregations”字段),然后这里面添加了四个聚合函数,名称分别是“sum_age”、“avg_age”、“max_age”和“min_age”,使用聚合时名称是可以随意指定,但最好是有意义的名称。然后在没一组指定相应的指标(聚合函数),点击“提交请求”,就会显示右侧的请求结果数据。有结果数据可以看出,聚合查询的结果数据在字段“aggregations”中,并以自己定义的函数名展示。处理使用上面的聚合函数外,还可以使用“terms”进行分组,如下图所示:

聚合查询分组

聚合查询中的数据是实时执行的,一旦文档可以被搜到,它就会被聚合,因此我们可以使用ES制作出很多出色的实时展示的数据报表。至此关于Elasticsearch的聚合查询就先介绍到这,不足之处还望多指正,如果对你有帮助记得分享关注哦~

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“聚合数据如何使用教程,聚合助手使用教程,爱快链路聚合使用教程,聚合数据官网,聚合数据,聚合数据api”边界阅读