业界动态
大数据Presto(一):Presto介绍
2024-10-31 22:01

Presto是Facebook在2012年开发的,是专为Hadoop打造的一款数据仓库工具。在早期Facebook依赖Hive做数据分析,Hive底层依赖MapReduce,随着数据量越来越大,使用Hive进行数据分析,时间可能需要分钟级到小时级别,不能满足交互式查询的数据分析场景。2012年秋季,Facebook开发Presto,目前该项目在Facebook中运行超过30000个查询,每日处理数据PB以上。Presto的查询速度是Hive的5-10倍。

大数据Presto(一):Presto介绍

综上,Presto是由Facebook2012年开发,基于内存、支持并行计算的分布式SQL交互式查询引擎,不是数据库,支持多种数据源,针对GB~PB数据查询可以达到秒级返回结果,主要用于秒级查询OLAP数据分析场景。

Presto官网地址:

Presto可以支持MySQL、PostgreSQL、cassandra、Hive、Kafka等多种数据源查询。

Presto支持部分标准SQL对数据进行查询,并提供SQL shell进行SQL查询。但是Presto不支持存储过程,不适合大表Join操作,因为Presto是基于内存的,多张大表关联可能给内存带来压力。

Presto有很好的扩展向,可以自定义开发特定数据源的Connector,使用SQL分析指定Connector中的数据。

在Presto中可以根据业务需要使用特定类型的Connector来读取不同数据源的数据,进行join关联计算。

Presto是基于内存计算的,减少磁盘IO,计算更快。Presto性能是Hive的10倍以上。Presto能够处理PB级别的数据,但Presto并不是把PB级别的数据一次性加载到内存中计算,而是根据处理方式,例如:聚合场景,边读取数据,聚合,再清空内存,再去读取数据加载内存,再聚合计算,再清空内存... 这种方式。如果使用Join查询,那么就会产生大量的中间数据,速度会变慢。

由于Presto是基于PipeLine进行设计的,因此在进行海量数据处理过程中,终端用户不用等到所有的数据都处理完成才能看到结果,而是可以向自来水管一样,一旦计算开始,就可以产生一部分结果数据,并且结果数据会一部分接一部分的返回到客户端。

Presto查询引擎是一个Master-Slave的架构,由一个Coordinator节点,一个Discovery Server节点,多个Worker节点组成,Discovery Server通常内嵌于Coordinator节点中。Presto架构图如下:

上图中各个角色功能如下:

主要负责解析SQL语句,生成执行计划,分发执行任务给Worker节点执行。所有的Worker启动后都会注册给Discovery Server,Coordinator通过内嵌的Discovery Server来知道将任务发送给哪些个Worker节点。

    以上就是本篇文章【大数据Presto(一):Presto介绍】的全部内容了,欢迎阅览 ! 文章地址:http://dfvalve.xrbh.cn/news/4268.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 迅博思语资讯移动站 http://keant.xrbh.cn/ , 查看更多   
最新新闻
【原】免翻!Google谷歌最新镜像,国内直接访问,某高校低调提供,赶紧使用
据不完全统计,订阅「王不留」公众号的学生里,80%考上了国内外知名高校研究生▼点击下方名片,关注「王不留」私信:国家地理,
B站核心代理商|商业起飞、带货起飞、信息流一站式开户代运营服务|Story信息流板块介绍
B站广告推广的重要性B站作为一个不断发展并拥有众多用户的视频分享平台,吸引了越来越多的广告主的关注。在进行B站广告推广时,
不受国内限制的浏览器 不受限制的万能浏览器
  无论是电脑上,还是手机,浏览器是必不可少的软件,不过现在浏览器泛滥,下面万商云集小编给大家介绍下不受限制的万能浏览器
TCL电子与阳光100成立合资公司,打造共享智能家居公寓
  8月16日, 在时空艺境浮窗全场景TV新品发布会上,TCL电子与地产领头羊阳光100置业集团正式签署战略合作协议,将在喜马拉雅共
docker 搭建frp内网穿透以及frp详细使用
下载说明 去github官网下载最新版本,链接地址:https://github.com/fatedier/frp/releases/download/ windows对应&
一听就火的网名
一听就火的网名  由于网络是一个虚拟的世界,为了避免使用真实姓名带来的麻烦所以发明了网名。下面是小编帮大家整理的一听就火
今日头条广告怎样投放的效果好?如何找到目标客户?
方法/步骤1一、头条广告怎样投放的效果好1、线上宣传与线下活动推广本地服务如果只依赖发发传单,超过90%的用户拿到传单后都无法
MobileFile Search(手机文件查找工具) v1.1.5.0 绿色版
  MobileFile Search是一款手机文件查找和管理工具,旨在帮助用户从手机中快速查找用户需要的文件;这款软件不需要安装,因此
人类生活中的“昆虫制造”
文|伯镇一提到昆虫或虫子,总让人不免感到厌恶。但实际上,人类的生存离不开昆虫。作为经济昆虫的代表,虫胶、蚕丝、胭脂虫红曾
本企业新闻

点击拨打: