Stinger Initiative：让Hive提速100倍|电子爱好者

admin管理员组
文章数量:1550655

Stinger Initiative：让Hive提速100倍

发表于 2013-02-27 20:31| 2392次阅读| 来源 Hortonworks| 4 条评论| 作者 Alan Gates

hadoop 大数据 Hortonworks Stinger Initiative 摘要：在Hadoop生态圈，没有一家公司有比Hortonworks有更高的统治力，在Apache Hadoop社区，他占据最多的PMC和committer。他和Cloudera是社区利益最主要的争夺者。Stinger Initiative是一个彻底提升Hive效率的工具，与此同时，Hortonworks还在Apache孵化着多个项目，进一步扩大领地。

【CSDN编译】自从2007年Facebook提出Apache Hive和HiveQL后，他们已经成为事实上的Hadoop上的SQL接口。如今，各种类型的大公司或小公司都在使用Hive这中非常普遍的方法来访问Hadoop数据，从而给公司或者用户带来更多的价值。同时，还有许多公司通过大量已存的BI工具生态系统来达到相同的目的，这些BI工具同样使用Hive作为接口。

最初，Hive用于建立大规模的成批计算，这在数据报告、数据挖掘以及数据准备等应用场景很有效。这些应用场景很重要，但是Hadoop的需求十分广阔，企业用户越来越需要Hadooop具备更高的实时性和交互性。在Hortonworks，我们相信开源社区的创新力要超过任何一个专有的提供商，Stinger initiative再次证明了这一点，我们会联合（社区）伙伴一起提升Hive的性能。

什么是Stinger Initiative？

能让Hive回答问题的速度满足普通人（例如一个问题的返回时间在5-30秒），如大数据探索、可视化、参数化报告等场景，而且并不依赖其它工具，并分发到用户社区，可以很好的维护企业原有的投资和开发者的Hive技能。

图：Stinger Initiative的roadmap

为此，我们发布了Stinger Initiative，并进入社区进行分享，为的是让Hive支持更多SQL，并实现更好的性能。一直以来，HiveQL都没有什么变化，而这次HiveQL将变得更强大。同时，与现有的工具保持一致形成完美的互补。

首先，我们让Hive与人们在Hadoop上想要的查询想匹配。这包括增加类似OVER子句的分析功能，支持WHERE子查询，以及调整Hive的样式系统更多的符合标准的SQL模型。
其次，我们优化了Hive的请求执行计划，我们内部某些测试结果显示，优化后的请求时间减少了90%。我们也着眼于在Hive执行引擎中增加一些改动，我们确信这可以增加单一Hive task每秒钟处理记录的数量。
第三，我们在Hive社区中引入了新的列式文件格式（如ORC文件），提供一种更现代、高效和高性能的方式来储存Hive数据。
最后，我们引入了一种新的runtime框架—— Tez，它的目标是消除Hive的延迟以及吞吐量限制。Tez通过消除不必要的task、障碍同步和对HDFS的读写作业来优化Hive job。这将优化Hadoop内部的执行链，彻底加速Hive负载处理。

所有这些对Hive的调整仍在公开的进行中，内部预览版将在今年三月举行的由Hortonworks主办的Hadoop大会上公开。

拥抱社区和Hive

许多不同的团队在Hive社区贡献着他们成果。来自SAP的Harish Butani的团队负责为Hive增加一个分析和数据窗口函数。这个函数将增加到OVER子句中用于已经存在的聚集函数，就像RAND、NTILE和LEAD、LAG等函数一样，这里可以看到详细的说明。Facebook的Namit Jain已经花了大量时间来优化Hive的查需执行计划，这让Join等操作变的更高效，并减少来自用户的提示。Hortonworks已经参与到这些项目中。

Owen O’Malley，Hortonworks联合创始人，早期的Hadoop的开发者，已经在Facebook为ORC文件格式进行了大量工作，这项工作将帮助提升Hive读、写、处理数据的性能，在这里可以看到详情。我们还在为一些更长远的目标工作，如重写Hive的运算符来处理上千的记录，其效率和现在相比将有大幅提升。

为什么要重新造轮子呢？（编译/ 包研责编/仲浩）

原文： Hortonworks

本文为CSDN编译，未经允许不得转载。如需转载请联系market@csdn。

本文标签： Initiative Stinger Hive

版权声明：本文标题：Stinger Initiative：让Hive提速100倍内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1727253547a1105120.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Stinger Initiative：让Hive提速100倍

Stinger Initiative：让Hive提速100倍

发表于 2013-02-27 20:31| 2392次阅读| 来源 Hortonworks| 4 条评论| 作者 Alan Gates

更多相关文章

hive删除数据进行恢复

hive运行报错Error during job, obtaining debugging information..FAILED: Execution Error, return code 2

hive跑jar包错误 ERROR yarn.Client: Failed to contact YARN for application application_164669786829

OCI (Open Container Initiative)

探秘ARISE-Initiative的RoboMimic：智能机器人行为学习新纪元

推荐开源项目：数据来源追踪倡议（Data Provenance Initiative）

【论文阅读】Evaluating Mixed-initiative Conversational Search Systems via User Simulation

Open API Initiative发布OpenAPI规范3.0.0

OCI(Open Container Initiative) &amp; OCF (Open Container Format)

推荐开源项目：Bug Bounty Standardization Initiative

推荐项目：System Initiative —— 现代化DevOps的利器

**探索Anime Translation Initiative：开启你的动画翻译新纪元**

探索未来科技：ARISE-Initiative的RoboSuite——一个全面的机器人模拟器

The Stinger Initiative: Making Apache Hive 100 Times Faster

OSGI（Open ServiceGateway Initiative）简介

Microsoft.NET initiative介绍

Data Documentation Initiative

WAI(Web. Accessibility Initiative)标准

System Initiative：重塑DevOps工作流的协作利器

不错的开源小项目- Spacebug open source initiative

发表评论

推荐文章

第六章 软件项目质量管理

windows 9X, 2000, xp所有版本注册表设置大全

BIOS和UEFI开机检测程序

linux bios芯片型号,如何准确判断主板BIOS类型 - 怎么看bios芯片型号_查看bios芯片型号...

JDownloader 突破百度网盘下载限速

热门文章

第五章 业务架构，5.1 内容+：打造不一样的双11(作者：建瓴，神照，随喜，志向，元超)...

开源、免费软件收录

最新初中级前端面试题合集一,你确定不看一看嘛

cf两边黑屏怎么解决win10_win10摄像机黑屏的解决方案！

Android 模拟器 连接局域网

VScode常用快捷键在这里！！！

ZBrush常用快捷键汇总，游戏建模小白入门必备，收藏起来

Microsoft®Office Project Professional 2007 中文试用版的密钥

win10计算机网络共享设置密码,Win10使用技巧：给共享文件夹添加密码

分享几个医学数据集：spine &amp; knee Osteoarthritis （脊柱和膝关节）

最新文章

宏基服务器 安装系统安装系统,韩博士win7系统重装，宏基f5-573g一键安装系统win7图文...

win10系统安装win7,win10怎么安装win7系统

华硕笔记本win10一键重装win7系统方法,华硕笔记本如何重装系统win7

win7系统自动安装,win7系统自动安装方法

CorelDRAW2024无限试用版一键下载安装激活

电脑win7系统装机教程,win7系统装机电脑教程

博本计算机配置似乎是正确的,一键系统重装win7，博本g16笔记本一键安装win7操作方法...

驱动人生win7系统如何升级win10一键装机图文教程

flstudio21.2.3.4004中文版永久2024最新下载安装及更换皮肤图文详细使用教程

MathType7.9最新破解激活码+注册码+激活秘钥

win7系统装机教程图示,win7系统装机教程图文介绍

宏基笔记本如何重装系统win7,宏基笔记本电脑一键重装win7教程

笔记本在线一键重装系统win7方法,笔记本电脑系统在线重装教程

Camtasia2024官方永久激活码许可证+破解安装包下载

Win10电脑本地安装SD智能文生图软件详细流程与远程玩图实战

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

OCI(Open Container Initiative) & OCF (Open Container Format)

探索Anime Translation Initiative：开启你的动画翻译新纪元

第六章软件项目质量管理

第五章业务架构，5.1 内容+：打造不一样的双11(作者：建瓴，神照，随喜，志向，元超)...

Android 模拟器连接局域网

分享几个医学数据集：spine & knee Osteoarthritis （脊柱和膝关节）

宏基服务器安装系统安装系统,韩博士win7系统重装，宏基f5-573g一键安装系统win7图文...

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载