集成且经过测试的平
Posted: Sun Apr 06, 2025 8:31 am
最引人注目的是 Hadoop 2 基于 YARN 的架构,这是 Stinger 计划的第 2 阶段,它在一个台中包括了来自更广泛 Hadoop 生态系统的最新创新。 对于那些不熟悉 YARN 的人来说,根据 Hortonworks 的说法,它的作用是将 Hadoop 从单一用途的批处理数据平台转变为支持批处理、交互式、在线和流处理的多用途平台。
通过充当 Hadoop 分布式文件系统 (HDFS) 中存储的数据的主要资源管理器和 准确的手机号码列表 访问中介,YARN 使企业能够将数据存储在一个地方,并以多种方式同时与其交互,并提供一致的服务水平。换句话说,企业现在可以同时运行多个查询。
据 Connolly 介绍,Stinger 计划的第二阶段将提高 Apache Hive 的性能,Apache Hive 是建立在 Hadoop 之上的数据仓库基础架构,用于提供数据汇总、查询和分析。
它还使 HDP 2.0 能够更快、处理更大的工作负载并利用 SQL 窗口函数(如 Rank、Lead 和 Lag 等)。 最后,HDP 2.0 比 Hadoop 样板版本“错误”更少,因为已解决了 420 多张票。
通过充当 Hadoop 分布式文件系统 (HDFS) 中存储的数据的主要资源管理器和 准确的手机号码列表 访问中介,YARN 使企业能够将数据存储在一个地方,并以多种方式同时与其交互,并提供一致的服务水平。换句话说,企业现在可以同时运行多个查询。
据 Connolly 介绍,Stinger 计划的第二阶段将提高 Apache Hive 的性能,Apache Hive 是建立在 Hadoop 之上的数据仓库基础架构,用于提供数据汇总、查询和分析。
它还使 HDP 2.0 能够更快、处理更大的工作负载并利用 SQL 窗口函数(如 Rank、Lead 和 Lag 等)。 最后,HDP 2.0 比 Hadoop 样板版本“错误”更少,因为已解决了 420 多张票。