mapreduce_字节宝

详解MapReduce（Spark和MapReduce对比铺垫篇）

本来笔者是不打算写MapReduce的，但是考虑到目前很多公司还都在用这个计算引擎，以及后续要讲的Hive原生支持的计算引擎也是MapReduce，并且为Spark和MapReduce的对比做铺垫，笔者今天详细阐述一下MapReduce。鉴于Hadoop1.X已...

mapreduce 分布式 vr视频解决方案数据处理 spark

2020-08-10

Spark为什么只有在调用action时才会触发任务执行呢（附算子优化和使用示例）？

Spark算子主要划分为两类：transformation和action，并且只有action算子触发的时候才会真正执行任务。还记得之前的文章《Spark RDD详解》中提到，Spark RDD的缓存和checkpoint是懒加载操作，只有action触发的时候才会真正执...

spark 编程算法 mapreduce CSS

2020-08-10

Hive Join优化

在阐述Hive Join具体的优化方法之前，首先看一下Hive Join的几个重要特点，在实际使用时也可以利用下列特点做相应优化：

SQL mapreduce hive jvm

2020-08-10

Kafka中sequence IO、PageCache、SendFile的应用详解

大家都知道Kafka是将数据存储于磁盘的，而磁盘读写性能往往很差，但Kafka官方测试其数据读写速率能达到600M/s，那么为什么Kafka性能会这么高呢？

Kafka 缓存 socket编程 mapreduce

2020-08-10

Apache Hive

Apache Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供一种HQL语言进行查询，具有扩展性好、延展性好、高容错等特点，多应用于离线数仓建设。...

数据库 SQL mapreduce Node.js 大数据

2020-08-10

Spark和MapReduce任务计算模型

【前言：本文主要从任务处理的运行模式为角度，分析Spark计算模型，希望帮助大家对Spark有一个更深入的了解。同时拿MapReduce和Spark计算模型做对比，强化对Spark和MapReduce理解】...

spark linux jvm mapreduce 编程算法

2020-08-10

用腾讯云批量计算(batch-compute)调度GPU分布式机器学习

当用户提交一些机器学习任务时，往往需要大规模的计算资源，但是对于响应时间并没有严格的要求。在这种场景下，首先使用腾讯云的batch-compute(批量计算)产品来自动化提交用户的任务，然后使用分布式+gpu的方式解决算力问题，...

pytorch mapreduce 机器学习神经网络人工智能

2020-08-06

Spark 在大数据中的地位 - 中级教程

Spark最初由美国加州伯克利大学的AMP实验室于2009年开发，是基于内存计算的大数据并行计算框架，可用于构建大型的、低延迟的数据分析应用程序。

spark hadoop yarn mapreduce Node.js

2020-08-06

Spark 基础面试题

答：RDD（Resilient Distributed Dataset）叫做分布式数据集，是spark中最基本的数据抽象，它代表一个不可变，可分区，里面的元素可以并行计算的集合

spark mapreduce linux 大数据数据处理

2020-08-05

重要 | Spark和MapReduce的对比以及选型

【前言：笔者将分两篇文章进行阐述Spark和MapReduce的对比，首篇侧重于"宏观"上的对比，更多的是笔者总结的针对"相对于MapReduce我们为什么选择Spark"之类的问题的几个核心归纳点；次篇则从任务处理级别运用的并行机制方面上...

spark mapreduce hadoop 大数据

2020-08-05

119 120 121 122 123

详解MapReduce（Spark和MapReduce对比铺垫篇）

Spark为什么只有在调用action时才会触发任务执行呢（附算子优化和使用示例）？

Hive Join优化

Kafka中sequence IO、PageCache、SendFile的应用详解

Apache Hive

Spark和MapReduce任务计算模型

用腾讯云批量计算(batch-compute)调度GPU分布式机器学习

Spark 在大数据中的地位 - 中级教程

Spark 基础面试题

重要 | Spark和MapReduce的对比以及选型

热门文章

热门手册