发表评论取消回复
相关阅读
相关 SparkCore RDD概述
1 RDD 概述 1.1 什么是 RDD RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是 Spark 中最基本...
相关 SparkCore 简单总结一下
三大数据结构: —RDD:弹性分布式数据集 \------定义: \---------数据集:存数的数据的计算逻辑 \---------分布式:数据的来源
相关 初学者sparkCore入门
1,概述 Spark 是一个基于内存的用于处理、分析大数据的集群计算框架它提供了一套简单的编程接口,从而使得应用程序开发者方便使用集群节点的 CPU 、内存、存储资源来处
相关 SparkCore(二):RDD基础
文章目录 一、什么是RDD 二、RDD核心属性 三、RDD执行原理 四、RDD创建 `Spark`计算框架为了能够进行高并发和高吞吐的数据处理,
相关 SparkCore(一):Spark简介和运行环境的搭建
文章目录 一、Spark简介 1.1 Hadoop的发展 1.2 Spark介绍 1.3 Spark or Hadoop
相关 SparkCore杂记二
这篇博客主要讲解Spark中任务shuffle与persistence, 首先来说说shuffle洗牌,学过hadoop的同学应该都了解mapreduce,每一个
相关 SparkCore杂记一
接触Spark也有一段时间了,最开始一直都是上网看一些博客,自己搭建个虚拟机倒腾,都是一些零散的学习,回头想想还是有必要系统性的学习、理解一遍,本系列博客将会
相关 Spark系列--SparkCore(一)RDD简介
前言 RDD是Spark的基石,是实现Spark数据处理的核心抽象。那么RDD为什么会产生呢? Hadoop的MapReduce是一种基于数据集的工作模式,面向数据,这
相关 SparkCore(一)
1.什么是RDD RDD分布式数据集,是Spark中最基础的数据抽象,代码中谁一个抽象类,它代表一不可变、可分区、元素可并行计算的集合。 1.2RDD的特点 分区
还没有评论,来说两句吧...