博客
关于我
Spark学习笔记01-基础
阅读量:420 次
发布时间:2019-03-06

本文共 1086 字,大约阅读时间需要 3 分钟。

Spark简介

Spark是一个开源的分布式计算框架,基于内存计算,支持多种编程语言(Java、Python、Scala、R),提供了从批量处理到流处理、机器学习等多种计算模式。相比Hadoop,Spark在处理大规模数据时效率更高,适合需要快速响应和迭代的场景。

Spark的特点

1. **高效性**:数据尽可能存储在内存中,减少了I/O操作,速度比Hadoop更快。 2. **易用性**:提供了80多个高级操作符,简化了复杂的数据处理流程。 3. **通用性**:集成了多种功能,如Spark SQL、DataFrame、MLib、GraphX和Spark Streaming,为用户提供了丰富的工具选择。 4. **兼容性**:基于JVM运行,可在不同操作系统上无缝集成。

Spark的运行模式

Spark支持多种集群运行方式,根据实际需求选择: 1. **local模式**:适用于开发和调试,单机运行。 2. **Standalone模式**:采用Master/Slave架构,支持Xookeeper高可用性集群。 3. **Mesos模式**:将资源管理交给Mesos,Spark负责任务调度和计算。 4. **Hadoop YARN模式**:利用Hadoop的资源管理能力,资源调度交给YARN。

Mac本地安装Spark

安装Spark需要以下步骤: 1. **下载**:从Spark官方网站下载合适的版本(本文基于Spark 2.4.1)。 2. **安装**:解压下载的文件并将其放置在安装目录(如`~/Project/tools`)。 3. **配置环境变量**:在`~/.bash_profile`中添加以下内容: ```bash export SPARK_HOME=/Users/shiqiang/Projects/tools/spark-2.4.1-bin-hadoop2.7 export PATH=${PATH}:${SPARK_HOME}/bin ``` 4. **远程登录设置**:在Mac系统中启用远程登录功能,允许安装用户访问本地机器。 5. **启动集群**:运行以下命令启动集群: ```bash ./sbin/start-all.sh ``` 运行JPS命令可以查看Master和Worker的运行状态: ```bash jps ``` 6. **停止集群**:使用以下命令关闭所有服务: ```bash ./sbin/stop-all.sh ```

通过以上步骤,用户可以在本地Mac机器上成功安装并运行Spark集群。

转载地址:http://qhrkz.baihongyu.com/

你可能感兴趣的文章
Nginx配置如何一键生成
查看>>
Nginx配置实例-负载均衡实例:平均访问多台服务器
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_增删改数据分发及删除数据实时同步_通过分页解决变更记录过大问题_02----大数据之Nifi工作笔记0054
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_实现数据插入数据到目标数据库_实际操作03---大数据之Nifi工作笔记0042
查看>>
NIFI同步MySql数据_到SqlServer_错误_驱动程序无法通过使用安全套接字层(SSL)加密与SQL Server_Navicat连接SqlServer---大数据之Nifi工作笔记0047
查看>>
Nifi同步过程中报错create_time字段找不到_实际目标表和源表中没有这个字段---大数据之Nifi工作笔记0066
查看>>
NIFI大数据进阶_离线同步MySql数据到HDFS_02_实际操作_splitjson处理器_puthdfs处理器_querydatabasetable处理器---大数据之Nifi工作笔记0030
查看>>
NIFI大数据进阶_连接与关系_设置数据流负载均衡_设置背压_设置展现弯曲_介绍以及实际操作---大数据之Nifi工作笔记0027
查看>>
NIFI汉化_替换logo_二次开发_Idea编译NIFI最新源码_详细过程记录_全解析_Maven编译NIFI避坑指南001---大数据之Nifi工作笔记0068
查看>>
NIFI集群_内存溢出_CPU占用100%修复_GC overhead limit exceeded_NIFI: out of memory error ---大数据之Nifi工作笔记0017
查看>>
NIH发布包含10600张CT图像数据库 为AI算法测试铺路
查看>>
NIO ByteBuffer实现原理
查看>>
Nio ByteBuffer组件读写指针切换原理与常用方法
查看>>
NIO Selector实现原理
查看>>
nio 中channel和buffer的基本使用
查看>>
NIO基于UDP协议的网络编程
查看>>
NISP一级,NISP二级报考说明,零基础入门到精通,收藏这篇就够了
查看>>
Nitrux 3.8 发布!性能全面提升,带来非凡体验
查看>>
NI笔试——大数加法
查看>>
NLog 自定义字段 写入 oracle
查看>>