博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
分布式与并行计算
阅读量:5066 次
发布时间:2019-06-12

本文共 507 字,大约阅读时间需要 1 分钟。

 FastDFS分布式文件系统配置与部署

 

分布式文件系统---GlusterFS介绍

 

Spark

Spark组成(BDAS):全称伯克利数据分析栈,通过大规模集成算法、机器、人之间展现大数据应用的一个平台。也是处理大数据、云计算、通信的技术解决方案。

它的主要组件有:

SparkCore:将分布式数据抽象为弹性分布式数据集(RDD),实现了应用任务调度、RPC、序列化和压缩,并为运行在其上的上层组件提供API。

SparkSQL:Spark Sql 是Spark来操作结构化数据的程序包,可以让我使用SQL语句的方式来查询数据,Spark支持 多种数据源,包含Hive表,parquest以及JSON等内容。

SparkStreaming: 是Spark提供的实时数据进行流式计算的组件。

MLlib:提供常用机器学习算法的实现库。

GraphX:提供一个分布式图计算框架,能高效进行图计算。

BlinkDB:用于在海量数据上进行交互式SQL的近似查询引擎。

Tachyon:以内存为中心高容错的的分布式文件系统。

 

转载于:https://www.cnblogs.com/dong1/p/6330760.html

你可能感兴趣的文章
TestCenter中测试需求、测试用例、测试计划的评审方法
查看>>
谈一谈flex布局使用中碰到的一些问题
查看>>
前端-----数据类型和运算符
查看>>
前端 ---JS中的面向对象
查看>>
python3 爬虫--Chrome以及 Chromedriver安装配置
查看>>
C++笔记(2017/2/9)
查看>>
php锁定文本框内容的方法
查看>>
TTL_CMOS_RS232区别
查看>>
jsp HTTP Status 405 - HTTP method GET is not supported by this URL
查看>>
zookeeper单机安装
查看>>
hdu 1878
查看>>
Kafka 入门之集群部署遇到问题
查看>>
ASP.NET 2.0,全选GridView的ItemTempate中包含的CheckBox的方法(客户端Javascript实现)
查看>>
python网络爬虫之requests模块
查看>>
jquery radio取值,checkbox取值,select取值,radio选中,checkbox选中,select选中,及其相关...
查看>>
orders
查看>>
11.19站立会议
查看>>
cobbler自动化安装Linux系统
查看>>
JQuery多个异步操作后执行(resolve,promise,when,done)
查看>>
CodeIgniter模型
查看>>