天气预报 > 其他 > 大数据为什么要选择Spark
大数据为什么要选择Spark
更新时间: 2020-10-26 00:00:00  

Spark是一个基于内存计算的开源集群计算系统,目的是更快速的进行数据分析。Spark由加州伯克利大学AMP实验室Matei为主的小团队使用Scala开发,其核心部分的代码只有63个Scala文件,非常轻量级。Spark提供了与 Hadoop相似的开源集群计算环境,但基于内存和迭代优化的设计,Spark在某些工作负载表现更优秀。SPARK是一种安全的、经正式定义的编程语言,它被设计用来支持一些安全或商业集成为关键因素的应用软件的设计。从高的层面来看,其实每一个Spark的应用,都是一个Driver类,通过运行用户定义的main函数,在集群上执行各种并发操作和计算Spark提供的最主要的抽象,是一个弹性分布式数据集,它是一种特殊集合,可以分布在集群的节点上,以函数式编程操作集合的方式,进行各种各样的并发操作。

关键词: 数据 为什么 选择 spark

大数据为什么要选择Spark相关经验

天气预报

最新推荐

页面:/news/view-1746074/ | 耗时:0.1965 s | 内存:2.11 MB | 查询:4 | 缓存读取:3 写入:0 | 加载文件:25
select * from tbl_Articles WHERE ArticleID=1746074 LIMIT 0,1
select * from tbl_Articles_data WHERE ArticleID=1746074 LIMIT 0,1
select * from tbl_Articles_sphinx where id=1746074 LIMIT 0,1
SELECT ArticleID,Title FROM tbl_Articles WHERE ArticleID IN(1275697,121326,232367,1049510,245611,1127311,205219,1276118,239545,2537422,322539,1746074,243359,1773233,264564,329481,116759,1058215,245018,326012,318175,139397,1109579,1094741,115672,165774,223736,302513,167518,186149) ORDER BY field (ArticleID,1275697,121326,232367,1049510,245611,1127311,205219,1276118,239545,2537422,322539,1746074,243359,1773233,264564,329481,116759,1058215,245018,326012,318175,139397,1109579,1094741,115672,165774,223736,302513,167518,186149)