博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据组件
阅读量:5277 次
发布时间:2019-06-14

本文共 616 字,大约阅读时间需要 2 分钟。

一.大数据组件分类:

1.计算类: hadoop,spark,flink,hive

2.传输类:kafka,flume,redis

3.存储类:hbase,mongodb,Cassandra

4.调度类:zookeeper 5.配置类:mesos,yarn

二.流行的框架SMACK

Spark Mesos Akka Cassandra Kafka

三.Apache

Zookeeper 分布式调度

Spark 计算

Kafka 中心化传输整合数据,面向服务

Cassandra 线性增加容量,节省资源,consistency可调节

Mesos 分布式任务调度系统,智能调度硬件资源

四.大数据大数据对框架和工具的要求:

高可用性,高性能,高可扩展性

五.常见大数据架构包括:

数据注入层(webserver等)

数据存储层

数据处理层

六.大数据技术人员两个大方向

做大规模高并发的线上服务

做大数据分析

七.大数据指的是规模超过现有数据库工具获取、存储、管理和分析能力的数据集,并同时强调并不是超过某个特定数量级的数据集才是大数据

八.国际数据公司(IDC)用四个维度的特征来定义大数据,即数据集的规模(Volume)、数据流动的速度(Velocity)、数据类型的多少(Variety)和数据价值的大小(Value)

转载于:https://www.cnblogs.com/fanshudada/p/10846485.html

你可能感兴趣的文章
HPUX 配置zabbix开机自动启动
查看>>
纯CSS实现3D按钮效果
查看>>
上海云栖—人工智能-视觉计算专场预热
查看>>
【BZOJ 4151 The Cave】
查看>>
MySQL数据备份之mysqldump使用
查看>>
Jsoncpp学习二---读取Json格式的文本文件
查看>>
java推送数据到app--极光推送
查看>>
C#面试分享:单例模式
查看>>
hdu 2199 Can you solve this equation?
查看>>
P1083 借教室
查看>>
(四)工厂方法模式详解(另附简单工厂的死亡之路)
查看>>
ASP.NET MVC 3.0学习系列文章--序
查看>>
Daemontools和Supervisor管理linux常驻进程
查看>>
双显示屏下主显示屏任务栏不见了
查看>>
学Java的第30天 异常
查看>>
docker修改国内官方镜像
查看>>
如何验证二维数组
查看>>
Java中系统属性Properties介绍 System.getProperty()参数大全
查看>>
dom get selector
查看>>
11 | 怎么给字符串字段加索引?
查看>>