Yarn入门xueqiang.chen published on 2023-08-16 included in bigdata1. YARN 的产生和发展 Hadoop 1.0 中的 MapReduce 存在着一些不足。 扩展性差,JobTracker 既要做资源管理,又要做任务监控,job 的最大并发数受到影响。 可用性差
HIVE概述和HIVE基本原理xueqiang.chen published on 2022-07-22 included in 大数据Hive是基于Hadoop的一个数据仓库工具,它可以将结构化的数据文件(TEXT,ORC,PARQUET等)映射为一张数据库表,并提供简单的
流式处理和实时计算:Kafkaxueqiang.chen published on 2021-10-11 included in bigdatakafka不仅仅是消息系统,更可以用在流式处理的场景中。本文主要介绍消息系统概述,kafka系统架构和原理。
大数据 OLAP 引擎:Presto 概述xueqiang.chen published on 2021-10-09 included in bigdata大数据 OLAP 引擎:Presto 概述 SQL on Anything presto特点 presto架构 Presto查询引擎是一个Master-Slave的架构,由一个Coor
OLAP概述xueqiang.chen published on 2021-09-15 included in bigdataOLAP OLAP vs OLTP 的差异 OLAP定义:联机分析处理,数据访问和分析,多维数据,交互性,深入观察,决策。 OLAP 的目标:查询和报表 相关概念: 维度 维的层次 维的成