一、前言 使用 VMWare 创建 Linux 虚拟机时通常只会默认分配 20G 的磁盘空间,跑一些环境时如果创建时没计算好大小很容易爆。像我的虚拟机就因为要上传一个数据集太大了需要磁盘扩容🙂。 这里我用的 Linux 是带图形化程序的,但可能有些小伙伴没有,完整的扩容过程都会用命令行执行🥰。
一、Introduction of Spark Running Mode(Spark 运行模式介绍) Spark 可以在多种模式下运行,可以在单机上以本地模式或伪分布式模式运行。当在集群中以分布式模式运行时,底层的资源调度可以使用 Mesos、YARN,或者 Spark 自带的 Standalone
一、Hive Introduction(Spark 简介) Apache Hive 是一个开源的数据仓库软件,用于读取、写入和管理存储在 Apache Hadoop 分布式文件系统(HDFS)或其他数据存储系统(如 Apache HBase)中的大型数据集文件。Hive 允许 SQL 开发人员编写类
一、Ansible 概述 1、Ansible 简介 Ansible 是一个 开源的自动化平台,使用 Playbook(YAML 语言编写)描述并执行 IT 架构和任务。它的核心是 automation engine,用于解析和运行 Playbook,实现配置管理、应用部署、运维编排等功能。 二、红帽
一、Spark Introduction(Spark 简介) 设想一个场景:每个人都用过 QQ,它会不定期地给你推荐一些你可能认识的人。那么,这些数据是从哪里来的呢?实际上,它是通过分析每个人的好友列表数据得出的。一个人的好友列表数据量非常庞大,光是存储就是一个问题,更不用说数据处理了。这时,我们就
一、安装 MySQL 1、从官网下载仓库配置 rpm 包 默认的 yum 仓库里是没有 MySQL 的,需要先在 MySQL 的官网下载安装他的仓库配置 rpm 包。(这个 rpm 包不包含 MySQL 本体,它的作用只是在 yum 的配置文件中添加 MySQL 本体的下载地址🙂) 打开MySQL
LocalBites 是一家初创公司,他的目标是提供关于附近餐厅的实时信息、优化配送路线,并生成有关用户偏好和餐厅人气的有价值分析。关键内容包括索引的实现、地理空间索引以及聚合管道的使用。 LocalBites 所处的是一个竞争激烈的市场,在这里,快速的响应时间和准确的基于位置的数据对于用户满意度至