CDH部署笔记
本文为个人安装CDH时记录,不具普适性,仅供参考。建议对比官方文档阅读。
一 依赖检查
以centos7为例
1. 软件
https://docs.cloudera.com/documentation/enterprise/6/release-notes/topics/rg_os_requirements.html
0. 常用软件安装
此步骤非必须
1 |
|
1. python
使用2.7版本或以上版本,但不支持3
centos7 中默认已包含,如果有多版本需设置PYSPARK_PYTHON和
PYSPARK_DRIVER_PYTHON环境变量
1 |
|
2. Perl
一般已安装
1 |
|
3. python-psycopg2
1 |
|
2. 网络
禁用ipv6
https://www.jianshu.com/p/225d040d0b66
1 |
|
1 |
|
配置hostname
https://docs.cloudera.com/documentation/enterprise/6/latest/topics/configure_network_names.html
用全称域名,如:paas-201.adp.com 而不是 paas-201
配置hostname
1
2sudo hostnamectl set-hostname foo-1.example.com
编辑/ets/hosts(集群统一)
1
2
3
41.1.1.1 foo-1.example.com foo-1
2.2.2.2 foo-2.example.com foo-2
3.3.3.3 foo-3.example.com foo-3
4.4.4.4 foo-4.example.com foo-4编辑/etc/sysconfig/network
1
2echo "HOSTNAME=$HOSTNAME" >>/etc/sysconfig/network
关闭防火墙
1
2
3
4
5# 保存规则
sudo iptables-save > ~/firewall.rules
# 关闭
sudo systemctl disable firewalld
sudo systemctl stop firewalld3. 关闭SELinux
查看是否已经关闭
1
getenforce
关闭方法:
修改/etc/selinux/config
SELINUX=permissive
并执行 setenforce 0 立即生效4. 启用ntp
安装后用以下命令进行验证
1
2
3systemctl status chronyd.service
chronyc sources -v
chronyc sourcestats -v二 安装
一. 配置本地仓库
1. 配置web服务器
安装
1
2sudo yum install httpd
需保证/var/www磁盘空间足够,建议挂载,这里假设 /home/www 有足够的空间
1
2
3
4
5
6mv /var/www /var/www2
mkdir /home/www
ln -s /home/www /var/www
mv /var/www2/* /var/www/
rm -rf /var/www2
ls /home/www启动
1
2sudo systemctl start httpd
2. 下载文件(clouderaManager和cdh)
clouderaManager
下载:https://archive.cloudera.com/cm6/6.3.1/repo-as-tarball/cm6.3.1-redhat7.tar.gz
1 |
|
- cdh
1 |
|
访问 http://
3. 配置使用本地存储库
创建/etc/yum.repos.d/cloudera-repo.repo
内容如下:
[cloudera-repo]
name=cloudera-repo
baseurl=http://paas-241/cloudera-repos/cm6
enabled=1
gpgcheck=0
三. 安装CDH
1. 安装java
1 |
|
2. 安装CM
1 |
|
3. 安装数据库
假设使用mysql且已安装
在cm服务器上:
1. 安装jdbc驱动
1 |
|
2. 创建数据库并授权
登录mysql进行配置:
1 |
|
执行以下命令:假设数据库为cdh 授权用户为root,密码为123456
1
2
3
4
5CREATE DATABASE cdh DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
GRANT ALL ON cdh.* TO 'root'@'%' IDENTIFIED BY '123456';
SHOW DATABASES;
SHOW GRANTS FOR 'root'@'%';
3. 执行创建脚本
1 |
|
四 启动
1 |
|
直到看到:
INFO WebServerImpl:com.cloudera.server.cmf.WebServerImpl: Started Jetty server.
则说明启动完成,打开
http://paas-241:7180 即可 admin/admin
注意配置自定义仓库:
http://192.168.10.241/cloudera-repos/cdh6/6.3.2/redhat7/yum/
方法是数据表