且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

如何在HPC公有云上使用docker

更新时间:2022-06-07 08:25:28

1. 添加新用户

1. 添加普通用户

useradd kevinchen.ck

2.修改密码

passwd kevinchen.ck
更改用户 root 的密码 。
新的 密码:
重新输入新的 密码:
passwd:所有的身份验证令牌已经成功更新。

3.给普通用户赋予sudo权限

使用visudo命令,给新用户增加sudo权限

visudo

添加如下语句:

kevinchen.ck    ALL=(ALL)       ALL

退出,以改普通用户身份重新登录

2.install docker

1.前置条件

docker只支持64bit的centos,并且kernel必须高于3.10,使用如下命令查看kernel版本

uname -r

公有云上使用的centos 7 内核是可以使用docker的:

3.10.0-327.28.3.el7.x86_64

2.安装

  1. 首先升级或者卸载默认的docker

    rpm -qa | grep docker   发现有如下两个rpm包需要卸载
    sudo rpm -r docker*
  2. 这里使用yum进行安装,首先配置repo:

    $ sudo tee /etc/yum.repos.d/docker.repo <<-'EOF'
    [dockerrepo]
    name=Docker Repository
    baseurl=https://yum.dockerproject.org/repo/main/centos/7/
    enabled=1
    gpgcheck=1
    gpgkey=https://yum.dockerproject.org/gpg
    EOF
  3. 更新一下repo

    sudo yum update

  4. 安装docker package

    sudo yum -y install docker-engine

  5. 开机启动docker

    sudo systemctl enable docker

  6. 启动docker

    sudo systemctl start docker

  7. 验证正确性

    sudo docker run hello-world

3.增加docker group

  1. create docker group

    sudo groupadd docker
  2. add your user to docker group

    sudo usermod -aG docker your_username
  3. log out and log back in
  4. verify that your user is in the docker group by running docker without sudo

    docker run --rm hello-world

4. 安装nvidia-docker plugin

因为官方包下载速度很慢,所有我们有提前下载好,放在公共的oss镜像中,给用户使用

wget -P /tmp http://public-img-test.oss-cn-hangzhou.aliyuncs.com/cuda/nvidia-docker-1.0.0.rc.3-1.x86_64.rpm
sudo rpm -i /tmp/nvidia-docker*.rpm && rm /tmp/nvidia-docker*.rpm
sudo systemctl start nvidia-docker