差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン | ||
nvidiaドライバーインストール [2023/07/14 13:09] – suikou | nvidiaドライバーインストール [Unknown date] (現在) – 削除 - 外部編集 (Unknown date) 127.0.0.1 | ||
---|---|---|---|
行 1: | 行 1: | ||
- | # NVIDIA driverのインストール | ||
- | https:// | ||
- | を参照。 | ||
- | |||
- | ``` | ||
- | システムのランレベルを変更する場合は以下のようにします。 | ||
- | [1] ランレベルは / | ||
- | # 現在の設定を表示 | ||
- | [root@dlp ~]# systemctl get-default | ||
- | multi-user.target | ||
- | # / | ||
- | [root@dlp ~]# ll / | ||
- | lrwxrwxrwx. 1 root root 37 Jul 9 06:04 / | ||
- | [2] 例えば、グラフィカルログインに変更するには以下のようにします。 | ||
- | [root@dlp ~]# systemctl set-default graphical.target | ||
- | rm '/ | ||
- | ln -s '/ | ||
- | # 確認 | ||
- | [root@dlp ~]# systemctl get-default | ||
- | graphical.target | ||
- | [root@dlp ~]# ll / | ||
- | lrwxrwxrwx 1 root root 36 Jul 9 21:55 / | ||
- | ``` | ||
- | |||
- | ``` | ||
- | NVIDIAドライバーをインストールする | ||
- | |||
- | システムに NVIDIA 社のグラフィックカードを搭載している場合、NVIDIA 社提供のグラフィックドライバーをインストールすることで、よりよいパフォーマンスを得ることができます。 | ||
- | なお、[yum update kernel] 等でカーネルを更新した際は、都度、ドライバーの更新も必要になります。 | ||
- | [1] | ||
- | デスクトップ環境をインストールしている場合は、こちらを参考に、グラフィカルログイン無しでシステムを起動しておきます。 ドライバーのインストール完了後はグラフィカルログインに戻して OK です。 | ||
- | [2] デフォルトでロードされている nouveau ドライバーを無効化しておきます。 | ||
- | [root@dlp ~]# lsmod | grep nouveau | ||
- | nouveau | ||
- | video 24520 1 nouveau | ||
- | mxm_wmi | ||
- | wmi 19070 2 mxm_wmi, | ||
- | i2c_algo_bit | ||
- | drm_kms_helper | ||
- | ttm 99345 1 nouveau | ||
- | drm | ||
- | i2c_core | ||
- | |||
- | [root@dlp ~]# vi / | ||
- | # 最終行に追記 (ファイルがない場合は新規作成) | ||
- | blacklist nouveau | ||
- | options nouveau modeset=0 | ||
- | [root@dlp ~]# dracut --force | ||
- | [root@dlp ~]# reboot | ||
- | ``` | ||
- | |||
- | ``` | ||
- | sudo yum -y install kernel-devel-$(uname -r) | ||
- | # | ||
- | #sudo yum -y install kernel-devel kernel | ||
- | #reboot | ||
- | |||
- | sudo bash / | ||
- | |||
- | # | ||
- | #sudo nano / | ||
- | ## | ||
- | # | ||
- | ``` | ||
- | |||
- | # Podmanへのインストール @ Rocky Linux 9.2 | ||
- | |||
- | https:// | ||
- | を見るに、RHEL9もCentOS8のリポジトリとおなじみたい。 | ||
- | |||
- | ``` | ||
- | curl -s -L https:// | ||
- | dnf install -y nvidia-container-toolkit-base | ||
- | |||
- | nano / | ||
- | |||
- | # | ||
- | [nvidia-container-cli] | ||
- | #no-cgroups = false | ||
- | no-cgroups = true | ||
- | |||
- | [nvidia-container-runtime] | ||
- | #debug = "/ | ||
- | debug = " | ||
- | |||
- | 下記で確認 | ||
- | |||
- | podman run --security-opt=no-new-privileges --cap-drop=ALL --security-opt \ | ||
- | label=type: | ||
- | docker.io/ | ||
- | |||
- | では動かなかったので | ||
- | |||
- | dnf -y install nvidia-container-toolkit | ||
- | |||
- | して | ||
- | |||
- | podman run nvidia/ | ||
- | |||
- | だとユーザ権限で動いた | ||
- | ``` | ||
- | |||
- | # CUDAのインストール2023/ | ||
- | |||
- | ``` | ||
- | #wget https:// | ||
- | #dnf -y install / | ||
- | #dnf -y install cuda | ||
- | |||
- | # | ||
- | dnf config-manager --add-repo https:// | ||
- | dnf clean all | ||
- | dnf -y module install nvidia-driver: | ||
- | dnf -y install cuda-11.8.0-1.x86_64 | ||
- | # | ||
- | pip3 install torch torchvision torchaudio --index-url https:// | ||
- | ``` | ||
- | |||
- | # Dockerのインストール | ||
- | |||
- | ``` | ||
- | sudo yum-config-manager \ | ||
- | --add-repo \ | ||
- | https:// | ||
- | |||
- | sudo yum install docker-ce docker-ce-cli containerd.io | ||
- | sudo systemctl start docker | ||
- | sudo systemctl enable docker | ||
- | sudo docker run --rm hello-world | ||
- | sudo usermod -aG docker $USER | ||
- | ``` | ||
- | |||
- | ``` | ||
- | curl https:// | ||
- | #yum -y install nvidia-container-toolkit | ||
- | sudo yum install -y nvidia-docker2 | ||
- | sudo systemctl restart docker | ||
- | docker run --rm --gpus all nvidia/ | ||
- | ``` | ||
- | |||
- | ## zabbix登録 | ||
- | |||
- | ``` | ||
- | sudo mkdir / | ||
- | sudo nano / | ||
- | ``` | ||
- | |||
- | 下記のファイルを作る | ||
- | |||
- | ``` | ||
- | #!/bin/bash | ||
- | |||
- | result=$(/ | ||
- | first=1 | ||
- | |||
- | echo " | ||
- | echo " | ||
- | |||
- | while IFS= read -r line | ||
- | do | ||
- | if (( " | ||
- | then | ||
- | echo , | ||
- | fi | ||
- | index=$(echo -n $line | cut -d ":" | ||
- | gpuuuid=$(echo -n $line | cut -d ":" | ||
- | echo -n {" | ||
- | if (( " | ||
- | then | ||
- | # echo , | ||
- | first=0 | ||
- | fi | ||
- | done < <(printf ' | ||
- | |||
- | echo | ||
- | echo " | ||
- | echo " | ||
- | ``` | ||
- | |||
- | sudo nano / | ||
- | |||
- | ``` | ||
- | UserParameter=gpu.number,/ | ||
- | UserParameter=gpu.discovery,/ | ||
- | UserParameter=gpu.fanspeed[*], | ||
- | UserParameter=gpu.power[*], | ||
- | UserParameter=gpu.temp[*], | ||
- | UserParameter=gpu.utilization[*], | ||
- | UserParameter=gpu.memfree[*], | ||
- | UserParameter=gpu.memused[*], | ||
- | UserParameter=gpu.memtotal[*], | ||
- | ``` | ||
- | |||
- | sudo systemctl restart zabbix-agent.service |