今天把剛買的nVidia 3060 12G安裝好,然後開啟ubuntu系統,發現啟動gpu時會卡在
「Successfully opened dynamic library libcublas.so.10.0」,每次都會卡住約5-8分鐘,記得windows也會卡,但是只會卡第一次,搜尋網路上的解決方案是cuda在做cache,而且顯示卡記憶體越大會卡越久,網路有提供windows方案,就是設定最大cache,速度就會加快了。

image

那麼ubuntu似乎沒這個選項,搜尋其他方案,發現說如果nvidia 3x開頭的請使用tf 2.5以上版本,嘗試了一下發現確實就沒問題了,只是要安裝tf2.5稍微麻煩,以py38來說,如果不指定tf版本一般會安裝tf2.4,所以這裡紀錄一下

$ nvidia-smi #檢查nvidia驅動程式安裝狀況
$ conda create -n Python38 python=3.8  #建立py38環境
$ conda activate Python38 #啟動環境
$ pip install tensorflow-gpu==2.5.0  #安裝TF2.5 for nvidia 3x以上
此時測試tf GPU(tf.test.gpu_device_name())時會發現 dlerror: libcudnn.so.8代表cudnn有問題
$ conda install -c anaconda cudnn  #安裝cudnn
此時測試GPU時一樣會發現問題dlerror: libcudnn.so.8
$ conda update --all #更新所有套件,即可更新cudnn
測試正常

Screenshot from 2022-02-26 02-45-28.jpg
 

arrow
arrow
    全站熱搜

    夜市 小霸王 發表在 痞客邦 留言(0) 人氣()