pytorch(4)
-
[Jetson Nano] Libtorch 사용 과정 복기
Jetson Nano에서 Libtorch를 사용하기 위한 과정을 복기중요한 것은 Pytorch에서 Libtorch를 제공하는데, 그것은 x86-64 아키텍쳐 기준이므로 라즈베리파이, 젯슨과 같이 arm64 아키텍쳐인 경우 새롭게 빌드를 해주어야한다. 세부적인 과정은 Pytorch Official 페이지를 참고했다.git clone -b v2.0.0 --recurse-submodule https://github.com/pytorch/pytorch.gitmkdir pytorch-buildcd pytorch-buildcmake -DBUILD_SHARED_LIBS:BOOL=ON -DCMAKE_BUILD_TYPE:STRING=Release -DPYTHON_EXECUTABLE:PATH=`which python3` ..
2024.11.11 -
Exception: CUDA error: no kernel image is available for execution on the device
딥러닝을 통해서 모델을 학습, 추론 시키는 경우, GPU를 사용하게 되는데, 각각의 GPU 별로 사용할 수 있는 Pytorch 버전이 정해져 있습니다. 만약 GPU가 사용할 수 있는 버전과 사용하는 Pytorch 버전이 맞지 않는 경우, 아래와 같은 오류가 발생하게 됩니다. 현재 사용하고 있는 GPU에 맞는 Pytorch 버전을 설치하는 절차는 아래와 같습니다. 1. CUDA 버전 확인하기 nvidia-smi 또는 nvcc -V 명령어를 통해 현재 사용하고 있는 CUDA 버전을 확인합니다. 2. 현재 사용하고 있는 CUDA 버전에 맞는 Pytorch 및 하위 라이브러리를 설치한다. https://pytorch.org/get-started/previous-versions/ PyTorch An open so..
2022.11.16 -
Pytorch error : PytorchStreamReader failed
Pytorch에서 모델을 loading하다가 아래의 그림과 같은 오류가 발생 되었는데, 흔하게 발생하는 오류가 아니라서 당황스러웠네요..찾아보니까 모델을 저장하는 과정에서 어떤 이유로 인해서 중단되는 경우에 이런 오류가 발생하더라구요. 모델이 저장되는 과정에 중단되지 않게한다면 아래와 같은 오류가 발생되지 않을 수 있을 것 같습니다.
2022.05.09 -
Pytorch error : process 0 terminated with signal SIGKILL
Pytorch를 사용하면서 많은 에러를 보았지만, 위와 같은 에러는 한 번도 본 적이 없어서 당황스러웠던 것 같습니다. 여러 자료를 찾아보니, 새로운 GPU모델과 pytorch간의 호환성에서 문제가 발생한다고 하는데, 정확하게 어떤 원인으로 발생하는지는 모르겠습니다. 제가 해결했던 방법 중 하나는 batch size 크기를 줄이는 것이었습니다. 혹시나 위와 같은 오류로 헤매고 있는 분들은 batch size를 먼저 줄여보시는 것을 추천 드립니다!
2022.05.08