pytorch8 Pytorch distributed launch watchdog timeout 에러 해결 [E ProcessGroupNCCL.cpp:587] [Rank 3] Watchdog caught collective operation timeout: WorkNCCL(OpType=ALLREDUCE, Timeout(ms)=1800000) ran for 1803170 milliseconds before timing out Ubuntu 20.04 BSRGAN, HAT 모델 학습 중 확인 https://github.com/cszn/BSRGAN GitHub - cszn/BSRGAN: Designing a Practical Degradation Model for Deep Blind Image Super-Resolution (ICCV, 2021) (PyTorch) - We Designing a Practical De.. 2022. 12. 27. Super resolution 모델, HAT train 정리 Ubuntu 20.04 공식 github https://github.com/XPixelGroup/HAT GitHub - XPixelGroup/HAT: Arxiv2022 - Activating More Pixels in Image Super-Resolution Transformer Arxiv2022 - Activating More Pixels in Image Super-Resolution Transformer - GitHub - XPixelGroup/HAT: Arxiv2022 - Activating More Pixels in Image Super-Resolution Transformer github.com 앞선 글에서 (https://honbul.tistory.com/59) 4번, setup.py까지 진행.. 2022. 12. 26. TensorRT Docker 사용 정리 Nvidia driver: 515.86 CUDA: 11.6 Docker: 20.10.21 1. Nvidia container toolkit 설치(Installation Guide — NVIDIA Cloud Native Technologies documentation) 1-1. package repository 추가 distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \ && curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \ && curl -s -L ht.. 2022. 12. 13. 3080, Radeon vii, 6900xt, 딥러닝 (image classification) 학습 성능 비교 완벽하게 동일한 세팅(CPU/RAM/storage)에서 비교한 것이 아니므로 오로지 GPU의 성능을 비교했다고 하긴 어려움 적당한 비교(just curious)로 받아들이면 좋을듯 동일한 학습 모델, 데이터 셋에서의 학습 성능 비교 - 첫 2 epoch에 걸린 시간을 비교 Framework: Pytorch Model: efficientnet lite0 Batch size: 20 Image size: 384x384 데이터 수: 약 3만장 시스템: 결과: 결론 1. 역시 Nvidia가 좋다. 2. 학습속도는 조금 느릴지라도 AMD의 높은 GPU RAM은 무거운 모델 학습/구동에 좋을 수도 있겠다. 2022. 12. 12. Ubuntu, ROCm, AMD GPU, Docker, Pytorch 환경에서 딥러닝 정리 ROCm이 설치된 Ubuntu 환경에서 Docker-Pytorch 활용 딥러닝에 대해 정리 Radeon VII 사용 Ubuntu 환경에 ROCm과 Docker가 설치된 것을 가정 (ROCm 설치 글 Ubuntu, ROCm 설치 및 제거 (tistory.com)) (Docker 설치 글 Ubuntu, docker 설치 및 제거 정리 (tistory.com)) 공식 Docker image rocm/pytorch - Docker Image | Docker Hub Docker Hub hub.docker.com 1. rocm/pytorch 이미지 run size가 꽤나 크므로 시간이 조금 걸릴 수 있다 sudo docker run -it --network=host --device=/dev/kfd --device=.. 2022. 12. 10. Pytorch, grad-cam 사용 정리 Image 분류 모델의 gradcam 사용 정리 pytorch grad cam 공식 깃헙 GitHub - jacobgil/pytorch-grad-cam: Advanced AI Explainability for computer vision. Support for CNNs, Vision Transformers, Classification, Object detection, Segmentation, Image similarity and more. GitHub - jacobgil/pytorch-grad-cam: Advanced AI Explainability for computer vision. Support for CNNs, Vision Transformers, Clas Advanced AI Explainabi.. 2022. 12. 10. 이전 1 2 다음