본문 바로가기

전체 글

(77)
Ubuntu, Kubernetes Cluster 구성 정리 Ubuntu system 두 대를 활용해서 Kubernetes Cluster 구성 Kubernetes, containerd, calico 로 구성 1. 호스트 등록 (master node에서만 수행) /etc/hosts 에 내부 ip주소와 username 입력 # sudo nano /etc/hosts 192.168.1.173 master 192.168.1.174 worker1 2. swap off (모든 node에서 수행) sudo swapoff -a sudo sed -i '/ swap / s/^\(.*\)$/#\1/g' /etc/fstab 3. kernel modul load 저장 (모든 node에서 수행) sudo tee /etc/modules-load.d/containerd.conf unable t..
Ubuntu, 마우스 드래그 이상, display_server_not_supported 에러 정리 Ubuntu 22.04 Ubuntu 환경에서 언제부터인가 마우스 사용이 불편해짐 코드나 텍스트를 드래그 하면 실시간 드래그된 영역 표시가 아닌 클릭 버튼을 떼면 드래그 영역이 표시가 됨 은근 불편 또한 anydesk 를 셋업해서 접속하려니 display_server_not_supported 에러가 발생 두 문제를 함께 정리하는 이유는 xorg 세팅을 변경하자 둘 다 해결 참고 글 https://medium.com/@Dylan.Wang/how-to-fix-anydesk-of-display-server-not-supported-error-for-ubuntu-22-04-c98c44de89c0 How to Fix AnyDesk of Display_Server_Not_Supported Error for Ubunt..
Survival analysis 좋은 글 https://k-d-w.org/#posts Sebastian Pölsterl Post-Doctoral Researcher k-d-w.org http://www.sthda.com/english/wiki/cox-proportional-hazards-model Cox Proportional-Hazards Model - Easy Guides - Wiki - STHDA Statistical tools for data analysis and visualization www.sthda.com https://humboldt-wi.github.io/blog/research/information_systems_1920/group2_survivalanalysis/ Deep Learning for Survival Analy..
Ubuntu, ROCm, AMD GPU, Docker, Tensorflow, 환경에서 JAX 세팅 정리 Ubuntu 22.04 Radeon RX 6800 google-research에서 공개한 maxim 모델을 구동하려니 Tensorflow 기반의 JAX라는 GPU에 dependent한 연산 라이브러리 환경이 필요했다. Docker 기반 ROCm에 동작하는 JAX 환경 구축 정리 도커와 ROCm이 설치된 것을 가정 ROCm 개발자들이 도커에서 JAX를 build를 업데이트 하고 command을 안내하였지만 그대로 돌리면 build가 완료되지 않는다.(https://github.com/ROCmSoftwarePlatform/jax/tree/main/build/rocm) 디버깅 내용을 정리 1. git clone git clone https://github.com/ROCmSoftwarePlatform/jax.g..
Pytorch distributed launch watchdog timeout 에러 해결 [E ProcessGroupNCCL.cpp:587] [Rank 3] Watchdog caught collective operation timeout: WorkNCCL(OpType=ALLREDUCE, Timeout(ms)=1800000) ran for 1803170 milliseconds before timing out Ubuntu 20.04 BSRGAN, HAT 모델 학습 중 확인 https://github.com/cszn/BSRGAN GitHub - cszn/BSRGAN: Designing a Practical Degradation Model for Deep Blind Image Super-Resolution (ICCV, 2021) (PyTorch) - We Designing a Practical De..
Docker 명령어 정리 컨테이너 확인 # 가동중인 container 확인 sudo docker ps # 꺼진거도 확인 sudo docker ps -a 컨테이너 제거 # 컨테이너 삭제 sudo docker rm container-id # 컨테이너 강제종료 및 제거 sudo docker rm -f container-id # sudo docker ps -a로 나오는 컨테이너 모두 강제 종료 및 제거 sudo docker rm -f $(sudo docker ps -a) 컨테이너 attach, detach # attach sudo docker attach container-id # detach # 단축키 ctrl + p + q 종료된 컨테이너 재실행 sudo docker container restart container-id 커밋 # ..
Super resolution 모델, HAT train 정리 Ubuntu 20.04 공식 github https://github.com/XPixelGroup/HAT GitHub - XPixelGroup/HAT: Arxiv2022 - Activating More Pixels in Image Super-Resolution Transformer Arxiv2022 - Activating More Pixels in Image Super-Resolution Transformer - GitHub - XPixelGroup/HAT: Arxiv2022 - Activating More Pixels in Image Super-Resolution Transformer github.com 앞선 글에서 (https://honbul.tistory.com/59) 4번, setup.py까지 진행..
AMD GPU MIGraphX docker 사용 정리 Ubuntu 20.04 ROCm 5.4 Radeon VII Nvidia의 TensorRT와 같은 포지션에 있는 AMD의 MIGraphX 정리 apt install, build from source, docker 를 통한 설치를 모두 해본 결과 docker가 가장 문제없이 잘 돌아간다. 참고 글 GitHub - ROCmSoftwarePlatform/AMDMIGraphX: AMD's graph optimization engine. GitHub - ROCmSoftwarePlatform/AMDMIGraphX: AMD's graph optimization engine. AMD's graph optimization engine. Contribute to ROCmSoftwarePlatform/AMDMIGraphX d..