태그 : Forklift
23.03: 23년 5월 업데이트
By 래블업 주식회사Backend.AI 23.03 및 22.09의 지속적 업데이트 내용을 정리합니다. 개발팀은 최선을 다해 마지막 비트까지 짜내기 위해 노력하고 있습니다.
이번 업데이트에서 가장 중요한 변경사항은 다음과 같습니다:
- 하드웨어 호환성 확장: 리벨리온(Rebeillons) 사의 ATOM 가속기 유휴 상태 검사 및 Dell EMC 스토리지 백엔드를 지원하여 하드웨어 호환성을 확장했습니다.
- 고속 업로드 강화: SFTP 기능을 도입하여 스토리지로의 고속 업로드를 지원합니다.
- 개발환경 향상: 로컬 Visual Studio Code에서 원격 SSH 모드로 세션을 접속할 수 있도록 하여 개발환경을 향상했습니다.
- 관리 용이성 증가: 관리자용 사용자 인터페이스 개선으로 AI 가속기 설정 및 자원 그룹 관리 용이성을 높였습니다.
Backend.AI Core & UI
- ATOM 가속기의 유휴 상태 검사를 지원하도록 추가하였습니다.
- 스토리지로 직접 고속 업로드를 지원하는 SFTP 기능을 도입하였습니다.
- 관리자 설정에 따라 주기적으로 비밀번호 업데이트를 강제 실행하는 기능을 추가하였습니다.
- 업로드 전용 세션(SYSTEM) 탭을 추가하였습니다.
- 허용되는 세션 타입에 Inference 타입을 추가하였습니다.
- 로컬 Visual Studio Code에서 원격 SSH 모드로 세션 접속 기능을 추가하였습니다.
- 폴더 탐색기에서 폴더 업로드를 지원하도록 하였습니다.
- 세션 생성시 할당된 공유자원(shared memory)양을 표시하도록 개선하였습니다.
- Dell EMC 스토리지 백엔드 지원을 추가하였습니다.
- 컨테이너 메모리 사용량 측정의 정확도를 개선하였습니다.
- 하나의 연산 노드에서 여러 개의 agent를 동시 실행할 수 있도록 개선하였습니다.
- 관리자용으로 프로젝트/자원 그룹명 필터를 추가하였습니다.
- 관리자용으로 GPU를 포함한 다양한 AI 가속기를 자원 프리셋/정책에서 설정할 수 있도록 사용자 인터페이스를 추가하였습니다.
- 관리자용으로 GPU를 포함한 다양한 가속기의 할당과 현재 사용량을 표시하는 인터페이스를 제공하였습니다.
- 관리자용으로 자원 그룹의 공개 여부를 설정할 수 있는 사용자 인터페이스를 제공하였습니다.
- 관리자용으로 세션 별 idle-checks 값 확인할 수 있는 사용자 인터페이스를 제공하였습니다.
- CLI에서 vfolder 업로드 시 재귀 옵션을 추가하였고, 상대 경로 처리를 개선하였습니다.
- CLI에서 특정 세션 종료 시 의존성이 걸려있는 세션을 한번에 종료할 수 있는 재귀 옵션을 추가하였습니다.
- 개발자용으로 기존의 cuda-mock 플러그인을 대체하는 새로운 mock-accelerator 플러그인을 추가하였습니다.
- 개발자용으로 스토리지 프록시의 내부 모니터링을 위한 상태 및 통계 확인 API를 추가하였습니다.
Backend.AI FastTrack
- 파이프라인 모듈 추가 시 vfolder를 이름으로 검색할 수 있도록 개선하였습니다.
- 파이프라인 실행 후 성공/실패를 쉽게 알 수 있도록 표시를 추가하였습니다.
Backend.AI Forklift
- 버그 수정 및 안정성을 개선하였습니다.
- 빌드 작업 내역 삭제 기능을 지원합니다.
- 빌드 작업 목록의 pagination을 지원합니다.
Backend.AI 는 하루가 다르게 변하는 AI 생태계에서 다양한 환경을 지원함과 동시에 더욱 강력하고 사용자 친화적인 환경을 제공하고자 끊임없이 발전하고 있습니다. 앞으로의 행보에도 많은 기대 부탁드립니다!
Make your AI accessible with Backend.AI!31 May 2023
23.03: 23년 3월 업데이트
By 래블업 주식회사23.03: 2023년 3월 업데이트
2023년을 맞이하여 Backend.AI의 첫 major 릴리즈인 23.03.0 버전이 발표되었습니다. 일부 기능은 후속 업데이트로 지속해서 선보일 예정입니다.
특히 이번 업데이트에서는:
- 새로운 연산 세션 유형으로 '추론(inference)' 서비스를 지원합니다.
- 새로운 스토리지 폴더 유형으로 '모델(model)' 관리를 지원합니다.
- 사용자 및 프로젝트 단위의 스토리지 용량 관리를 지원합니다.
- FastTrack의 파이프라인 버전 관리 및 UI가 크게 개선되었습니다.
Backend.AI Core & UI (23.03)
- 모델 관리 및 추론 세션 관리 기능을 추가하였습니다.
- 보다 고도화된 추론 엔드포인트 관리 및 네트워크 라우팅 계층은 후속 업데이트로 추가될 예정입니다.
- 코드베이스가 Python 3.11 기반으로 업데이트되었습니다.
- 프론트엔드에 React 구성요소들을 도입하고 Relay를 활용하여 보다 빠르고 반응성 높은 UI를 소개할 수 있는 기반을 준비하였습니다.
- 설치 환경으로 Ubuntu 22.04부터 기본으로 사용하는 cgroup v2를 정식 지원합니다.
- 사용자 및 프로젝트 단위의 스토리지 용량 관리를 위해 vfolder 구조를 v3로 업데이트하였습니다.
- 커널과 세션을 이제 별도의 데이터베이스 테이블로 다루고, 상태 전이 추적 과정이 전반적으로 더 적은 데이터베이스 부하로 작동하도록 개선하였습니다.
- 세션 실행 시 에이전트가 이미지 다운로드하는 과정의 진행상황을 표시하도록 개선하였습니다.
- CUDA 11.7 이상 환경에서 컨테이너별 GPU 사용량 표시를 개선하였습니다.
- 각 리소스그룹 내에서 사용자 및 프로젝트별로 스케줄링 우선순위(priority)를 지정할 수 있습니다.
- 사용자 계정 보호를 위해 일회용 비밀번호(TOTP) 기반 2FA (이중인증, two-factor authentication) 로그인을 지원합니다.
- 사용자가 직접 SSH keypair를 등록해 세션 접속이 가능하도록 지원합니다.
- Graphcore IPU 와 Rebellions ATOM 장치에 대응하는 사용자 인터페이스를 지원합니다.
Backend.AI Forklift (23.03)
- Dockerfile 템플릿 및 고급 편집 기능을 추가하였습니다.
- 추론용 컨테이너 이미지 작성을 지원합니다.
- Harbor 레지스트리와 연동할 수 있도록 이미지 관리 기능을 확장하였습니다.
Backend.AI FastTrack (23.03)
- FastTrack UI 상에서 스토리지 폴더 내용을 바로 확인할 수 있습니다.
- Core와의 세션 상태 동기화 방식을 이벤트 기반으로 개선하였습니다.
- 파이프라인 스케줄의 최대 반복 횟수를 설정할 수 있습니다.
- Task 실행에 실패할 경우 파이프라인 job이 대기하지 않고 자동으로 취소됩니다.
- 파이프라인 버전 관리가 추가되었습니다. 파이프라인의 형상 이력을 추적할 수 있으며, 특정 시점의 내용을 불러와 이어서 작업을 진행할 수 있습니다.
- 코드 에디터를 통해 YAML 형태의 파이프라인을 직접 수정할 수 있습니다.
개발 및 연구 프레임워크 지원
- TensorFlow 2.12, PyTorch 1.13 지원
- NGC (NVIDIA GPU Cloud) TensorFlow 22.12 (tf2), NGC PyTorch 22.12, NGC Triton 22.08 지원
- Google Colab과 동일한 라이브러리 및 패키지들을 제공하는 python-ff:23.01 이미지 추가
위에 나열한 것 외에도 많은 버그 수정과 내부적인 개선 사항들이 포함되어 있습니다.
앞으로도 더 많은 기능이 찾아올 예정입니다!31 March 2023