Poplar SDK 2.4의 출시를 알려드리게 되어 매우 기쁘게 생각합니다. Poplar SDK 2.4는 그래프코어의 지원 포털과
Docker Hub에서 다운로드할 수 있습니다.
이번 출시는 그래프코어의 참조 애플리케이션과 MLPerf 제출에서 확인할 수 있듯이 소프트웨어 릴리스, 최적화 및 새로운 에코시스템 파트너십을 통해 지속적인 발전, 소프트웨어 성숙도, 사용 편의 향상, 스케일 아웃 기능과 벤치마크 상회를 달성했던 성공적인 한 해의 대단원입니다.
Poplar SDK 2.4의 새로운 기능
새로운 릴리스에는 사용 편의와 성능을 더욱 향상하고 개발자가 머신 러닝 모델을 더 빠르게 실행할 수 있도록 하는 개선 사항뿐 아니라, 그래프코어가
GitHub의 공개 예제에 추가한 새로운 애플리케이션 코드도 포함됩니다.
- ViT, UNet, GPT, RNN-T, FastSpeech2 및 TGN을 포함한 새로운 공개 예제
- 컴파일 시간 최적화
- TensorFlow 런타임 시 경사 축적 횟수의 동적 구성
- IPU TensorFlow 추가 기능 패키지
- Distributed TensorFlow 2(프리뷰)용 PopRun/PopDist: 사용이 쉬운 분산 다중 호스트 스케일 아웃 지원
- PopART 및 PyTorch용 중복 I/O 및 연산
- PopVision System Analyser의 IPU 활용 보고 개선
- Debian 10.7 전적 지원
개발자 경험 향상
Poplar SDK 2.4가 제공하는 여러 개선 사항을 통해 IPU 시스템에서 손쉽게 AI 애플리케이션을 가속화할 수 있습니다.
이번 업데이트는 지금까지의 업데이트 중에서도 가장 중요한 업데이트로서, AI 실무자를 위한 여러 애플리케이션을 추가로 지원하여 컴퓨터 비전, NLP, 언어 처리 및 GNN 등 여러 ML 영역에서 더 폭넓은 모델을 지원합니다. 이러한 새로운 모델은 Vision Transformer, UNet, GPT, RNN-T, FastSpeech2, Temporal Graph Networks(TGN) 등을 포함합니다. 새로운 모델은
GitHub 또는 그래프코어 웹사이트의 개발자 포털
Model Garden 페이지에서 액세스할 수 있습니다.
모델 개발 시 반복 시간을 단축하기 위해 컴파일 시간이 최적화되었습니다(최대 28% 개선).
TensorFlow 기능
이제 TensorFlow에서 런타임 시 파이프라인 모델의 경사 축적 횟수를 지정할 수 있습니다. 즉, 전역 배치 크기를 동적으로 정의할 수 있어 이 초매개변수를 조사하거나 조절할 때 더욱 신속하게 실험할 수 있습니다. 그래프코어의 새로운 IPU TensorFlow 추가 기능 패키지는 Adam, 확률적 기울기 강하(Stochastic Gradient Descent) 및 LAMB를 포함하여 그래프코어의 애플리케이션 팀이 개발한 IPU별 Keras 옵티마이저(TensorFlow 2와 함께 사용)를 포함합니다.
중복 I/O
또한 그래프코어는 Poplar 고급 런타임(PopART)과 PyTorch 프레임워크에 I/O 중복 및 연산 기능을 도입합니다. 이를 통해 연산 효율성을 향상하고 IPU 하드웨어에서 실행되는 프로그램의 속도를 크게 높일 수 있습니다.
PopVision 도구
그래프코어의 PopVision 분석 도구는 이번 릴리스에서 PopVision System Analyser에 추가된 개선된 IPU 활용 보고 기능을 통해 계속해서 개발자가 자신의 애플리케이션 성능을 보다 심층적으로 이해할 수 있도록 지원합니다.
PopVision은 그래프코어의 웹사이트에서 직접 다운로드할 수도 있습니다.
Debian 10.7 지원
Poplar SDK 2.3의 Debian 10.7 프리뷰 지원에 이어 이 최신 릴리스에서는 Debian 10.7 운영 체제를 전적으로 지원합니다.
기타 개발자 리소스
그래프코어의
개발자 포털에서 IPU 프로그래밍 관련 최신 문서, 튜토리얼, 코드 예시, 웨비나, 동영상, 연구 논문 및 기타 리소스에 액세스하세요.