default_setNet1_2

AMD, 7nm 공정 기반 데이터센터용 GPU 2종 선봬

기사승인 2018.11.08  12:02:50

공유
default_news_ad1

- 딥러닝·HPC·클라우드·렌더링에 탁월한 성능 제공…ROCm 오픈 소프트웨어 플랫폼도 공개

   
▲ AMD 라데온 인스팅트 GPU

AMD가 7일(현지시간) 7nm 공정 기반 데이터센터용 GPU인 라데온 인스팅트(Radeon Instinct) MI60 및 MI50 가속 카드를 공개했다.

AMD 라데온 인스팅트 MI60 및 MI50 가속 카드는 고성능 컴퓨트 유닛이 내장돼 유연한 혼합 정밀도(mixed-precision)를 제공한다. 이를 바탕으로 고성능 컴퓨팅, 딥러닝 응용 프로그램 등 신형 가속 카드가 지원하는 작업의 유형을 확장할 수 있다.

이와 더불어 빠른 속도의 복합 신경망 훈련, 높은 수준의 부동소수점(floating-point) 성능, 향상된 효율성, 데이터센터 전체 혹은 부분 적용을 위한 새로운 기능을 지원하는 등 다양한 작업을 효율적으로 처리하도록 고안됐다.

AMD 라데온 인스팅트 MI60 및 MI50 가속 카드는 초고속 부동수소점 성능과 최대 1TB/s의 처리 속도를 제공하는 초고속 HBM2 메모리를 제공한다. 차세대 PCle 4.0을 지원하는 최초의 GPU로, x86 기반에서 CPU와 GPU를 연결하는데 기존 기술보다 최대 2배 빠른 속도를 제공한다. AMD 인피니트 패브릭(AMD Infinite Fabric) 기술이 GPU 간 연결을 지원하며, 3세대 PCle 대비 최대 6배 향상된 속도를 제공한다.

AMD 라데온 인스팅트 MI60 및 MI50 가속 카드는 FP16 및 FP32의 혼합 정밀도 연산 성능과 더불어 INT8 및 INT4의 다중 정밀도를 지원한다. 복합 신경망 훈련에서부터 추론에 이르기까지 다양하고 변동성이 큰 작업 수행에 필요한 성능을 제공하는데 최적화됐다.

AMD 라데온 인스팅트 MI60 가속 카드는 PCle 4.0 와 호환되며 세계에서 가장 빠른 속도의 배정밀도 성능을 제공한다. 최대 7.4테라플롭스(TFLOPS)의 최대 FP64의 연산 성능을 기반으로 생명과학, 에너지, 금융, 오토모티브, 항공우주, 학문, 정부 부처, 군사방어 등의 다양한 영역의 고성능 컴퓨팅 응용 프로그램을 더욱 효율적으로 운용할 수 있도록 지원한다.

또한 AMD 라데온 인스팅트 MI50 가속 카드는 최대 6.7테라플롭스의 최대 FP64 배정밀도 성능을 제공하며, 관리 효율성은 물론 비용 효율성까지 갖춰 딥러닝 워크로드 수행뿐만 아니라, 데스크톱 가상화(VDI), 서비스로서의 데스크톱(DaaS), 클라우드 환경에서도 유용하게 활용될 수 있다.

각 GPU당 2개의 AMD 인피니티 패브릭 링크(Infinity Fabric Links)로 최대 200GB/s의 속도로 메모리 대역을 직접 연결할 수 있는데, 이는 PCle 3.0을 단독으로 사용한 경우와 비교 시 최대 6배 이상 향상된 수준이다. 한 번에 최대 4개의 GPU를 연결해 사용할 수 있으며, 이를 기반으로 총 8개의 GPU가 탑재된 서버를 구성할 수 있다.

AMD 라데온 인스팅트 MI60와 MI50 가속 카드에는 각각 32GB의 ECC 메모리와 16GB의 HBM2 ECC 메모리가 탑재돼 있다. 신형 가속 카드 2종 모두 풀 칩 형태의 ECC 메모리는 물론 업그레이드된 RAS(Reliability, Accessibility, and Serviceabolity) 기능을 지원해 대규모의 고성능 컴퓨팅 시스템 적용 시 보다 더 정확한 컴퓨트 성능을 제공한다.

AMD MxGPU 기술은 하드웨어 기반 GPU 가상화 솔루션으로, 업계 표준의 싱글 루트 I/O 가상화(SR-IOV) 기술을 기반으로 하고 있다. 하드웨어 단계에서부터 외부 해킹 시도를 방어하고, 가상 클라우드 적용 시 요구되는 높은 수준의 보안성을 제공한다.

AMD는 ROCm 오픈 소프트웨어 플랫폼도 새롭게 선보였다. 새로운 ROCm 소프트웨어 플랫폼은 고성능 및 에너지 효율성이 높은 이종 컴퓨팅 시스템에서 더욱 빠른 속도를 제공할 수 있도록 설계됐다.

신형 라데온 인스팅트 가속 카드 지원과 더불어, 새로운 딥러닝 오퍼레이션을 위한 최신 라이브러리를 제공하며, 센트OS(CentOS), 레드햇 엔터프라이즈 리눅스(RHEL), 우분투(Ubuntu) 등 64비트 리눅스 기반 운영 체제와 호환된다. 기존 구성요소에 대한 최적화, 텐서플로우 1.11 및 파이토치(PyTorch), 카페2(Caffe2)와 같은 최신 버전의 딥러닝 프레임워크도 지원한다.

데이비드 왕(David Wang) AMD 라데온 테크놀로지 그룹 엔지니어링 부문 수석 부사장은 “오늘날의 클라우드 데이터센터에서 발생하는 엄청난 양의 데이터를 분석하고 처리함에 있어, 기존 GPU 아키텍처는 한계가 있다”며 “AMD가 새롭게 선보인 라데온 인스팅트 가속 카드는 세계 최고 수준의 성능과 유연한 아키텍처를 기반으로 견고한 ROCm 소프트웨어 플랫폼을 지원한다. 업계를 선도하는 ROCm 오픈 소프트웨어 생태계에서 클라우드 컴퓨팅 분야 내 가장 복합적인 작업을 수행하는데 중요한 역할을 하게 될 것”이라고 말했다.

AMD 라데온 인스팅트 MI60 가속 카드는 연내 데이터센터 고객에게 선보일 예정이며, MI50 가속 카드는 2019년 1분기 내로 고객과 테스트를 시작할 계획이다. ROCm 2.0 오픈 소프트웨어 플랫폼도 연내 이용 가능하다.

윤현기 기자 y1333@datanet.co.kr

<저작권자 © 데이터넷 무단전재 및 재배포금지>
default_news_ad4
default_side_ad1

인기기사

default_side_ad2

포토

1 2 3
set_P1
default_side_ad3
default_setNet2
default_bottom
ad28
#top