엔비디아 H100 GPU, MLPerf 벤치마크 8개의 테스트 모두 신기록 달성
글/반도체네트워크 편집부 2023.07.01
엔비디아가 MLPerf 벤치마크에서 엔비디아 H100 텐서 코어 GPU(NVIDIA H100 Tensore Core GPU)가 생성형 AI를 구동하는 대규모 언어 모델(LLM)에서 최고의 AI 성능을 제공한다고 밝혔다. 최신 MLPerf 트레이닝 벤치마크에서 H100 GPU는 8개의 테스트 모두에서 신기록을 세웠으며, 생성형 Al를 위한 새로운 MLPerf 테스트에서 탁월한 성능을 발휘했다. 이러한 우수성은 개별 가속기와 대규모 서버에서 모두 제공된다.
스타트업 인플렉션(Inflection) AI가 공동 개발하고 GPU 가속 워크로드 전문 클라우드 서비스 제공업체인 코어위브(CoreWeave)가 운영하는 3,584개의 H100 GPU로 구성된 상용 클러스터에서 이 시스템은 11분 이내에 대규모 GPT-3트레이닝 벤치마크를 달성했다.
코어위브 공동설립자 겸 CTO 브라이언 벤투로(Brian Venturo)는 "우리 고객들은 오늘날 빠르고 지연 시간이 짧은 인피니밴드 네트워크에서 수천 개의 H100 GPU를 통해 최첨단 생성형 AI 및 LLM을 대규모로 구축하고 있다. 엔비디아와 공동으로 제출한 MLPerf는 우리 고객들이 누리고 있는 뛰어난 성능을 명확하게 보여준다"고 말했다.
인플렉션 AI는 이러한 성능을 활용해 최초의 개인용 AI인 Pi(Personal Intelligence)의 기반이 되는 고급 LLM을 구축했다. 인플렉션은 사용자가 간단하고 자연스러운 방식으로 상호 작용할 수 있는 개인용 AI를 개발하는 AI 스튜디오 역할을 하게 된다. 인플렉션 AI CEO 무스타파 설리만(Mustafa Suleyman)은 “코어위브의 강력한 H100 GPU 네트워크에서 훈련된 최첨단 대규모 언어 모델을 기반으로 누구나 개인용 AI의 힘을 경험할 수 있다"고 말했다.
2022년 초 딥마인드(DeepMind)의 무스타파와 카렌 사이모니언(Karén Simonyan), 리드 호프먼(Reid Hoffman)이 공동 설립한 인플렉션 AI는 코어위브와 협력해 엔비디아 GPU를 사용하는 세계 최대 규모의 컴퓨팅 클러스터 중 하나를 구축하는 것을 목표로 한다.
엔비디아, 새로운 RTX A400과 A1000 GPU로 AI 기반 워크플로우 강화
조회수 79회 / NVIDIA
엔비디아, 클라우드 양자 컴퓨터 시뮬레이션 마이크로서비스 출시
조회수 130회 / 엔비디아
엔비디아, AI 시대 위한 GTC 콘퍼런스 개최 준비 박차
조회수 122회 / NVIDIA
nVidia, AI 플랫폼 전반에서 텐서RT-LLM으로 젬마 성능 가속화
조회수 196회 / NVIDIA
nvidia, 차세대 AI 디자인과 시각화 시대 위한 초고화질 레이 트레이싱 ...
조회수 141회 / 엔비디아
nVidia 드라이브, 선도적인 전기차 제조업체에 자율주행 실현 지원
조회수 194회 / 엔비디아
엔비디아, 새로운 스펙트럼-X 이더넷 네트워킹으로 기업 AI 워크로드 가...
조회수 281회 / nVidia
엔비디아, HGX H200 출시…추론 속도 더욱 가속화
조회수 311회 / 엔비디아
엔비디아, 로보틱스와 엣지 위한 젯슨 플랫폼 확장 발표
조회수 267회 / nVidia
PDF 다운로드
회원 정보 수정