인텔, 기업용 생성형 AI 시장 독점 구조 타개할 선택지로 가우디 3 발표 | 반도체네트워크

죄송합니다. 더 이상 지원되지 않는 웹 브라우저입니다.

반도체네트워크의 다양한 최신 기능을 사용하려면 이를 완전히 지원하는 최신 브라우저로 업그레이드 하셔야 합니다.
아래의 링크에서 브라우저를 업그레이드 하시기 바랍니다.

Internet Explorer 다운로드 | Chrome 다운로드

인텔, 기업용 생성형 AI 시장 독점 구조 타개할 선택지로 가우디 3 발표



글/반도체네트워크 편집부 2024.04.11

intel.jpg

인텔은 연례 행사인 인텔 비전(Intel Vision)에서 기존 모델 대비 BF16용 AI 컴퓨팅에서 4배, 메모리 대역폭에서 1.5배, 대규모 시스템 확장을 위한 네트워킹 대역폭은 2배 향상한 인텔® 가우디® 3(Intel® Gaudi® 3) AI 가속기를 선보였다. 가우디 3는 LLM(대규모 언어 모델) 및 멀티모달 모델에서 AI 학습 및 추론을 위한 성능과 생산성을 대폭 향상했다. 인텔은 업계 유일 MLPerf 벤치마크를 공개한 LLM용 대안인 인텔® 가우디®(Intel® Gaudi® 2) 2 AI 가속기의 입증된 성능과 효율성을 기반으로 개방형 커뮤니티 기반 소프트웨어 및 업계 표준 이더넷 네트워킹을 통해 고객에게 시스템을 보다 유연하게 확장할 수 있는 선택권을 제공한다.

인텔 DCAI(데이터센터 및 AI) 그룹 총괄 저스틴 호타드(Justin Hotard) 수석 부사장은 “끊임없이 진화하는 AI 시장 환경 속에서 현재 제공되는 제품에는 상당한 격차가 존재한다. 고객과 시장의 피드백에 의하면 선택의 폭이 확대되길 바라는 요구가 있다”라며 “기업은 가용성, 확장성, 성능, 비용, 에너지 효율성 등을 비중있게 고려한다. 인텔 가우디 3는 가격 대비 성능, 시스템 확장성, 가용성 등 모든 측면에서 이점을 갖춘 매력적인 생성형 AI 대안으로 주목받고 있다”고 밝혔다.

오늘날 금융, 제조, 의료 등 주요 부문의 기업들은 AI에 대한 접근성을 확대하고 실험 단계에서 본격적인 구현으로 전환하는 생성형 AI(GenAI) 프로젝트를 빠르게 모색하고 있다. 이러한 전환을 관리하고 혁신을 촉진하며 매출 성장 목표를 실현하기 위해 기업은 투자 수익률(ROI) 및 운영 효율성 요구를 충족하는 개방적이고 비용 효율적이며 에너지 효율적인 솔루션과 제품을 필요로 한다. 

인텔 가우디 3 가속기는 이러한 요구 사항을 충족하고 개방형 커뮤니티 기반 소프트웨어와 개방형 산업 표준 이더넷을 통해 다양한 기능을 제공하여 기업이 AI 시스템과 애플리케이션을 유연하게 확장할 수 있도록 지원하고 있다. 

맞춤형 아키텍처로 생성형 AI 성능과 효율성 제공: 효율적인 대규모 AI 컴퓨팅을 위해 설계된 인텔 가우디 3 가속기는 5나노미터(nm) 공정으로 제조되며 이전 제품보다 크게 향상된 성능을 제공한다. MME(Matrix Multiplication Engine), 텐서 프로세서 코어(TPC), 네트워킹 인터페이스 카드(NIC) 등 모든 엔진을 병렬로 활성화할 수 있도록 설계되어 빠르고 효율적인 딥러닝 연산 및 확장에 필요한 가속화를 지원한다. 주요 기능은 다음과 같다.

• AI 전용 컴퓨팅 엔진: 인텔 가우디 3 가속기는 고성능, 고효율 생성형 AI 컴퓨팅을 위해 설계되었다. 각 가속기는 64개의 AI 맞춤형 및 프로그래밍 가능한 TPC와 8개의 MME로 구성된 이종 컴퓨팅 엔진을 갖추고 있다. 각 인텔 가우디 3 MME는 6만 4천개의 병렬 연산을 수행할 수 있어 높은 수준의 연산 효율성을 제공하며, 딥 러닝 알고리즘의 기본 연산 유형인 복잡한 행렬 연산을 능숙하게 처리할 수 있다. 가우디 3만의 설계는 병렬 AI 작업의 속도와 효율성을 가속화하고 FP8 및 BF16을 비롯한 여러 데이터 유형을 지원한다.

• LLM 용량 요구사항을 위한 메모리 가속: 128 GB의 HBMe2 메모리 용량, 3.7 TB의 메모리 대역폭, 96 MB의 SRAM(온보드 정적 기억 장치)으로 더 적은 수의 인텔 가우디 3에서 대규모 생성형 AI 데이터세트를 처리할 수 있는 충분한 메모리를 제공하며, 특히 대규모 언어 및 멀티모달 모델을 제공하는 데 유용하여 워크로드 성능과 데이터센터 비용 효율성이 향상된다.

• 기업용 생성형 AI를 위한 효율적인 시스템 확장: 24개의 200 Gb 이더넷 포트가 모든 인텔 가우디 3 가속기에 통합되어 있어 유연한 개방형 표준 네트워킹을 제공한다. 이를 통해 효율적인 확장이 가능해 대규모 컴퓨팅 클러스터를 지원하고 독점 네트워킹 패브릭이 한 벤더에 종속될 필요가 없다. 인텔 가우디 3 가속기는 단일 노드에서 수천 개까지 효율적으로 스케일업 및 스케일아웃할 수 있도록 설계되어 생성형 AI 모델의 광범위한 요구 사항을 충족한다.

• 개발자의 생산성을 위한 개방형 산업 소프트웨어: 인텔 가우디 소프트웨어는 파이토치(PyTorch) 프레임워크를 통합하며 오늘날 생성형 AI 개발자에게 가장 널리 사용되는 AI 프레임워크인 허깅 페이스(Hugging Face) 커뮤니티 기반 최적화 모델을 제공한다. 이를 통해 생성형 AI 개발자는 높은 추상화 수준에서 작업하여 사용 편의성과 생산성을 높이고 하드웨어 유형 간에 모델을 쉽게 이식할 수 있다.

• 가우디 3 PCle: 가우디 3 PCle 부속(add-in) 카드가 제품군에 새로 추가되었다. 저전력으로 높은 효율성을 제공하도록 맞춤 설계된 새로운 폼팩터는 미세 조정, 추론 및 RAG(retrieval-augmented generation)와 같은 워크로드에 이상적이다. 600와트의 풀 하이트 폼 팩터로, 128GB의 HBM2e 메모리 용량과 초당 3.7TB의 대역폭을 제공한다.

인텔 가우디 3 가속기는 주요 생성형 AI 모델에 대한 학습 및 추론 작업에서 상당한 성능 향상을 제공할 수 있다. 특히 가우디 3 가속기는 엔비디아 H100 대비 평균적으로 다음과 같은 성능을 제공할 것으로 예상된다.

• 라마(Llama2) 70억개 및 130억개의 매개변수와 GPT-3 1750억개의 매개변수 모델에서 학습 시간 50% 단축1

• 라마 70억개 및 700억개의 매개변수 모델에서 50% 빠른 추론 처리량(스루풋)2 및 40% 향상된 추론 전력 효율성3 제공. 더 긴 입력/출력 시퀀스에서 더 큰 추론 성능 이점 제공

• 라마 70억개 및 700억개 매개변수와 팔콘(Falcon) 1800억개 매개변수 모델에서 엔비디아 H200 대비30% 빠른 추론4 

시장 도입 및 출시 정보: 인텔 가우디 3 가속기는 2024년 2분기에 범용 베이스보드 및 개방형 가속기 모듈(OAM)의 산업 표준 구성으로 OEM에 제공될 예정이다. 가우디 3를 시장에 출시할 주요 OEM 업체는 델 테크놀로지스(Dell Technologies), HPE, 레노보(Lenovo), 슈퍼마이크로(Supermicro) 등이다. 인텔 가우디 3 가속기의 GA(General availability)는 2024년 3분기로 예정되어 있으며, 인텔 가우디 3 PCIe 애드인 카드는 2024년 마지막 분기에 출시될 것으로 예상된다. 

또한 인텔 가우디 3 가속기는 학습 및 추론을 위한 여러 비용 효율적인 클라우드 LLM 인프라를 지원하여 기업들에게 가격 대비 성능의 이점과 선택권을 제공할 예정이다.

개발자는 지금 바로 개발자 클라우드에서 인텔 가우디 2 기반 인스턴스에 액세스하여 애플리케이션 및 워크로드를 학습, 프로토타이핑, 테스트 및 실행해볼 수 있다.

인텔 가우디 3 가속기의 다음 모멘텀은 AI 및 고성능 컴퓨팅(HPC)을 위한 인텔의 차세대 그래픽 처리 장치(GPU)인 팔콘 쇼어(Falcon Shore) 기반이 될 것이다. 팔콘 쇼어는 인텔 가우디와 인텔® Xe IP를 인텔® oneAPI 사양에 기반한 단일 GPU 프로그래밍 인터페이스와 통합할 예정이다.


Intel 소개
반도체 업계의 선두주자인 인텔(NASDAQ: INTC)은 우리의 삶을 윤택하게 하고 전 세계의 발전을 가능케 할 세상을 바꾸는 기술들을 창조하고 있다. 무어의 법칙을 바탕으로 인텔은 고객의 문제 해결을 돕기 위해 반도체의 설계와 제조 과정을 지속적으로 발전하기 위해 노력하고 있다. 인텔은 클라우드, 네트워크, 엣지 그리고 모든 컴퓨팅 디바이스에 인텔리전스를 접목함으로써 데이터의 잠재력을 끌어내 기업의 비즈니스는 물론 우리가 살고 있는 사회를 좀 더 나은 방향으로 변화시키고 있다. 인텔의 혁신적인 노력에 대한 보다 자세한 정보는 newsroom.intel.com 혹은 intel.com에서 확인 가능하다. 인텔©. 인텔 및 인텔 로고는 인텔사 또는 그 자회사의 상표이다. 기타 명칭과 브랜드는 해당 소유업체의 자산이다.
leekh@seminet.co.kr
(끝)
<저작권자(c) 반도체네트워크, 무단 전재-재배포 금지>

X


PDF 다운로드

개인정보보호법 제15조에 의한 수집/이용 동의 규정과 관련하여 아래와 같이 PDF 다운로드를 위한 개인정보 수집 및 이용에 동의하십니까? 동의를 거부할 수 있으며, 동의 거부 시 다운로드 하실 수 없습니다.

이메일을 입력하면,
(1) 신규참여자 : 성명/전화번호/회사명/분야를 입력할 수 있는 입력란이 나타납니다.
(2) 기참여자 : 이메일 입력만으로 다운로드가 가능합니다.

×

회원 정보 수정