죄송합니다. 더 이상 지원되지 않는 웹 브라우저입니다.

반도체네트워크의 다양한 최신 기능을 사용하려면 이를 완전히 지원하는 최신 브라우저로 업그레이드 하셔야 합니다.
아래의 링크에서 브라우저를 업그레이드 하시기 바랍니다.

Internet Explorer 다운로드 | Chrome 다운로드

자일링스는 더 이상 FPGA 회사가 아니다_AI 대응 적응형 컴퓨팅 엑셀레이터 플랫폼(ACAP) 발표


PDF 다운로드



이공흠 기자(leekh@seminet.co.kr)


자일링스코리아 안흥식지사장은 “자일링스는 더 이상 FPGA 업체가 아니다. 이 의미는 FPGA를 안한다는 의미가 아니라 FPGA의 성능 향상이 기존 GPU나 CPU 영역에서 더욱 사용하기 편리한 장점을 내세워 활용도가 높아 지고 있음을 의미한다”고 말하고 “자일링스는 PLD로 시작해서 프로그래머블 로직, 올프로그래머블 로직 회사로 알려졌지만 이번에 새로운 개념의 ACAP(적응형 컴퓨팅 엑셀레이터 플랫폼 )이라는 제품을 발표하면서 더 이상 FPGA 회사의 면면을 내세우지 않고 GPU와 CPU에 대응해서 새로운 개념의 이정표를 만들겠다”는 것이 자일링스의 방향이라고 설명했다.

그 방향의 일환으로 SK텔레콤의 데이터 센터에 인공지능(AI) 가속기로 자일링스 FPGA를 배치했다고 자일링스와 SK텔레콤이 공동 발표했다. 자일링스의 킨텍스 울트라스케일 FPGA는 현재 SK텔레콤의 음성인식 플랫폼인 누구(NUGU)를 가속화하기 위해 SK텔레콤의 자동 음성 인식(ASR) 애플리케이션을 구동하고 있다. SK텔레콤은 ASR 애플리케이션에서 GPU에 비해 최대 5배 이상의 음성인식 처리량을 자랑하며, 16배 이상의 낮은 소비전력 특성을 나타냈다. 이는 한국에서 대규모의 데이터 센터를 위해 AI 도메인에서 FPGA 가속기를 상용 채택한 최초의 사례다.

자일링스 FPGA의 적응형 특성은 급속도로 진화하는 AI 및 딥 러닝 분야에 맞춤형 하드웨어 가속기를 신속하게 배치할 수 있도록 한다. 또한 FPGA는 CPU 및 GPU에 비해 낮은 전력으로 더 높은 성능과 낮은 대기 시간을 제공한다.

FPGA 기반 가속기는 기존 CPU 전용 서버에 효율적인 자일링스 FPGA 애드 인(Add-In) 카드를 추가하여 ASR 애플리케이션 서버의 총 소유 비용(TCO)을 낮춰 준다. ASR 서버는 빈 슬롯에 자일링스 FPGA 카드를 사용하여 쉽고 간단하게 여러 음성 서비스 채널을 가속화한다. 하나의 FPGA 카드는 단일 서버의 성능보다 5배 이상 뛰어나므로 상당한 비용 절감 효과가 있다.

SK텔레콤의 이강원 소프트웨어 기술원장은 “지난 몇 년간 이 산업이 성장하고 발전하는 것을 지켜봤으며, AI 가속기를 개발하는데 앞장서고 있다는 것에 자부심을 느낀다. 자일링스 KCU1500 보드와 SK텔레콤의 자체 비트스트림 이미지를 기반으로 한 솔루션을 설계함으로써, 비용 효율적이며 고성능 애플리케이션을 개발했다”고 말했다.

자일링스의 S/W 및 AI 솔루션 부문 제품 마케팅 부사장인 라민 론(Ramine Roane)은 “한국에서 최초로 SK텔레콤의 AI 데이터센터에 자일링스의 FPGA를 공급할 수 있는 기회를 갖게 되어 매우 기쁘다. 이번에 공급하는 자일링스의 킨텍스 울트라스케일 KCU1500 FPGA는 애플리케이션에서 자일링스가 경쟁력을 갖고 있음을 보여준다. 앞으로도 자일링스는 데이터 센터 가속화에 우리의 기술 역량과 혁신을 집중해 나갈 것이다”라고 말했다.

자일링스는 전통적으로 자동차용 고급 차량의 센서 드라이빙에 적용되거나 유무선 인프라 시스템에 30% 이상이 적용되었다. 그렇기 때문에 인터넷으로 데이터를 이용하면 모든 데이터는 무선 라디오, 기지국, 대규모 스위치를 통해 반드시 자일링스의 디바이스를 통과하여 최종 소비자에게 도착한다.

최근 데이터 센터 시장은 최신의 시장이면서 가장 빠른 성장세를 기록하고 있다. 자일링스가 눈독을 들이고 있는 이유이다. 이미 다른 분야의 시장에서 FPGA의 진가는 확인되었다. 전통적으로 FPGA는 in/out에서 소비가 많고 컴퓨팅 분야에서 널리 사용되어 왔기 때문에 데이터 센터의 스루풋에 FPGA는 최적의 디바이스임을 알고 있다.

4.jpg

FPGA는 전통적으로 하이엔드 프로세서로 사용되기 위해 도입되었으나, 지난 10년동안 하드웨어 확장은 실제로 시장이 요구하는 만큼 성장에 기여하지 못해 무어의 법칙이 무너졌다. 데이터의 수요와 프로세서 성능 요구는 폭발적으로 증가되었다. 이런 수요의 중심에는 AI가 있다. 이런 시장을 GPU/CPU가 중심이 되어 감당을 하였으나 소프트웨어 발전 속도에 비해 하드웨어 발전 속도는 매우 더디게 진행되었다. 설계자는 당연하게 하드웨어 유연성이 높은 FPGA에 눈을 돌릴 수 밖에 없었다.

메인 스트림에 FPGA가 도입이 되어야 하고 전통의 프로세서 들이 감당하지 못하는 데이터 프로세싱 분야에 FPGA가 점점 사용되게 되었다. AI를 비롯한 다양한 애플리케이션에서 적응형으로 수요에 빠르게 대처할 수 있는 FPGA가 도입되게 된 배경이다.

5.jpg

이런 데이터 센터 가속기 시장 규모는 22년까지 260억달러로 추산되며, 이런 데이터 센터에 사용되는 가속기 시장 규모는 꾸준히 늘어나고 있다. 데이터 센터의 가속기 시장을 주도하는 분야는 컴퓨팅, 스토리지, 네트워크이다. 이 분야에서 적용되는 것은 하이퍼스케일 퍼블릭 클라우드(PC)와 개인 클라우드, 텔코 클라우드 및 엣지가 있다.

자일링스의 최신 전략은 데이터 센터를 중심으로 한다. 기존의 핵심 시장에서도 성장을 가속화하는 전략은 유지하면서 이 분야에서도 AI가 핵심 역할을 할 것을 대비해서 적응형 컴퓨팅에 집중 투자하여 자일링스 입지를 더욱 공고히 한다는 전략으로 FPGA를 ACAP이라는 새로운 개념으로 발전시키려고 하고 있다.

8.jpg

다양한 데이터 센터에서 FPGA를 적극적으로 받아들이고 있다. aws나 NIMBIX에서 처음 FPGA를 데이터 센터에 도입했다. 이러한 추세에 따라서 알리바바 데이터 센터 클라우드 서비스도 FPGA를 기존 CPU/GPU 형태와 함께 데이터센터 가속기 시장에 도입하기 시작했다. 이런 추세가 가속화함에 따라 자일링스 역시 에코 시스템을 마련하게 되었다.

aws 클라우드 가속기 시장에서 이용되고 있는 에코시스템의 예이다. 우측에 보면 다양한 업체들이 aws를 지원하기 위해 구성되었다. 이런 에코시스템으로 지원하고 있는 분야는 Genomic, 빅데이터 분석, 비디오 스트리밍, 이미지 프로세싱, 네트워크를 중심으로 한 보안 분야가 있다. 이들은 기존의 GPU/CPU와 비교했을 때 10배~100배 빠른 속도로 가속화할 수 있다는 장점이 있다. 또한 GPU 같은 경우는 머신 러닝 같은 분야에 한정되어 사용되는 즉, 극히 용도가 제한되어 있다.
그렇지만 FPGA는 데이터센터의 가속기 시장에서 수요가 빠르게 늘고 있고 많은 업체에서 FPGA 사용을 적극 고려하고 있다.

9.jpg

자일링스는 머신러닝 흐름에 필요한 투자를 아끼지 않고 있다. 사실 개발자 입장에서 FPGA를 개발하는 것은 여러 리스크를 안고 있기 때문에 쉽게 접근하기 힘들다. 자일링스는 FPGA 도입을 쉽게 하기 위해 Tensor나 Caffe같은 프레임 워크로 개발을 하고 자일링스 툴을 사용하여 개발자가 초기 개발시 별다른 FPGA 훈련이나 지식없이도 바로 구현할 수 있도록 했다.

예를 들어 Pruning이나 양자화 같은 경우는 뉴럴 네트워크의 규모를 줄이는 것인데, 규모를 줄이면서도 종합적인 기술핵심은 유지하는 것이 관건이다. 이런 방법으로 개발자들이 개발한 내용을 최종 포인트 즉, 카메라, 자동차 등에는 작은 카드형태로 제공하고, 엣지는 중간 카드 크기로, 클라우드에는 대규모 카드를 적용함으로써 개발자가 바로 구현할 수 있도록 했다.

개발자는 아무런 위험부담 없이 복잡한 GPU/CPU 개발로부터 쉽고 용이하게 FPGA를 사용하여 가속기 성능을 높일 수 있게 되었다. FPGA의 유연성이 다시 한 번 유감없이 발휘되고 있다.

10.jpg

이전에는 상상할 수 없는 일이 FPGA 로드맵에서 일어나고 있다. 엔지니어들은 질문한다. FPGA를 AI 가속에 사용하는 장점이 무엇인가? 이전에는 GPU 대신 FPGA를 AI 가속기에 사용하는 것은 여러 이유들 때문에 매우 힘들었다.

AI 경우는 발전 속도가 매우 빠르다. 새로운 기술이 한달에 한번씩 업그레이드되는데, 그 발전 속도에 맞는 새로운 네트워크가 필요하게 된다. 현실적으로 GPU/CPU로는 이런 네트워크 발전 속도를 따라가지 못하게 되었다. FPGA와 같은 프로세싱을 잘하면서 전력소모가 적고 발열도 적은 디바이스가 최적인 시장이 되었다.
이렇게 빠르게 네트워크가 변하면 실리콘 사이클이 따라가지 못한다. 하드웨어 부분이 네트워크의 성장 속도에 맞출 수가 없다. 그래서 새로운 네트워크 부분이 탄생을 한다 하더라도 기존의 GPU/CPU/ASIC은 이런 새로운 네트워크를 효율성 있게 지원하지 못하고 있다.

이런 보완을 위해 FPGA 사용이 늘고 있다. FPGA는 프로그램을 재구성 할 수 있기 때문에 하드웨어 아키텍처 수준에서 원하는 내용을 즉시 수정할 수 있는 장점이 있다. 그래서 이미 가지고 있는 기존의 FPGA에 새롭게 프로그래밍만으로 새로운 업러닝 기술을 보유할 수 있는 것이다. 비용과 시간을 획기적으로 절약할 수 있게 된 것이다.

11.jpg

자일링스 디바이스 성능 로드맵을 보면 최종 목표가 ACAP임을 알 수 있다. 현재 엣지 분야에 사용되는 디바이스는 낮은 레이턴시여도 상관없이 엣지 분야의 딥 러닝에 사용되는 사례를 보고 있다. 자일링스는 기존에 나와있는 FPGA를 가지고 최신의 AI를 지원하는 것을 목표로 해서 향후에는 실리콘 기술을 개선하는 것으로 AI를 지원하는 목표를 가지고 있다.

12.jpg

이 그림은 차세대 ACAP에 관한 블록다이어그램이다. 하이레벨 디바이스로 더 이상 FPGA라고 부르지 않고 ACAP이라고 명명했다. 우측의 블록도를 보면 비균질 워크로드를 소화할 수 있도록 현재의 FPGA와 같은 블록이 들어가 있고, 붉은색으로 표시된 부분이 AI 엔진이다.

CCIX나 DDR 같은 블록이 내장되어 있고 HBM 같은 블록이 있어서 비균질적인 워크로드를 처리할 수 있는 차세대 AI 대응 제품으로 구성되어 있다. 전체적으로 소프트웨어상에서 프로그램 할 수 있기 때문에 하드웨어 제품 변화에는 손 댈 필요가 없는 것이다.


leekh@seminet.co.kr
(끝)
<저작권자(c) 반도체네트워크, 무단 전재-재배포 금지>

X


PDF 다운로드

개인정보보호법 제15조에 의한 수집/이용 동의 규정과 관련하여 아래와 같이 PDF 다운로드를 위한 개인정보 수집 및 이용에 동의하십니까? 동의를 거부할 수 있으며, 동의 거부 시 다운로드 하실 수 없습니다.

이메일을 입력하면,
(1) 신규참여자 : 성명/전화번호/회사명/분야를 입력할 수 있는 입력란이 나타납니다.
(2) 기참여자 : 이메일 입력만으로 다운로드가 가능합니다.

×

회원 정보 수정