클라우드 머신러닝: FPGA 기반 DNN
글/나게시 굽타(Nagesh Gupta), Auviz Systems 창업자 및 CEO, Nagesh@auvizsystems.com
인공지능은 머신러닝(Machine Learning)의 급속한 발전에 힘입어 대혁신의 시기를 맞고 있다. 머신러닝 분야에서는 일종의‘딥-러닝(Deep Learning)’이라는 알고리즘이 대용량 데이터 세트로 탁월한 성능을 제공한다는 점에서 상당한 관심을 불러모으고 있다. 딥-러닝을 통해 머신은 대규모 데이터를 기반으로 지도식
(supervised) 또는 비지도식(unsupervised) 학습방식으로 작업을 습득할 수 있다. 대규모 지도학습(Supervised Learning)은 이미지 인식이나 음성 인식과 같은 작업을 매우 성공적으로 수행할 수 있다.
딥-러닝 기법은 예상 결과와 일치하는 가중치
(Weights) 및 바이어스(Bias) 값들을 찾기 위해 많은 양의 알려진 데이터들을 사용한다. 이 프로세스는 트레이닝이라고 불리며, 수많은 모델들을 만들어낼 수 있다. 이때문에 엔지니어들은 트레이닝 및 분류 용도로 GPU와 같은 특화된 하드웨어를 지향하고 있다.
데이터 규모가 갈수록 증가함에 따라, 머신러닝은 CPU 상에 대규모 머신러닝 모델이 구현된 클라우드 상으로 이행해 가고 있다. GPU는 딥-러닝 알고리즘을 위한 성능 면에서는 뛰어난 대안이지만, 엄청난 전력요건으로 인해 고성능 컴퓨팅 클러스터에 사용하기에는 한계가 있다. 따라서 전력소모를 과도하게 증가시키지 않으면서도 알고리즘을 가속화할 수 있는 프로세싱 플랫폼에 대한 필요성이 절실하다. 이러한 맥락에서 FPGA는 저전력 속성으로 다수의 병렬 프로세싱을 용이하게 처리할 수 있는 고유의 기능을 갖추고 있어 이상적인 대안이 될 수 있다.
그렇다면 자일링스(XilinxⓇ) FPGA 상에 어떻게 CNN(Convolutional Neural Network)을 구현할 수 있는지 자세히 살펴보도록 하자. CNN은 대규모 이미지 인식 작업 및 다른 유사한 머신러닝 문제를 매우 성공적으로 처리할 수 있는 DNN의 일종이다. 따라서 FPGA에 대한 CNN 구현의 타당성 조사를 통해 FPGA가 대규모 머신러닝 문제 해결에 적합한지 여부에 대한 지표를 제공할 수 있을 것이다.
CNN(Convolutional Neural Network)은 무엇인가?
CNN(Convolutional Neural Networks)은 DNN(Deep Neural Networks)의 한 형태로 최근 엔지니어들이 다양한 인식 작업에 사용하기 시작했다. 이미지 인식, 음성 인식, 자연언어(Natural-Language) 처리 등이 CNN을 적용한 일반적인 애플리케이션들이다.
2012년에 토론토 대학의 알렉스 크리쉬브스키(Alex Krishevsky)[1] 등이 제안한 CNN 기반의 딥 아키텍처는 국제 이미지 인식 기술대회인 ILSVRC(Image-Net Large Scale Visual Recognition Challenge)에서 수상한바 있다. 이 모델은 이전의 모델이나 경쟁자들에 비해 인식 기술면에서 상당한 진전을 달성했으며, Alex-Net은 모든 이미지 인식 작업 비교를 위한 벤치마크가 되었다.
AlexNet은 3개의 밀도 레이어(Dense Layer)에 이어 5개의 콘볼루션 레이어(Convolution Layer)로 구성되어 있다(그림 1 참조). 각 콘볼루션 레이어는 가중 필터(Weight Filter)를 갖춘 일련의 입력 피처 맵(Feature Map)의 합성곱 연산을 수행하며, 출력 피처 맵을 도출하게 된다. 밀도 레이어는 완벽하게 레이어들이 연결되어 있으며, 모든 출력은 모든 입력의 함수가 된다...(중략)
알베오 U55C의 출시로 HPC 업계에 많은 가치 제공할 것
조회수 814회 / Nathan Chang
엣지 센서에서 CPU 가속기까지 ‘버설 AI 엣지 시리즈’
조회수 1020회 / Rehan Tahir
적응형 컴퓨팅, 포스트-무어의 법칙 시대에서 성장을 주도하다
조회수 1363회 / Victor Peng
데이터센터 혁신을 위한 장벽 없는 FPGA 솔루션
조회수 1005회 / Kartik Srinivasan 외 2인
자동차 시장의 혁신을 선도하는 자일링스의 DNA
조회수 741회 / Yousef Khalilollahi
CXL, CCIX 기반 PCIe 5와 SmartNIC은 어떻게 가속 솔루션을 혁신하고 있...
조회수 6813회 / Scott Schweitzer
대규모 5G 무선 구축을 위한 혁신적인 징크 RFSoC DFE
조회수 1496회 / Gilles Garcia
SmartNIC 아키텍처: 가속기로의 이행, 그리고 FPGA가 우위를 점하는 이유
조회수 4476회 / Scott Schweitzer
SmartNIC이 일반 NIC보다 뛰어난 이유는?
조회수 1871회 / Scott Schweitzer
PDF 다운로드
회원 정보 수정