죄송합니다. 더 이상 지원되지 않는 웹 브라우저입니다.

반도체네트워크의 다양한 최신 기능을 사용하려면 이를 완전히 지원하는 최신 브라우저로 업그레이드 하셔야 합니다.
아래의 링크에서 브라우저를 업그레이드 하시기 바랍니다.

Internet Explorer 다운로드 | Chrome 다운로드

클라우드에서 엣지까지 AI를 구현할 수 있는 적응형 가속 솔루션



글/데일 히트(Dale Hitt), 전략 마케팅 개발 디렉터, 자일링스


스마트 보안, 로보틱스, 자율주행과 같은 애플리케이션은 성능을 향상시키고, 새로운 사용자 경험을 제공하기 위해 임베디드 AI(Artificial Intelligence) 채택을 점점 더 가속화되고 있다. 반면 전력, 대기시간, 물리적 크기에 대한 제약이 강화됨에 따라 기존 컴퓨팅 플랫폼에서 호스팅되는 추론 엔진으로는 이러한 실제 요구사항을 충족시키는데 어려움이 따르고 있다. 이러한 엔진은 견고하게 정의된 추론 정밀도와 버스 폭, 메모리를 최상의 속도와 효율, 실리콘 면적에 최적화하여 쉽게 적응시킬 수 없기 때문이다. 따라서 첨단 CNN(Convolutional Neural Network)을 실행하는 임베디드 AI에 대한 요구를 충족시키기 위해서는 적응형 컴퓨팅 플랫폼이 필요하다.
이와 함께 보다 진보된 신경망 네트워크에 적응할 수 있는 유연성 또한 큰 관심사 중 하나이다. 현재 널리 사용되고 있는 CNN은 새로운 최신 아키텍처로 빠르게 대체되고 있다. 그러나 기존의 SoC는 일반적으로 개발 시작 단계에서 약 3년 후에 구축하는 것을 목표로 현재의 신경망 네트워크 아키텍처에 대한 지식을 이용해 설계해야만 한다. RNN이나 CapNet(Capsule Network)과 같은 새로운 유형의 신경망 네트워크는 기존의 SoC로는 비효율적이고, 경쟁력을 유지하는데 필요한 성능을 제공할 수 없다.
임베디드 AI를 통해 최종 사용자의 기대치를 충족시키고, 계속 진화하고 있는 예측 가능한 미래의 요구에 대응하기 위해서는 보다 유연하고 적응 가능한 컴퓨팅 플랫폼이 필요하다. 이는 가변적 정밀도 추론에 적합한 설정 가능한 메모리 아키텍처와 신호 프로세싱을 포함하고 있는 확장 가능한 프로그래머블 로직 패브릭 및 메인 애플리케이션 프로세서를 통합한 사용자 설정이 가능한 MPSoC(Multi-Core System on Chip)를 활용함으로써 달성할 수 있다.

AR(클라우드)-1.jpg

추론 정밀도

기존의 SoC는 메모리 구조 및 컴퓨팅 정밀도와 같은 성능을 정의하는 기능들이 고정되어 있다. 특정 알고리즘에 대한 최적의 정밀도는 더 낮을 수도 있지만, 코어 CPU에 의해 정의되는 최소값은 보통 8bit이다. MPSoC는 프로그래머블 로직을 트랜지스터 레벨까지 최적화할 수 있기 때문에 필요에 따라 추론 정밀도를 1bit까지 낮출 수 있다. 또한 이러한 디바이스는 MAC(Multiply-Accumulate) 연산을 효율적으로 처리하기 위해 수천 개의 구성 가능한 DSP 슬라이스를 포함하고 있다.
추론 정밀도를 자유롭게 최적화할 수 있기 때문에 제곱 법칙(Square-Law)에 따라 컴퓨팅 효율을 정확하게 산출할 수 있다. 1bit 코어에서 실행되는 단일 비트 연산은 궁극적으로 8bit 코어에서 동일한 연산을 완료하는데 필요한 로직의 64분의 1만 사용하게 된다. 또한 MPSoC는 가능한 최상의 효율로 필요한 성능을 제공하기 위해 신경망 네트워크의 각 레이어에 대한 추론 정밀도를 각기 다르게 최적화할 수 있다.

메모리 아키텍처

추론 정밀도를 변경하여 컴퓨팅 효율을 향상시키는 것은 물론, 프로그램이 가능한 온칩 메모리의 대역폭과 구조를 모두 설정할 수 있어 임베디드 AI의 성능 및 효율을 더욱 향상시킬 수 있다. 사용자가 직접 구성 가능한 MPSoC는 동일한 추론 엔진을 실행하는 기존 컴퓨팅 플랫폼에 비해 6배의 메모리 인터페이스 대역폭과 4배 이상의 온칩 메모리를 구현할 수 있다. 메모리 구성이 가능하기 때문에 사용자는 병목현상을 줄이고, 칩 리소스 활용을 최적화할 수 있다. 또한 일반적인 서브 시스템은 칩 상에 통합된 캐시가 제한적이고, 오프칩 스토리지와 자주 상호 동작이 필요하기 때문에 대기시간과 전력소모가 증가하게 된다. MPSoC는 대부분의 메모리 교환이 온칩에서 이뤄지기 때문에 훨씬 더 빠를 뿐만 아니라 오프칩 메모리 상호 작용으로 인한 전력소모의 99% 이상을 절감할 수 있다.

실리콘 면적

솔루션 크기는 특히 모바일 AI가 내장된 드론이나 로봇, 자율주행 차량의 경우 더욱 중요한 고려사항이 되고 있다. MPSoC의 FPGA 패브릭에 구현된 추론 엔진은 기존 SoC의 8분의 1에 해당하는 실리콘 면적만을 차지하기 때문에 개발자는 보다 강력한 엔진을 더 작은 디바이스에 구현할 수 있다.
또한 MPSoC 디바이스 제품군은 시스템의 성능 요구사항에 부합하는 가장 효율적인 전력, 비용, 사이즈 옵션으로 추론 엔진을 구현할 수 있도록 설계자들에게 다양한 제품 라인이 공급되고 있다. 자율주행 애플리케이션에서 매우 중요한 산업 표준 ISO 26262 ASIL-C 안전 규격에 따라 인증된 하드웨어 기능-안전 기능을 갖춘 자동차 등급의 부품들도 포함되어 있다. 예를 들어, 자일링스의 자동차 등급 XA 징크 울트라스케일+(Zynq UltraScale+) 제품군은 64bit 쿼드-코어 ARMⓇ Cortex™-A53 및 듀얼-코어 ARM Cortex-R5 기반 프로세싱 시스템과 함께 확장 가능한 프로그래머블 로직 패브릭을 포함하고 있어 제어 프로세싱 및 머신 러닝 알고리즘과 고장 방지기능(Fault Tolerance)을 갖춘 안전 회로를 단일 칩 상에 통합할 수 있다.
현재 임베디드 추론 엔진은 단일 MPSoC 디바이스에 구현이 가능하며, 모바일 로봇이나 자율주행과 같은 애플리케이션의 전력규격에 적합한 최소 2W만을 소모한다. 기존의 컴퓨팅 플랫폼은 지금도 이러한 전력 레벨에서 실시간 CNN 애플리케이션을 실행할 수 없으며, 앞으로 더욱 까다로워지는 전력 제약 조건에서 보다 빠른 응답과 더욱 정교한 기능에 대한 점점 더 엄격해지는 요구를 충족시킬 수 없을 것이다. 프로그래머블 MPSoC에 기반한 플랫폼은 15W 이상의 전력 레벨에서 더욱 뛰어난 성능 및 향상된 효율과 사이즈/중량의 이점 또한 제공할 수 있다.
이러한 구성 가능한 다중 병렬 컴퓨팅 아키텍처의 장점은 학술적 관심 분야에만 머물러왔고 개발자들이 자신의 프로젝트에 쉽게 적용할 수는 없었다. 성공은 개발들이 자신이 목표로 하는 추론 엔진의 구현을 최적화하는데 도움이 되는 적합한 툴에 달려 있다. 이러한 요구를 충족시키기 위해 자일링스는 개발 툴 및 머신 러닝 소프트웨어 스택 에코시스템을 지속적으로 확장하고, 컴퓨터 비전 및 비디오 감시와 같은 애플리케이션의 구현을 간소화하고 가속화하기 위해 이 분야의 전문 파트너사들과 협력하고 있다.

AR(클라우드)-2.jpg

미래를 위한 유연성

애플리케이션을 위한 최적의 플랫폼을 구축하기 위해 재구성이 가능한 SoC를 활용함으로써 AI 개발자는 신경망 네트워크 아키텍처의 급속한 발전에 부응할 수 있는 유연성을 확보할 수 있다. 업계가 새로운 유형의 신경망 네트워크로 이행하고자 함에 따라 플랫폼 개발자에게는 상당한 위험이 초래될 수 있다. 재구성이 가능한 MPSoC는 최신의 최첨단 전략을 사용하여 가장 효율적인 프로세싱 엔진을 구현할 수 있도록 재구성이 가능하기 때문에 신경망 네트워크의 설계 방식의 변화에 유연하게 대응할 수 있다.
AI는 산업 제어, 의료기기, 보안 시스템, 로보틱스, 자율주행 차량과 같은 장비에 점점 더 많이 탑재되고 있다. 프로그래머블 로직 패브릭 MPSoC 디바이스를 활용한 적응형 가속 기술은 경쟁우위를 유지하는데 필요한 첨단 기능을 즉각적으로 대응할 수 있는 핵심 대안이다.

leekh@seminet.co.kr
(끝)
<저작권자(c) 반도체네트워크, 무단 전재-재배포 금지>

X


PDF 다운로드

개인정보보호법 제15조에 의한 수집/이용 동의 규정과 관련하여 아래와 같이 PDF 다운로드를 위한 개인정보 수집 및 이용에 동의하십니까? 동의를 거부할 수 있으며, 동의 거부 시 다운로드 하실 수 없습니다.

이메일을 입력하면,
(1) 신규참여자 : 성명/전화번호/회사명/분야를 입력할 수 있는 입력란이 나타납니다.
(2) 기참여자 : 이메일 입력만으로 다운로드가 가능합니다.

×

회원 정보 수정