KAIST “엔비디아 긴장시킬 ‘고용량·고성능 GPU’ 개발”

입력 : 2024-07-08 09:49:11

송현수 기자 songh@busan.com

부산닷컴 기사퍼가기

‘CXL’ 활성화된 고용량 CXL-GPU의 메모리 읽기·쓰기 성능 최적화
기존 GPU 메모리 확장기술보다 2.36배 빠른 대규모 AI서비스 실행
파네시아, 초고속 CXL 컨트롤러 활용 ‘CXL-GPU 프로토타입’ 제작·지원
정명수 교수 “대규모 AI 학습·추론 시스템 구축 비용 획기적 감소 예상"

(왼쪽 위부터 시계 방향으로) 전기및전자공학부 김동평 석사과정, 유어진 석사과정, 이상원 박사, 국동현 박사과정, 정명수 교수, 강승관 박사과정, 장준혁 박사과정, 배한여름 박사과정. KAIST 제공

국내 연구진이 현재 인공지능(AI) 가속기 시장을 독점하고 있는 엔비디아(NVIDIA)에 맞설 수 있는 차세대 인터페이스 기술이 활성화된 고용량·고성능 AI 가속기를 개발했다.

한국과학기술원(KAIST)은 전기및전자공학부 정명수 교수 연구팀(컴퓨터 아키텍처 및 메모리 시스템 연구실)이 차세대 인터페이스 기술인 CXL(Compute Express Link)이 활성화된 고용량 GPU 장치의 메모리 읽기/쓰기 성능을 최적화하는 기술을 개발했다고 8일 밝혔다.

CXL-GPU 대표 그림. KAIST 제공

제안하는 CXL-GPU의 구조. KAIST 제공

최신 GPU의 내부 메모리 용량은 수십 기가바이트(GB, 10^9 바이트)에 불과해 단일 GPU만으로는 모델을 추론·학습하는 것이 불가능하다. 대규모 AI 모델이 요구하는 메모리 용량을 제공하기 위해 업계에서는 일반적으로 GPU 여러 대를 연결하는 방식을 채택하지만, 이 방법은 최신 GPU의 높은 가격으로 인해 총소유비용(TCO)을 과도하게 높이는 문제를 일으킨다.

이에 차세대 연결 기술인 CXL을 활용해 대용량 메모리를 GPU 장치에 직접 연결하는‘CXL-GPU’구조 기술이 다양한 산업계에서 활발히 검토되고 있다. 하지만 CXL-GPU의 고용량 특징만으로는 실제 AI 서비스에 활용되기 어렵다. 대규모 AI 서비스는 빠른 추론·학습 성능을 요구하기 때문에 GPU에 직접적으로 연결된 메모리 확장 장치로의 메모리 읽기/성능이 기존 GPU의 로컬 메모리에 준하는 성능이 보장될 때 비로소 실제 서비스에 활용될 수 있다.

CXL-GPU의 하드웨어 프로토타입. KAIST 제공

CXL-GPU 실행 시간 평가 결과. KAIST 제공

KAIST 연구진은 CXL-GPU 장치의 메모리 읽기/쓰기 성능이 저하되는 원인을 분석해 이를 개선하는 기술을 개발했다. 메모리 확장 장치가 메모리 쓰기 타이밍을 스스로 결정할 수 있는 기술을 개발해 GPU 장치가 메모리 확장 장치에 메모리 쓰기를 요청하면서 동시에 GPU 로컬 메모리에도 쓰기를 수행토록 설계했다. 즉, 메모리 확장 장치가 내부 작업을 수행 상태에 따라 작업을 하도록 함으로써 GPU는 메모리 쓰기 작업의 완료 여부가 확인될 때까지 기다릴 필요가 없어 쓰기 성능 저하 문제를 해결할 수 있도록 했다.

또한 연구진은 메모리 확장 장치가 사전에 메모리 읽기를 수행할 수 있도록 GPU 장치 측에서 미리 힌트를 주는 기술을 개발했다. 이 기술을 활용하면 메모리 확장 장치가 메모리 읽기를 더 빨리 시작하게 되어, GPU 장치가 실제 데이터를 필요로 할 때는 캐시(작지만 빠른 임시 데이터 저장공간)에서 데이터를 읽어 더욱 빠른 메모리 읽기 성능을 달성할 수 있다.

이번 연구는 반도체 팹리스 스타트업인 파네시아(Panmnesia)의 초고속 CXL 컨트롤러와 CXL-GPU 프로토타입을 활용해 진행됐다. 연구팀은 파네시아의 CXL-GPU 프로토타입을 활용한 기술 실효성 검증을 통해 기존 GPU 메모리 확장기술보다 2.36배 빠르게 AI 서비스를 실행할 수 있음을 확인했다. 해당 연구는 이달 산타클라라 USENIX 연합 학회와 핫스토리지의 연구 발표장에서 결과를 선보인다.

정명수 교수는 “CXL-GPU의 시장 개화 시기를 가속해 대규모 AI 서비스를 운영하는 빅테크 기업의 메모리 확장 비용을 획기적으로 낮추는 데 기여할 수 있을 것”이라 말했다.

송현수 기자 songh@busan.com

당신을 위한 추천 기사

▶ 디지털 뉴스콘텐츠 이용규칙

실시간 핫뉴스

당신을 위한 PICK

오늘의 추천 뉴스

[48789] 부산시 동구 중앙대로 365 (수정동) ｜ 전화번호 : 051)461-4114 ｜ 이메일 : webmaster@busan.com
등록번호 : 부산아00091 ｜ 등록일자 : 2011년 5월24일 ｜ 발행·편집 겸 인쇄인 : 손영신 ｜ 청소년보호책임자 : 전대식
모든 콘텐츠를 커뮤니티, 카페, 블로그 등에서 무단 사용하는것은 저작권법에 저촉되며, 법적 제재를 받을 수 있습니다.
COPYRIGHT (C) 부산일보사 ALL RIGHTS RESERVED.

사회

정치

경제해양

문화

라이프

스포츠

오피니언

경남울산

사람들

펫플스토리

펀부산

가장 많이 본 뉴스

당신을 위한 추천 기사

실시간 핫뉴스

당신을 위한 PICK

오늘의 추천 뉴스