업비트 머신러닝팀, 국제정보검색학회서 개인화 뉴스 추천 연구논문 발표

이정훈 기자 leejnghun@busan.com
부산닷컴 기사퍼가기

세계 최고 권위 정보검색학회 ‘SIGIR 2025’서 공개

두나무 박충원 머신러닝팀 연구원이 지난 14일(현지 시각) 아털라어 파도바 센트로 콩그레스에서 열린 ’SIGIR 2025’에서 포스터 발표를 하고 있다. 두나무 제공 두나무 박충원 머신러닝팀 연구원이 지난 14일(현지 시각) 아털라어 파도바 센트로 콩그레스에서 열린 ’SIGIR 2025’에서 포스터 발표를 하고 있다. 두나무 제공

가상자산거래소 업비트 운영사 두나무는 자사 머신러닝(ML)팀의 개인화 뉴스 추천 연구논문이 세계 최고 수준 정보검색학회 ‘SIGIR 2025’에 채택되고, 메인 콘퍼런스에서 발표했다고 17일 밝혔다.

SIGIR은 정보검색 분야에서 가장 영향력 있는 국제 학회다. 올해 제출된 논문의 약 27%만이 채택됐다. 올해 SIGIR의 메인 콘퍼런스는 지난 13~18일(현지 시각) 이탈리아 파도바 센트로 콩그레스에서 열렸다. 두나무 박충원 머신러닝팀 연구원은 지난 14일 현장에서 두나무가 개발한 개인화 뉴스 추천 시스템 연구 성과를 직접 발표했다.

이번 발표 논문 제목은 ‘대규모 언어 모델(LLM) 기반 사용자 시뮬레이터: 실제 사용자 상호작용 없이 뉴스 추천 모델을 학습하기 위한 방법론’이다. 해당 논문은 실제 사용자 데이터 없이 LLM으로 가상의 이용자를 생성해 학습 데이터를 만들고, 이를 바탕으로 뉴스를 추천하는 방안에 대해 다뤘다. 기존 뉴스 추천 시스템에 필요했던 이용자 로그에 대한 의존도를 대폭 해소했다는 점이 특징이다.

기존 뉴스 추천 방식은 머신러닝 모델의 학습을 위해 클릭 로그나 뉴스 선호도 등의 사용자 데이터를 수집해야 했다. 이는 대규모 데이터 확보의 어려움과 개인정보 침해 우려 문제가 존재했다. 두나무 머신러닝팀은 이를 해결하기 위해 가상의 사용자를 시뮬레이션하는 ‘LAUS’라는 프레임워크를 개발해 새로운 대안을 제시했다고 강조했다.

LAUS는 실제 사용자 데이터 대신 가상의 사용자를 생성해 다양한 상호작용 패턴을 만들어 학습 데이터를 만드는 방식이다. 이번 연구 결과 LAUS는 기존 학습 데이터 없이도 뉴스를 추천하는 ‘제로샷(zero-shot)’ 방식보다 높은 성과를 보였다는 게 회사 측 설명이다. 동시에 지연 시간도 짧게 유지하는 것으로 검증됐다.

두나무는 노르웨이어, 영어 등 다양한 언어권의 뉴스 추천 시스템 비교평가(벤치마크)에서 실제 사용자 데이터로 학습된 모델과 유사한 수준의 성능을 보였다고 전했다. 이를 통해 방대한 데이터를 별도로 수집하지 않아도 고품질 개인화 서비스를 빠르게 구축할 수 있는 가능성이 확인됐다.

박 연구원은 “개인화 뉴스 추천 시스템 품질은 이용자가 원하는 정보를 얼마나 정확히 제공하는가와 직결돼 서비스 만족도를 높이는 핵심 요소”라며 “이번 연구를 통해 고객 정보 보호와 운영 효율성을 모두 충족하면서 더욱 정교한 추천 서비스를 제공할 수 있는 기반을 마련하게 돼 기쁘다”고 말했다.

한편, 두나무 머신러닝팀은 주식과 디지털 자산 시장에서 활용되는 인공지능(AI) 모델을 연구·개발 중이다. 지난해 11월 ‘콜링2025’에서 금융 허위 정보 탐지 챌린지(FMD) 1위를 차지하는 등 세계적 연구 역량을 인정받고 있다.


이정훈 기자 leejnghun@busan.com

당신을 위한 AI 추천 기사

    당신을 위한 뉴스레터