연구개발
- KAIST총동문회
- 2025-06-10
- 조회수 35
우리 대학 전산학부 여경민 학부과정 학생과 김재훈 박사과정 학생이 성민혁 교수(Visual AI Group) 지도를 받아 공동으로 개발한 새로운 이미지 생성 기술 ‘StochSync’가 세계 최고 수준의 인공지능(AI) 국제 학술대회 ‘ICLR 2025(International Conference on Learning Representations)’에서 채택돼 발표됐다.

ICLR은 딥러닝 및 인공지능 분야에서 가장 영향력 있는 학술대회 중 하나로, 전 세계 AI 연구자들이 최신 기술과 성과를 공유하는 대표 행사다. 특히 학부생이 제1저자로 주요 학회에 논문을 발표하는 것은 드문 사례로, 이번 성과는 KAIST의 우수한 연구 역량과 인재 양성 시스템을 다시 한번 입증했다.
StochSync는 사전 훈련된 AI 모델을 활용해 기존 평면 이미지를 넘어, 360도 파노라마나 3D 물체 표면의 텍스처처럼 복잡한 형태의 이미지를 별도의 추가 학습 없이도 간편하게 생성할 수 있는 기술이다. 기존에는 이러한 복잡한 이미지 생성을 위해 많은 훈련 데이터나 복잡한 전처리 과정이 필요했으나, StochSync는 이를 대폭 간소화하고 동시에 고품질 결과를 구현했다.
예를 들어 자동차 내부 디자인이나 가구 표면 텍스처 등을 실제 제작에 앞서 사실감 있게 시뮬레이션할 수 있어, 제품 설계 초기 단계에서 빠르고 효율적인 디자인 검토가 가능하다. 해당 기술은 VR, 게임, 산업 디자인 등 다양한 분야에 폭넓게 응용될 수 있다.
StochSync의 가장 큰 특징은 정교한 이미지 디테일과 시점 간 일관성을 동시에 확보할 수 있다는 점이다. 기존 이미지 생성 모델들은 고해상도 디테일과 여러 시점 간의 일관성을 동시에 만족시키기 어려웠으나, StochSync는 서로 다른 원리에 기반한 두 기법을 융합한 새로운 방법론을 제시함으로써 이 문제를 해결했다.
이번 연구의 제1저자인 여경민 학생은 2023년 겨울부터 KAIST Visual AI Group 인턴으로 연구에 참여해 왔으며, 김재훈 박사과정 학생과 협업해 실험 설계, 분석, 논문 작성 전반을 주도했다. 여 학생은 “연구 과정에서 여러 기술적 난관을 극복하며 AI 기술의 실제 활용 가능성을 확인할 수 있었다”며 “앞으로 다양한 산업 분야에 적용될 수 있기를 기대한다”고 소감을 밝혔다.
여경민 학생은 이번 ICLR 2025 발표 외에도 2024년 열린 국제 머신러닝 학술대회 NeurIPS 2024에서 논문 두 편의 공저자로 참여하고, 포스터 발표를 진행하는 등 학부생으로서는 드문 연구 성과를 이어가고 있다.
ICLR 2025 컨퍼런스는 지난 4월 싱가포르에서 개최되었으며, 여경민 학생은 포스터 및 워크숍 세션을 통해 세계 각국 연구자들과 활발한 학술 교류를 진행했고, 많은 호응을 얻었다.
전산학부 관계자는 “학부생이 세계 최고 수준의 학회에서 주요 성과를 발표한 것은 매우 고무적인 일”이라며 “앞으로도 세계를 선도하는 AI 인재 양성과 연구 역량 강화에 최선을 다할 것”이라고 밝혔다.
해당 논문과 프로젝트에 대한 자세한 정보는 아래 링크에서 확인할 수 있다.
논문 링크: https://arxiv.org/abs/2501.15445 프로젝트 웹사이트: https://stochsync.github.io