[연구]레이블 없이 훈련 가능한 그래프 신경망 모델 기술 개발


_images_000054_photo1.jpg_4.jpg

< (왼쪽부터) 우리 대학 산업및시스템공학과 박찬영 교수, 우리 대학 산업및시스템공학과 이남경 석사과정, 포항공과대학교 현동민 박사, 우리 대학 산업및시스템공학과 이준석 석사과정 >

최근 다양한 분야 (소셜 네트워크 분석추천시스템 등)에서 그래프 데이터 (그림 1) 의 중요성이 대두되고 있으며이에 따라 그래프 신경망(Graph Neural Network) 기술을 활용한 서비스가 급속히 증가하고 있다서비스 구축을 위해서는 심층 학습 모델을 훈련해야 하며이를 위해서는 충분한 훈련 데이터를 준비해야 한다특히 훈련 데이터에 정답지를 만드는 레이블링(labeling) 과정이 필요한데 (예를 들어소셜 네트워크의 특정 사용자에 `20'라는 레이블을 부여하는 행위), 이 과정은 일반적으로 수작업으로 진행되므로 노동력과 시간이 소요된다따라서 그래프 신경망 모델 훈련 시 데이터가 충분하지 않은 상황을 효과적으로 타개하는 방법의 필요성이 대두되고 있다.

&#44536;&#47548; 1. &#44536;&#47000;&#54532; &#45936;&#51060;&#53552; &#50696;&#49884;

< 그림 1. 그래프 데이터 예시 >

우리 대학 산업및시스템공학과 박찬영 교수 연구팀이 데이터의 레이블이 없는 상황에서도 높은 예측 정확도를 달성할 수 있는 새로운 그래프 신경망 모델 훈련 기술을 개발했다고 25일 밝혔다. 

정점의 레이블이 없는 상황에서 그래프 신경망 모델의 훈련은 데이터 증강을 통해 생성된 정점들의 공통된 특성을 학습하는 과정으로 볼 수 있다하지만 이러한 정점의 공통된 특성을 학습하는 과정에서기존 훈련 방법은 표상 공간에서 자신을 제외한 다른 정점들과의 유사도가 작아지도록 훈련을 한다하지만 그래프 데이터가 정점들 사이의 관계를 나타내는 데이터 구조라는 점을 고려했을 때이런 일차원적인 방법론은 정점 간의 관계를 정확히 반영하지 못하게 된다. 

박 교수팀이 개발한 기술은 그래프 신경망 모델에서 정점들 사이의 관계를 보존해 정점의 레이블이 없는 상황에서 모델을 훈련시켜 높은 예측 정확도를 달성할 수 있게 해준다.

KAIST 산업및시스템공학과 이남경 석사과정이 제저자현동민 박사이준석 석사과정 학생이 제2, 저자로 참여한 이번 연구는 최고권위 국제학술대회 `정보지식관리 콘퍼런스(CIKM) 2022'에서 올 10월 발표될 예정이다. (논문명Relational Self-Supervised Learning on Graphs) 

기존 연구에서는 정점의 레이블이 없는 상황에서 정점에 대한 표상을 훈련하기 위해 표상 공간 내에서 자기 자신을 제외한 다른 정점들과의 유사도가 작아지도록 훈련을 한다예를 들어서소셜 네트워크에 A, B, C 라는 사용자가 존재할 때, A, B와 C가 표상 공간에서 서로 간의 유사도가 모두 작아지도록 모델을 훈련하는 것이다이때 박 교수팀이 착안한 점은 그래프 데이터가 정점 간의 관계를 나타내는 데이터이므로 정점 간의 관계를 포착하도록 정점의 표상을 훈련할 필요가 있다는 점이었다.

&#44536;&#47548; 2. &#50672;&#44396;&#54016;&#50640;&#49436; &#44060;&#48156;&#54620; &#8220;&#44288;&#44228; &#48372;&#51316; &#54617;&#49845;&#8221; &#48169;&#48277;&#47200;. &#44592;&#51316; &#48169;&#48277;&#47200;&#44284; &#45804;&#47532; &#45936;&#51060;&#53552; &#51613;&#44053; &#44592;&#48277;&#51012; &#53685;&#54644; &#49373;&#49457;&#46108; &#46160; &#44060;&#51032; &#44536;&#47000;&#54532;&#47484; &#44592;&#48152;&#51004;&#47196; &#45432;&#46300;&#46308; &#49324;&#51060;&#51032; &#44288;&#44228;&#47484; &#48372;&#51316;&#54616;&#47732;&#49436; &#47784;&#45944;&#51060; &#54617;&#49845;&#46108;&#45796;. &#51060;&#47484; &#53685;&#54644; &#44536;&#47000;&#54532; &#45936;&#51060;&#53552;&#44032; &#45208;&#53440;&#45236;&#45716; &#44288;&#44228;&#47484; &#51096; &#54617;&#49845;&#54616;&#50668; &#50696;&#52769; &#51221;&#54869;&#46020;&#44032; &#54693;&#49345;&#46120;&#51012; &#45796;&#50577;&#54620; &#49892;&#54744;&#51012; &#53685;&#54644;&#49436; &#51077;&#51613;&#54616;&#50688;&#45796;.

< 그림 2. 연구팀에서 개발한 “관계 보존 학습” 방법론. 기존 방법론과 달리 데이터 증강 기법을 통해 생성된 두 개의 그래프를 기반으로 노드들 사이의 관계를 보존하면서 모델이 학습된다. 이를 통해 그래프 데이터가 나타내는 관계를 잘 학습하여 예측 정확도가 향상됨을 다양한 실험을 통해서 입증하였다. >

, A, B와 서로 간의 유사도가 모두 작아지게 하는 훈련 메커니즘과는 달리실제 그래프상에서는 이들이 연관이 있을 수 있다는 점이다따라서 A, B와 사이의 관계를 긍정/부정의 이진 분류를 통해 표상 공간에서 유사도가 작아지도록 훈련을 하는 것이 아닌이들의 관계를 정의해 그 관계를 보존하도록 학습하는 모델을 연구팀은 개발했다(그림 2). 연구팀은 정점 간의 관계를 기반으로 정점의 표상을 훈련함으로써기존 연구가 갖는 엄격한 규제들을 완화해 그래프 데이터를 더 유연하게 모델링했다.

&#44536;&#47548; 3. &#50672;&#44396;&#54016;&#51060; &#51228;&#50504;&#54616;&#45716; &#44288;&#44228; &#48372;&#51316; &#54617;&#49845; &#47784;&#45944;&#51032; &#44396;&#51312;

< 그림 3. 연구팀이 제안하는 관계 보존 학습 모델의 구조 >

연구팀은 이 학습 방법론을 `관계 보존 학습'이라고 명명했으며그래프 데이터 분석의 주요 문제(정점 분류간선 예측)에 적용했다(그림 3). 그 결과 최신 연구 방법론과 비교했을 때정점 분류 문제에서 최대 3% 예측 정확도를 향상했고간선 예측 문제에서 6%의 성능 향상다중 연결 네트워크 (Multiplex network)의 정점 분류 문제에서 3%의 성능 향상을 보였다. 

저자인 이남경 석사과정은 "이번 기술은 데이터의 레이블이 부재한 상황에서도 그래프 신경망을 학습할 수 있는 새로운 방법ˮ 이라면서 "그래프 기반의 데이터뿐만이 아닌 이미지 텍스트 음성 데이터 등에 폭넓게 적용될 수 있어심층 학습 전반적인 성능 개선에 기여할 수 있다ˮ고 밝혔다. 

연구팀을 지도한 박찬영 교수도 "이번 기술은 그래프 데이터상에 레이블이 부재한 상황에서 표상 학습 모델을 훈련하는 기존 모델들의 단점들을 `관계 보존`이라는 개념을 통해 보완해 새로운 학습 패러다임을 제시하여 학계에 큰 파급효과를 낼 수 있다ˮ라고 말했다.

한편이번 연구는 과학기술정보통신부 재원으로 정보통신기획평가원의 지원을 받아 사람중심인공지능핵심원천기술개발 과제로 개발한 연구성과 결과물(No. 2022-0-00157, 강건하고 공정하며 확장 가능한 데이터 중심의 연속 학습)이다.






\