전자공학과 박형민 교수 연구팀,
세계 최우수 인공지능 학회 ‘NeurIPS 2024’ 논문 채택
▲(왼쪽부터) 전자공학과 신의협 박사과정, 이상윤 석사과정, 김태한 석사과정, 박형민 교수
전자공학과 지능정보처리 연구실 연구팀(지도교수 박형민)이 최우수 인공지능 학회인 ‘Neural Information Processing Systems, NeurIPS 2024’에서 논문을 발표하게 되었다.
전자공학과의 신의협 박사과정의 주도하에 이상윤, 김태한 석사과정이 함께 연구를 진행하였으며, 논문 제목은 “Separate and Reconstruct: Asymmetric Encoder-Decoder for Speech Separation”으로 해당 연구를 통해서 여러 화자가 동시에 발화하는 혼합 음성에서 개별 화자의 음성을 분리하는 새로운 딥러닝 네트워크 구조를 설계하였다.
음성 분리(Speech Separation)는 여러 화자의 음성이 섞인 오디오에서 개별 화자의 음성을 분리해내는 과제이다. 이를 위해서 역할이 구분 되는 분리 인코더 – 재구성 디코더의 비대칭 네트워크를 설계하였다.
<분리 인코더 – 재구성 디코더의 비대칭 네트워크를 제안한 SepReformer 네트워크 구조>
연구팀은 기존 음성 분리 분야에서 사용되고 있는 딥러닝 네트워크의 설계에서 실제 음원의 분리가 네트워크의 가장 후반부에서 진행되는 것의 한계점을 고려하여 모델을 디자인하였다.
한편 NeurIPS는 인공지능(AI) 및 기계 학습 분야에서 가장 권위 있는 국제 학회 중 하나로, 매년 전 세계의 연구자와 기업들이 참여하여 최신 연구 성과와 혁신 기술이 발표되고 논의되는 자리이다. GAN, AlphaGo, Transformer, Diffusion 등 인공지능에 큰 영향을 끼친 기술이 해당 학회에서 발표되었다. NeurIPS 2024는 오는 2024년 12월 9~15일 캐나다 벤쿠버에서 개최된다.
▶ 논문제목: Separate and Reconstruct: Asymmetric Encoder-Decoder for Speech Separation
▶ 저자 정보: 신의협(제 1저자), 이상윤(제 2저자), 김태한(제 3저자), 박형민 교수(교신저자, 서강대)
▶ 데모 페이지: https://fordemopage.github.io/SepReformer/