INFORMATION
탐색 건너뛰기 링크입니다.
RESEARCH
Y.J.KIM,  Dept. of  Computer Engineering, Hanbat National University
   Domestic Conference
 화자의 수가 주어진 오디오의 화자별 발화구간 추출을 위한 Baum-Welch, Viterbi알고리즘기반의 비지도 학습방법
Unsupervised Learning Method Based on Baum-Welch, Viterbi Algorithm for Speaker Diarization of Audio Given Number of Speakers
   유연국,김윤중
 

화자들의 발화구간을 추출하는 시스템은 “누가 언제 말하는가?” 에 대한 답을 구하는 시스템이다. 본 논문에서는 화자의 수가 주어진 오디오의 화자별 발화구간을 추출하기 위해서 주어진 오디오를 1 초단위로 나눈 후, 나누어진 조각오디오의 MFCC 로 HMM 화자모델을 구성한다. 그리고 Viterbi 알고리즘으로 각 조각오디오들의 훈련대상을 갱신하고 Baum-Welch 알고리즘을 이용하여 화자모델을 훈련하는 과정을 반복하여 각 화자들의 발화구간을 찾아내는 방법을 제안한다. 실험을 통해서 평균 79.95%의 인식률을 확인하고, 성능 향상을 위해 잡음 제거의 필요성을 확인하였다

 
한국통신학회한국통신학회 학술대회논문집2017년도 한국통신학회 추계종합학술발표회 논문집2017.11 PP.187 - 188  
  2017-11-11/2020-08-05/김윤중