화자들의 발화구간을 추출하는 시스템은 “누가 언제 말하는가?” 에 대한 답을 구하는 시스템이다. 본 논문에서는 화자의 수가 주어진 오디오의 화자별 발화구간을 추출하기 위해서 주어진 오디오를 1 초단위로 나눈 후, 나누어진 조각오디오의 MFCC 로 HMM 화자모델을 구성한다. 그리고 Viterbi 알고리즘으로 각 조각오디오들의 훈련대상을 갱신하고 Baum-Welch 알고리즘을 이용하여 화자모델을 훈련하는 과정을 반복하여 각 화자들의 발화구간을 찾아내는 방법을 제안한다. 실험을 통해서 평균 79.95%의 인식률을 확인하고, 성능 향상을 위해 잡음 제거의 필요성을 확인하였다