음성인식 및 처리 기술이 발전하고 웹 기술이 전화를 이용한 VUI(Voice User Interface)를 수용할 수 있게 됨에 따라 음성인식 및 처리 기술을 이용한 VUI 서비스를 웹 환경에서 제공하고자 하는 필요성이 대두되고 있다. 이러한 요구를 충족하기 위하여 마이크로소프트사에서는 스피치서버 2007 (Office Communications Server 2007 Speech Server) 시험버전을 발표하였다.
스피치서버 2007은 VoiceXML, SALT를 이용한 VUI 응용프로그램 개발을 지원하고 있다. 그리고 비주얼 스튜디오 2005에서 제공하고 있는 Workflow 개발 방법은 응용프로그램의 전체 흐름을 시각적으로 한 눈에 보면서 설계 및 구현이 가능하다. 또한 NET 비주얼 개발 환경에서 VUI용 컨트롤과 C등의 언어를 이용하여 VUI 응용프로그램을 개발 할 수 있다.
스피치서버 2007은 사용자가 발음한 음성을 인식하기 위한 음성인식엔진(Speech Recognition Engine)을 탑재하고 있으며 음성인식을 수행하기 위해 필요한 음성문법파일(Grammar File)을 필요로 한다. W3C에서는 음성인식을 수행할 때 필요한 문법을 위해 SRGS(Speech Recognition Grammar Specification) 표준화 작업을 진행하고 있다.
스피치서버 2007에서 사용되는 음성문법파일은 Grxml 파일이며 확장자로 .grxml을 갖는다. Grxml 파일은 텍스트 형태로 이루어진 XML 문서로써 비주얼 스튜디오의 Grammar Explorer를 이용하여 작성하거나 텍스트 편집기로 작성할 수 있다. Grxml 파일은 Grammar Explorer를 이용하여 작성하거나 텍스트 편집기로 작성해야 하기 때문에 음성인식문법 데이터의 추가, 수정, 삭제 시 개발자가 수동적으로 데이터를 관리해야만 하는 불편함이 있다.
따라서 본 논문에서는 스피치서버 2007의 워크플로우 개발방법으로 연구실 전화번호 안내 시스템을 VUI 응용프로그램으로 구현하고 W3C의 SRGS 기준을 따르는 음성문법파일 자동생성 프로그램을 개발하였다. 그리고 구현한 VUI 응용프로그램을 대상으로 자동생성한 음성문법파일을 실험한 결과 VUI 응용프로그램의 음성문법파일과 동일하게 처리되는 것을 확인하였다.