INFORMATION
탐색 건너뛰기 링크입니다.
RESEARCH
Y.J.KIM,  Dept. of  Computer Engineering, Hanbat National University
   Phd Dissertation
 Voice Browser를 위한 Dialog Script Generator의 자동 생성에 대한 연구
A Study on the Automatic Generationo of Dialog Script Generator for the Voice Browser
   오지영
Jee-Young Oh
 

웹 기술과 전화를 이용하는 IVR(Interactive Voice Response) 기술이 발전하면서 웹상에서 IVR을 이용하고 저 하는 필요성이 대두되었다. 이러한 필요에 따라 음성브라우저(Voice Browser)가 등장하게 되었다.
음성브라우저는 기존의 웹브라우저에 부가적으로 음성 사용자 인터페이스(VUI, Voice User Interface)를 지원하는 웹브라우저이다. W3C(World Wide Web)에서는 음성브라우저를 위하여 워킹그룹(Working Group)을 설립하고 음성 인터페이스 프레임워크(SIF, Speech Interface Framework)를 제안하였다.
SlF는 음성입력, 음성출력 및 대화진행기(Dialog Manager)로 구성되며 대화진행기는 응용프로그램을 위하여 미리 준비된 대화기술(Dialog Script)의 내용에 따라 대화를 진행시킨다. 즉 필요한 메시지를 출력하고 응답을 인식하며 다음의 할 일을 결정한다. 입력된 응답에 따라 새로운 응용 서비스를 활성화하거나 다른 대화기술을 다운로드하거나 사용자에게 필요한 메시지를 출력하게 한다.
대화진행기는 웹페이지에 VoiceXML의 언어로 기술된 대화기술에 따라 음성구동 응용프로그램을 진행시킨다. 그러나 기존의 웹페이지는 대화진행으로 처리하기에 적합한 내용도 시각적 인터페이스로 만들어져 왔다. 이와 같은 웹페이지는 대화요소를 포함하고 있으며 VUI 방식으로 처리 될 수 있는 잠재성을 가지고 있는 것을 의미한다. 그러므로 이 대화요소를 자동으로 추출하여 대화기술로 만들 수 있다면 기존의 웹페이지도 VUI 방식으로 처리가 가능해진다.
따라서 본 연구에서는 시각용으로 제작된 웹페이지에서 대화요소를 추출해내고 대화기술로 자동 변환하는 대화기술생성기(Dialog Script Cene.ator)를 개발하였다. 대화기술생성기는 시각용으로 제작된 웹페이지로부터 대화요소를 추출하는 대화요소추출 기능, 추출 결과를 VoiceXML로 기술하여 대화기술로 변환하는 기능, 이 대화기술을 웹페이지에 추가하여 음성대화용 웹페이지를 생성하는 기능으로 구성된다.
본 연구에서 개발된 대화기술생성기의 기능을 확인하기 위하여 상용 웹페이지를 대상으로 실험을 수행하여 정의 된 방법에 따라 대화기술이 생성되고 대화진행기에 의하여 처리되는 것을 확인하였다.

The web technology and telephony IVR(Interactive Voice Response) technology have been developed respectively and attempted to be converged to a voice browser.
The voice browser is a web browser that presents an interactive voice user interface(VUI) to a user and provides an interface as a web browser works with HTML pages. W3C(World Wide Web) established a voice browser work group in 1999 and recommended a speech interface framework(SIF) for a voice browser.
The SIF consists of there groups such as a speech-input-component group, a speech-output-component group, and a dialog manager, A dialog manager manages the process of dialog according to a dialog script specified using voiceXML for a speech-enabled application. A dialog manager prompts the user for input, makes sense of the input, and determines what to do next according to instructions in a dialog script. Depending upon the input received, the dialog manager may invoke application services, or download another dialog script from the web, or cause information to be presented to the user.
A dialog manager is designed to be able to handle a web page which contains a dialog script for a speech-enabled application. However, there must be a lot of web pages that have some potentialities being used for speech-enabled application even though they have been constructed for the purpose of visual usage. If we extracts dialog components out of a visual web page and automatically produces a dialog script, then, theweb page can be handled using the VUI approach.
In this pager, we developed a dialog script generator including modules as follows : 1) extracts dialog components from a visual webpage. 2) produces dialog script specified using VoiceXML from the extracted dialog components. 3) generates speech-enabled web page that contains the dialog script.
We have done some experiments to confirm the performance of this dialog script generator. As the result of experiments for a visual webpage, we found that the dialog script generator correctly produces dialog script out of the visual web page and manages the process of dialog according to the dialog script.

 

 
오지영, 한밭대학교 정보통신전문대학원 컴퓨터공학과 박사논문 (2008.8)  
  2008-08-01/2019-12-24/김윤중