KR0153642B1 - 문자-음성변환 서비스 장치 및 그 제어 방법 - Google Patents

문자-음성변환 서비스 장치 및 그 제어 방법

Info

Publication number
KR0153642B1
KR0153642B1 KR1019950055898A KR19950055898A KR0153642B1 KR 0153642 B1 KR0153642 B1 KR 0153642B1 KR 1019950055898 A KR1019950055898 A KR 1019950055898A KR 19950055898 A KR19950055898 A KR 19950055898A KR 0153642 B1 KR0153642 B1 KR 0153642B1
Authority
KR
South Korea
Prior art keywords
data
synthesis
unit
voice
information
Prior art date
Application number
KR1019950055898A
Other languages
English (en)
Other versions
KR970056695A (ko
Inventor
이승훈
강동규
정유현
김대웅
Original Assignee
양승택
한국전자통신연구원
이준
한국전기통신공사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 양승택, 한국전자통신연구원, 이준, 한국전기통신공사 filed Critical 양승택
Priority to KR1019950055898A priority Critical patent/KR0153642B1/ko
Publication of KR970056695A publication Critical patent/KR970056695A/ko
Application granted granted Critical
Publication of KR0153642B1 publication Critical patent/KR0153642B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/0024Services and arrangements where telephone services are combined with data services
    • H04M7/0036Services and arrangements where telephone services are combined with data services where the data service is an information service
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/39Electronic components, circuits, software, systems or apparatus used in telephone systems using speech synthesis

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 정보제공자들에게 접속하여 전자식전화기 가입자들에게 문자도된 메뉴와 정보를 음성으로 변환하여 전화기를 통해서 합성된 음성으로 들려주는 문자-음성변환 서비스 장치 및 그 제어 방법에 관한 것으로, 외부의 전화망접속부(1)에 접속되는 가입자접속수단(10), 상기 가입자접속수단(10)에 접속되는 중앙처리수단(20), 상기 중앙처리수단(20)과 외부의 패킷망접속부(3) 사이에 접속되는 데이터처리수단(30)을 구비하는 것을 특징으로 하는 문자-음성변환 서비스 장치와, 이에 적용되는 문자-음성변환 서비스 제어 방법에 있어서, 상기 가입자접속수단(10)으로 부너 호가 발생하면 중앙처리수단(20)이 상기 패킷망접속부(3)를 통해 정보제공자와 접속하여 데이터를 수신하는 제1단계; 상기 수신한 데이터를 분석하여 현재 상태가 서비스 해제가 아니면 메뉴를 선택하는 단계인가를 분석하는 제2단계; 상기 메뉴선택단계 여부에 따라 메뉴 데이터를 수신하고 합성음를 생성하거나 자료정보를 검출하여 해당하는 합성음을 생성, 전송하는 제3단계; 및 사용자가 누른 DTMF 신호를 수신하여 데이터처리수단(30)을 통해 정보제공자에게 다음 상태로 넘어가기 위한 명령을 전송하는 제4단계를 포함하는 것을 특징으로 하는 문자-음성변환 서비스 제어 방법은 문자를 음성으로 변환하여 이용자들에게 음서의 형태로 정보를 제공할 수 있는 효과가 있다.

Description

문자-음성변환 서비스 장치 및 그 제어 방법
제1도는 본 발병이 적용된 통신망 시스템의 전체적인 구성도.
제2도는 본 발명에 따른 문자-음성변환 서비스장치의 하드웨어 구성도.
제3도는 본 발명에 따른 문자- 음성변환 서비스장치의 전체적인 소프트웨어 구성도.
제4도는 본 발명에 따른 음성합성파라미터의 구조도.
제5도는 본 발명에 따른 음성합성 처리 흐름도.
제6도는 본 발명에 따른 문자-음성변환 서비스의 전체적인 제어 흐름도.
* 도면의 주요 부분에 대한 부호의 설명
1 : 전화망접속블럭 2 : 문자-음성변환블럭
3 : 패킷망접속블럭 10 : 가입자접속부
20 : 중앙처리부 30 : 데이타처리부
40 : 음성합성부
본 발명은 하이텔과 같은 정보제공자들에게 접속하여 전자식전화기 가입자들에게 문자로된 메뉴와 정보를 음성으로 변환하여 전화기룰 통해서 합성된 음성으로 들려주는 문자-음성변환 서비스 장치 및 그제어 방법에 관한 것이다.
현재 사용중인 음성서비스는 주로 제공하고자 하는 정보를 음성으로 녹음하여 디지탈로 저장한 뒤 사용자가 원하는 정보는 다시 아날로그로 변환하여 재생하는 방식을 취하고 있다. 이 방식은 녹음장비, 아날로그/디지탈 변환장비 등이 있어야만이 정보제공시스템이 정보를 입력할수 있으므로, 누구나 손쉽게 어디에서나 원하는 정보를 제공하기가 어려운 문제점이 있었다.
본 발명은 상기와 같은 종래기술의 문제점을 해결하기 위하여 안출된 것으로, 누구나 글자를 입력할 수 있는 장비만 있으면 정보제공이 가능할 수 있도록 많은 사람들이 사용하는 컴퓨터나 단말기를 통하여 정보제공시스템에 정보를 문자형태로 입력하면 이 문자를 음성으로 변환하여 이용자들에게 음성의 형태로 정보를 제공하는 문자-음성변환 서비스 장치 및 그 제어 방법을 제공함에 그 목적이 있다.
상기 목적을 달성하기 위하여 안출된 본 발명의 문자-음성변환 서비스 장치는, 일반 전화 가입자를 수용하는 공중 전화망에 접속되는 전화망접속부, 정보 제공자를 수용하는 공중 데이터망 사이에 접속되는 패킷망접속부로 이루어지는 통신망 시스템에 적용되는 문자-음성변환 서비스 장치에 있어서, 링신호 및 후크온 신호를 감지하여 후크온 신호를 상기 전화망접속부로 보내 호절단울 요구하고, 합성된 아날로그 음성을 PCM(Pulse Code Modulation) 신호로 변환하여 상기 전화망접속부로 전송하는 가입자접속수단; 전반적인 시스템의 동작을 제어하는 것으로, 상기 가입자접속수단에 합성된 음성을 제공하는 음성합성기능을 실시간으로 수행하기 위해 고속의 디바이스와 멀티태스킹 OS(Operating System)가 동작할 수 있도록 구성된 중앙처리수단; 상기 중앙처리수단과 패킷망접속부 사아에 접속되어 외부와의 데이터 입출력을 담당하는 데이터처리수단; 및 음성합성부는 문자를 음성으로 변환하는 것으로, 상기 중앙처리수단의 제어에 따라 디지탈 음성을 합성하여 가입자접속수단으로 전송되도록 하는 음성합성수단을 구비하는 것을 특징으로 한다.
또한, 문자-음성변환 서비스 제어 방법은, 상기 문자-음성변환 서비스 장치에 적용되는 문자-음성변환 서비스 제어 방법에 있어서, 상기 가입자접속수단으로부터 호가 발생하면 중앙처리수단이 상기 패킷망접속부를 통해 정보제공자와 접속하여 데이터를 수신하는 제1단계 ; 상기 수신한 데이터를 분석하여 현재 상태가 서비스 해제가 아니면 메뉴를 선택하는 단계인가를 분석하는 제2단계; 상기 메뉴 선택단계 여부에 따라 메뉴 데이터를 수신하고 합성음을 생성하거나 자료정보를 검출하여 해당하는 합성음을 생성, 전송하는 제3단계; 및 사용자가 누른 DTMF 신호를 수신하여 데이터처리수단를 통해 정보제공자에게 다음상태로 넘어가기 위한 명령을 전송하는 제4단계를 포함하는 것을 특징으로 한다.
즉, 상기한 구성으로 된 본 발명에 의하면 수많은 정보를 손쉽고, 신속하게 서비스 할 수 있으며, 정보제고 데이터베이스도 음성데이타가 아닌 텍스트파일 형태의 문자로 구성하므로 사용하는 저장매체의 사이즈도 작아진다는 장점이 있다.
한편, 본 발명의 서비스 영역으로는 국내에 있는 여러 정보제공자들 중에서 하이텔과 연결하여 문자-음성변환을 하도록 시험하고 있다. 하이텔은 일반 전화망을 통해서 접속되고 있는 가장 보편적인 정보통신 서비스로서 사용자들은 뉴스, 기상, 증권정보, 문화/생활, 동호회모임 등 수많은 정보를 얻고 공유할수 있다. 물론 본 장치의 서비스 영역은 하이텔로만 국한되는 것은 아니고,부가가치통신망 사업자이면 누구나 서비스 가능하다.
이하, 첨부된 도면을 참조하여 본 발명의 일 실시예를 상세히 설명한다.
제1도는 본 발명이 적용된 통신망 시스템의 전체적인 구성도로서, 일반 전화 가입자를 수용하는 공중 전화망에 접속되는 전화망접속블럭(1), 상기 전화망접속블럭(1)에 접속되는 본 발명의 문자-음성변환블럭(2), 상기 문자-음성변환블럭(2)과 정보 제공자를 수용하는 공중 데이타망 사이에 접속되는 패킷망접속블럭(3)으로 구성되어 있다.
도면에 도시된 바와 같이 상기 전화망접속블럭(1)은 일반전자식전화기를 가진 사용자들의 전화기 인터페이스를 담당하는 부분으로서, 전자교환기와의 접속 등을 수행하며 전화가 걸려올때마다 채널을 할달하여 문자-음성변환블럭(2)과 연결시키는 기능을 가지고 있다.
문자-음성변환블럭(2)는 본 발명이 적용되는 부분으로서, 상기 전화망접속블럭(1)과 접속하여 접속신호들을 주고 받는 기능, 음성합성알고리즘을 구동하여 문자를 음성으로 변환하는 기능, 패킷망접속블럭(3)을 통해 정보제공자와 데이타를 주고받는 기능으로 구성되어 있다.
패킷망접속블럭(3)은 공중데이타망을 통하여 정보테이타베이스를 연결시키는 X.25 설정 및 연결과 해제를 수행하면서 문자-음성변환블럭(2)과 정보제공자를 연결시켜준다.
제2도는 본 발명에 따른 문자-음성변환 서비스장치의 하드웨어 구성도로서, 가입자 접속부(10), 중앙처리부(20), 데이터처리부(30), 음성합성부(40)으로 나누어져 있다.
가입자접속부(10)는 PCM(Pulse Code Modulation) 신호변환을 위한 코덱, 접속채널을 설정하는 채널 셀렉터 및 DTME(Dual Tone Multifrequency) 신호를 감지하여 8비트로 변환하는 DTMF 변환기로 구성되어 있으며, 기능들을 다음과 같다.
첫째, 링신호 및 후크온 신호를 감지하여 후크온 신호를 전화망접속블럭(1)으로 보내 호절단을 요구기능, 둘째, 합성된 아날로그 음성을 PCM(2.048MHz)신호로 변환하여 전화망접속블럭(1)으로 전송기능, 셋째, 전화접속채널 설정기능, 넷째, DTMF 신호 변환기능이 있다.
중앙처리부(20)는 중앙처리장치(CPU), 부동소수점 처리장치(FPU:Floating point Processing Unit), 메모리소자(ROM, SRAM, DRAM, DPRAM), 및 디바이스 제어기로 구성되어 있으며, 전체 하드웨어를 감시하고 시스템 프로그램 및 응용프로그램이 동작하는 부분이다. 특히 음성합성기능을 실시간으로 수행하기 위해 고속의 디바이스와 멀티태스킹 OS(Operating System)가 동작할 수 있도록 구성하였다.
그 구성을 자세히 설명하면, MC68030 CPU(33MHz), MC68882, FPU(33MHz), 1M바이트 ROM, 2M바이트 SRAM, 16M바이트 DRAM, 4K워드 DPRAM, 및 디바이스 제어기로 구성되어 있다.
ROM에는 시스템제어기능이, SRAM에는 빠른 속도의 실행을 필요로하는 음성합성프로그램이, DRAM에는 대용량의 메모리를 요구하는 합성데이타베이스가 탑재되며, DPRAM은 음성합성부(40)와 데이터를 주고받기 위해서 사용된다.
데이터처리부(30)는 시리얼 입출력, 이더넷 입출력으로 구성되어 있으며, 중앙처리부(20)와 외부화의 데이타 입출력을 담당한다. 시리얼입출력은 MC68901 MFP, Z8530 SCC를 사용하여 3개의 입출력 포트를 구현하였으며 패킷망접속블럭(3)과 데이타를 주고 받는데 사용된다. 즉, 전화가입자가 누른 DTMF신호는 8비트 데이타로 변환되어 시리얼입출력을 통해 패킷방접속블럭(3)으로 전송되며, 정보제공자로 부터 전송되는 데이타는 다시 패킷망접속블럭(3)과 연결된 데이타처리부(30)을 통해 중앙처리부(20)로 전송된다.
그리고, AM7990 렌스(LANCE)로 구성된 이더넷 입출력은 시스템의 디버깅 및 14M바이트 정도의 용량을 가진 합성데이타베이스 및 응용프로그램의 다운로딩에 사용된다.
음성합성부(40)는 문자를 음성으로 변환하는 부분으로서, TMS320C30 DSP(Digital Signal Processor)(33MHz), 2M바이트 SRAM, 16K바이트 ROM, TLS320C46 AIC, 및 디바이스 제어기로 구성되어 있다. 음성합성 알고리즘은 ROM과 SRAM에서 실행되며 중앙처리부(20)로부터 DPRAM에 저장되는 합성파라미터들을 이용하여 신호처리적인 합성을 수핸한다. 합성된 디지탈 음성은 0.0625msec 마다 14비트의 해상도를 가진 AIC를 통해 가입자접속부(10)의 코덱으로 전송된다.
제3도는 본 발병에 따른 문자-음성변환 서비스장치의 전체적인 소프트웨어 구성도로서, PSOLA합성을 수행하는 TMS320C30 DSP(Digital Signal Processor)부(101)와, 중앙처리부(20)에서 동작하는 VRTX32 OS부(102)로 나눌 수 있다.
중앙처리부(20)에서 동작하는 VRTX32 OS부(102)는 DPRAM 접속구동기(110), 시리얼 접속 구동기(120), 이더넷 접속 구동기(130), 전화기접속 구동기(140), 인터럽트 서비스 루틴(150), 태스크관리(160), 시스템제어(170), 및 합성파라미터생성(180)이 있다.
상기 DPRAM 접속 구동기(110)는 DPRAM을 통해서 DSP부(101)와 합성파라미터를 주고 받을 수 있도록 해주는 부분으로서, 4K워드의 DPRAM 영역중에서 최상위 번지인 OxFFF와 OxFFE 어드레스를 이용하여 OxFFE 번지는 중앙처리부(20)가 음성합성부(40)으로 인터럽트를 걸어 합성에 필요한 파라미터들을 전송할때, OxFFF 번지는 음성합성부(40)가 중앙처리부(20)로 인터럽트를 걸어 합성 중간과정에서 발생하는 결과들을 넘겨줄때 사용한다. 이외의 나머지 DPRAM영역은 주고받는 합성 파라미터들의 저장에 사용한다.
시리얼 입출력 접속 구동기(120)는 시리얼포트로부터 송수신되는 데이타들을 관리하는 부분으로서, 데이타송신은 주고받는 데이타의 야이 적으므로 폴링방식으로 처리하고 데이타수신은 정보제공자로부터 많은 양의 데이타가 한꺼번에 들어오므로 인터럽트방식으로 처리하며, 송수신 모두 9600bps로 동작하도록 구성하였다.
이더넷 접속 구동기(130)는 시스템의 디버깅 및 14M바이트 정도의 대용량을 차지하는 합성 데이타베이스와 응용프로그램을 중앙처리부(20)의 메모리에 워크스테이션으로부터 다운로딩하기 위해서 사용하며, 전송속도는 10Mbps 급이다.
전화기접속 접속 구동기(140)는 가입자접속부(10)로부터 들어오는 후크 온/오프 신호, 링신호, 및 DTMF 신호를 처리하는 부분으로서 인터럽트가 걸려오면 일정번지를 읽어 본 뒤 3가지 신호중어떤 인터럽트가 들어온 것인지 판단하여 처리하도록 구성하였다.
인터럽트 서비스르틴(150)은 상기 접속 구동기들(110-140)과 시스템을 제어하는 타이머인터럽를 관리하는 기능을 수행하며, 각각의 인터럽트가 걸려오면 해당하는 응용프로그램에 메일박스나 카운터를 이용하여 알려줌으로써 이에 대응하는 처리를 할 수 있도록 한다.
태스크관리(160)는 시스템제어(170)에서 생성하는 태스크들을 각각의 순위에 따라 순차적으로 실행하는 역할을 하며 VRTX32 OS 커널에서 담당한다.
시스템제어(170)는 시스템의 전반적인 관리를 하며, 태스크의 생성 및 소멸 상기 인터럽트 서비스루틴(150)의 관리, 메일박스 및 큐의 관리 및 변수의 관리등을 수행한다.
합성단위생성(180)은 시리얼입출력부(30)로부터 전송받은 문자를 음성 합성에 필요한 파라미터들로 변환하는 역할을 수행하며, 생성된 파라미터들은 DPRAM을 통해 음성합성부(40)로 전송된다.
한편, DSP부(101)는 DPRAM 구동기(190), D/A 변환기능(200), 인터럽트 서비스루틴(210), 및 PSOLA 합성부(220)가 있으며, 실제 신호 처리적인 음성합성을 수행한다.
DPRAM 구동기(190)는 중앙처리부(2)와 합성파라미터와 중간결과들을 주고 받는데 사용하며, D/A 변환기(200)는 매 0.625msec마다 타이머 인터럽트에 의해서 합성한 디지탈 음성을 아날로그로 변환하여 내보내는 역할을 수행한다. 인터럽트 서비스루틴(210)은 DSP부(101)에서 발생하는 인터럽트들을 처리하여 PSOLA 합성기(220)과 연결시켜주는 기능을 담당한다. PSOLA 합성기(220)는 DPRAM을 통해 전송받은 파라미터들과 운율규칙 및 음성학적인 지식들을 이용하여 시간영역에서 파형을 연결함으로써 합성음으로 생성해내며, 생성된 파형은 인터럽트 서비스루틴(210)을 통해 D/A 변환기(200)에 전달된다.
제4도는 본 발명에 따른 음성합성파라미터의 구조도로서, N은 합성단위의 갯수를 나타내며 값은 1228이다. 그리고 합성데이타베이스를 구성하는 각각의 합성단위는 6개의 요소로 구분되어 있다.
합성단위시작위치(310)는 데이타베이스내에서 합성단위의 시작 위치를 나타내고, 세그먼트기호 및 길이(320)는 합성단위내에 음향적 구분을 표시한 기호와 단위내에서 기호의 길이를 나타낸다. 피치시작위치(330)는 피치 데이타의 시작위치를 나타내고, 이 피치 데이타(340)에는 합성단위의 피치값이 저장되어 있다. 샘플시작위치(350)는 실제 파형의 시작위치이며, 샘플데이타(360)에는 음성파형이 저장되어 있다.
제5도는 본 발명에 따른 음성합성 처리 흐름도로서, 중앙처리부(20)에서 수행되는 언어처리 및 합성단위생성 과정과 음성합성부(40)에서 수행되는 음성합성과으로 나누어져 있다.
전처리부(410)에서는 숫자와 약어를 한국어를 변환하고, 구분석기(420)는 문장을 형태소분석을 통하여 각각을 구분한 뒤 구문정보를 생성하고, 운율생성기(430)는 13개의 운율정보, 지속시간, 및 피치등의 정보를 생성하며, 글자-음운변환기(440)는 26개의 음운규칙과 예외사전을 이용하여 소리나는 형태의 발음기호열을 생성한다.
합성단위생성기(450)는 각각의 발음기호열을 합성에 적당한 합성단위로 변환하고, 합성단위결합기(460)는 합성에 필요한 파라미터를 데이타베이스로 부터 가져와 순서대로 연결함으로써 합성기에서 필요한 시간영역의 합성파라미터들을 생성하며, 음성합성부(40)에서 동작하는 PSOLA 합성기(470)에서는 전송받은 파라미터들과 음성학적인 지식들을 이용하여 시간영역의 파형에 피치, 지속시간, 및 에너지등을 규칙적으로 조절함으로써 합성음을 만들어 낸다.
제6도는 본 발명에 따른 문자-음성변환 서비스의 전체적인 제어흐름도이다.
도면에 도시된 바와 같이 가입자접속부(10)로 부터 호가 발생하면 중앙처리부(20)에서는 해당하는 호접속을 시도하여(510), 호 접속이 완료되면 중앙처리부(20)는 정보제공자와 접속을 시도한다.(515) 상기 정보제공자와 접속이 완료되면 정보제공자로부터 들어오는 데이타를 수신하여(520), 현재 어떤 단계에 있는지 분석하는 데이타 분석을 수행한다.(525).
상기 분석한 결과, 서비스 종료를 묻는 단계이면 종료 메세지를 내보내 해제할 것인가 확인하는데(530), 이 때 종료에 해당하는 DTMF 신호가 들어오면 정보제공자 접속을 해제하고 서비스를 종료하며(535), 그렇지 않은 경우에는 현재 상태가 메뉴를 선택하는 단계인가를 분석한다(540).
상기 현재 상태 분석 결과, 메뉴단계가이면 각가의 메뉴와 안내메세지를 음성합성부(40)로 보내어 메뉴 데이타를 수신하고(545), 한국어 규칙 및 음성 합성알고리즘을 적용하여 합성음을 생성한다(550). 상기 합성된 결과는 전화기를 통해 사용자가 들을 수 있도록 가입자접속부(10)의 코덱으로 전송된다(555).
한편, 상기 현재 상태 분석 결과, 메튜단계가 아니고 사용자가 원하는 최종적인 검색정보인 경우에는 정보구간을 검출하는 자료정보 검출을 수행하여(560), 해당하는 합성음을 생성한 뒤(565), 코덱으로 합성음을 전송한다(570).
정보제공자로 부터 전송된 데이타에 대하여 상기와 같은 과정을 거쳐 함성음을 생성, 전송한 뒤에는 사용자가 누른 DTMF 신호를 수신하여(575), 데이타처리부(30)를 통해 정보제공자에게 다음상태로 넘어가기 위한 명령을 전송한다(580). 그리고 다시 정보제공자로 부터 데이타를 수신(520)하는 과정으로 돌아간다.
상기와 같이 구성하여 수행되는 본 발명은 다음과 같은 특수한 효과를 얻을 수 있다.
첫째, 문자정보를 음성으로 변환하여 전화가입자들에게는 제공하므로 누구나 장소에 구애받지 않고 신속하게 정보를 얻을 수 있다.
둘째, 단말기를 보유한 사용자뿐만 아니라 전화사용자까지 정보제공자로 부터 받을 수 있는 서비스의 범위를 확대할 수 있다.
세째, 사용자는 원하는 정보를 음성으로 들을 수 있으므로 동시에 다른 작업을 할 수 있다.
넷째, 정보제공 데이타베이스가 문자만으로 구성되므로 정보제공자는 녹음방식으로 데이타베이스를 구축하던 경우에 비해서 경비 및 시간의 부담을 줄일 수 있다.
다섯째, 시각 장애인들에게도 정보제공서비스를 할 수 있다.
여섯째, 음성을 이용한 새로운 정보제공서비스를 창출 할 수 있다.

Claims (13)

  1. 일반 전화 가입자를 수용하는 공중 전화에 접속되는 전화망에 접속되는 전화망접속부(1),정보 제공자를 수용하는 공중 데이타망 사이에 접속되는 패킷망접속부(3)로 이루어지는 통신망 시스템에 적용되는 문자-음성변환 서비스 장치에 있어서, 링신호 및 후크온 신호를 감지하여 후크온 신호를 상기 전화망접속부(1)로 보내 호절단을 요구하고, 합성된 아날로그 음성을 PCM(Pulse Code Modulation) 신호로 변환하여 상기 전화망접속부(1)로 전송하는 가입자접속수단(10); 전반적인 시스템의 동작을 제어하는 것으로, 상기 가입자접속수단(10)에 합성된 음성을 제공하는 음성합성기능을 실시간으로 수행하기 위해 고속의 디바이스와 멀티태스킹 OS(Operating System)가 동작할 수 있도록 구성된 중앙처리수단(20); 상기 중앙처리수단(20)과 패킷망접속부(3) 사아에 접속되어 외부와의 데이터 입출력을 담당하는 데이터처리수단(30); 및 음성합성부(40)는 문자를 음성으로 변환하는 것으로, 상기 중앙처리수단(20)의 제어에 따라 디지탈 음성을 합성하여 가입자접속수단(10)으로 전송되도록 하는 음성합성수단(40)을 구비하는 것을 특징으로 문자-음성변환 서비스 장치.
  2. 제1항에 있어서, 상기 가입자접속단(10)은, PCM 신호변환을 위한 코덱; 접속채널을 설정하는 채널 셀렉터; 및 DTMF(Dual Tone Multifrequency) 신호를 감지하여 소정비트로 변환하는 DTMF 변환기를 구비하는 것을 특징으로 하는 문자-음성변환 서비스 장치.
  3. 제1항에 있어서, 상기 중앙처리수단(20)은, 중앙처리장치(CPU), 부동소수점 처리장치(FPU:Floating point Processing Unit), 메모리소자(ROM,SRAM,DRAM,DPRAM), 및 디바이스 제어기를 구비하는 것을 특징으로 하는 문자-음성변환 서비스 장치.
  4. 제3항에 있어서, 상기 메모리소자는, 시스템제어기능이 탑재된 롬(ROM);빠른 속도의 실행을 필요로하는 음성합성프로그램이 탑재된 상태램(SRAM); 대용량의 메모리를 요구하는 합성데이타베이스가 탑재되는 동저 램(DRAM); 및 상기 음성합성수단(40)과 데이타를 주고받기 위해서 사용되는 이중포트 램(DPRAM)을 구비하는 것을 특징으로 하는 문자-음성변환 서비스 장치.
  5. 제1항에 있어서, 상기 데이타처리수단(30)은, 전화가입자가 누른 DTMF 신호를 소정비트 데이타로 변환하여 상기 패킷망접속부(3)로 전송하고 정보제공자로 부터 전송되는 데이타를 상기 중앙처리수단(20)으로 전송되는 시리얼입출력부; 및 시스템의 디버깅 및 합성데이타베이스 및 응용프로그램의 다운로딩에 사용되는 이더넷입출력부를 구비하는 것을 특징으로 하는 문자-음성변환 서비스 장치.
  6. 제1항에 있어서, 상기 음성합성수단(40)은, DSP(Digital Signal Processor), 상태 램(SRAM), 롬(ROM), 아날로그신호 접속회로(AIC) 및 디바이스 제어기를 구비하는 것을 특징으로 하는 문자-음성변환 서비스 장치.
  7. 외부의 전화망접속부(1)에 접속되는 가입자접속수단(10), 상기 가입자접속수단(10)에 접속되는 중앙처리수단(20), 상기 중앙처리수단(20)과 외부의 패킷망접속부(3) 사이에 접속되는 데이타처리수단(30)을 구비하는 문자-음성변환 서비스 장치에 적용되는 문자-음성변환 서비스 제어 방법에 있어서, 상기 가입자접속수단(10)으로 부터 호가 발생하면 중앙처리수단(20)이 상기 패킷망접속부(3)를 통해 정보제공자와 접속하여 데이타를 수신하는 제1단계; 상기 수신한 데이타를 분석하여 현재 상태가 서비스 해제가 아니면 메뉴를 선택하는 단계인가를 분석하는 제2단계; 상기 메뉴 선택단계 여부에 따라 메뉴 데이타를 수신하고 합성음을 생성하거나 자료정보를 검출하여 해당하는 합성음을 생성, 전송하는 제3단계; 및 사용자가 누른 DTMF 신호를 수신하여 데이타처리수단(30)을 통해 정보제공자에게 다음상태로 넘어가기 위한 명령을 전송하는 제4단계를 포함하는 것을 특징으로 하는 문자-음성변환 서비스 제어 방법.
  8. 제7항에 있어서, 상기 제2단계는, 현재 어떤 단계에 있는지 분석하기 위해 수신한 데이타를 분석하여 서비스 종료를 묻는 단계이면 종료 메세지를 내보내 해제할 것인가 확인하는 제5단계; 및 상기 확인 결과, 전화가입자로부터 종료에 해당하는 DTMF신호가 들어오면 정보제공자 접속을 해제하고 서비스를 종료하며 그렇지 않은 경우에는 현재 상태가 메뉴를 선택하는 단계인가를 분석하는 제6단계를 포함하는 것을 특징으로 하는 문자-음성변환 서비스 제어 방법.
  9. 제7항에 있어서, 상기 제3단계는, 상기 메뉴 선택단계인지 분석한 결과, 현재 상태가 메뉴 선택단계이면 각각의 메뉴와 안내메세지를 음성합성수단(40)으로 보내어 메뉴 데이타를 수신하는 제5단계; 상기 제5단계 수행 후, 한국어 규칙 및 음성 합성알고리즘을 적용하여 합성음을 생성하고 전화기를 통해 사용자가 들을 수 있도록 가입자접속수단(10)으로 전송되는 제6단계; 상기 메뉴 선택단계인지 분석한 결과, 메뉴단계가 아니고 사용자가 원하는 최종적인 검색정보인 경우에는 정보구간을 검출하는 자료정보 검출을 수행하는 제7단계; 및 상기 제7단계 수행후, 해당하는 합성음을 생성한 뒤 가입자접속수단(10)으로 합성음을 전송하는 제8단계를 포함하는 것을 특징으로 하는 문자-음성변환 서비스 제어 방법.
  10. 제7항 또는 제9항에 있어서, 상기 합성음을 생성하는 과정은, 중앙처리수단(20)에서 수행되는 언어처리 및 합성단위생성 과정과 음성합성수단(40)에서 수행되는 음성합성과정으로 나누어지는 것을 특징으로 하는 문자-음성변환 서비스 제어 방법.
  11. 제10항에 있어서, 상기 언어처리 및 합성단위생성 과정은, 숫자와 약어를 한국어로 변환하고, 문장을 형태소분석을 통하여 각각을 구분한 뒤 구문정보를 생성하는 제1과정; 소정개의 운율정보, 지속시간, 및 피치등의 정보를 생성하고 소정개의 음운규칙과 예외사전을 이용하여 소리나는 형태의 발음기호열을 생성하는 제2과정; 및 각각의 발음기호열을 합성에 적당한 합성단위로 변환하고 합성에 필요한 파라미터를 데이타베이스로 부터 가져와 순서대로 연결함으로써 시간영역의 합성파라미터들을 생성하는 제3과정을 포함하는 것을 특징으로 하는 문자-음성변환 서비스 제어 방법.
  12. 제11항에 있어서, 상기 음성합성과정은, 상기 전송받은 시간영역의 합성파라미터들과 음성학적인 지식들을 이용하여 시간영역의 파형에 피치, 지속시간, 및 에너지등을 규칙적으로 조절함으로써 합성음을 만들어 내는 것을 특징으로 하는 문자-음성변환 서비스 제어 방법.
  13. 제11항에 있어서, 상기 합성파라미터의 데이타 구조는, 데이타베이스내에서 합성단위의 시작 위치를 나타내는 합성단위시작위치 필드(310); 합성단위내에 음향적 구분을 표시한 기호와 단위내에서 기호의 길이를 나타내는 세그먼트기호 및 길이필드(320); 피치 데이타의 시작위치를 나타내는 피치시작위치 필드(330); 합성단위의 피치값이 저장되어 있는 피치 데이타 필드(340); 실제 파형의 시작위치를 나타내는 샘플시작위치 필드(350); 및 음성파형이 저장되어 있는 샘플데이타 필드(360)로 이루어진 것을 특징으로 하는 문자-음성변환 서비스 제어 방법.
KR1019950055898A 1995-12-23 1995-12-23 문자-음성변환 서비스 장치 및 그 제어 방법 KR0153642B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019950055898A KR0153642B1 (ko) 1995-12-23 1995-12-23 문자-음성변환 서비스 장치 및 그 제어 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019950055898A KR0153642B1 (ko) 1995-12-23 1995-12-23 문자-음성변환 서비스 장치 및 그 제어 방법

Publications (2)

Publication Number Publication Date
KR970056695A KR970056695A (ko) 1997-07-31
KR0153642B1 true KR0153642B1 (ko) 1998-11-16

Family

ID=19444068

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950055898A KR0153642B1 (ko) 1995-12-23 1995-12-23 문자-음성변환 서비스 장치 및 그 제어 방법

Country Status (1)

Country Link
KR (1) KR0153642B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100437600B1 (ko) * 1999-08-17 2004-06-26 엘지전자 주식회사 부가통신 시스템에서의 문자 정보 변환 서비스 보드 및 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020028501A (ko) * 2000-10-10 2002-04-17 김철권 통신망에서의 음성 데이터와 문자 데이터간의 변환 방법및 그 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100437600B1 (ko) * 1999-08-17 2004-06-26 엘지전자 주식회사 부가통신 시스템에서의 문자 정보 변환 서비스 보드 및 방법

Also Published As

Publication number Publication date
KR970056695A (ko) 1997-07-31

Similar Documents

Publication Publication Date Title
US7760705B2 (en) Voice integrated VOIP system
US5029200A (en) Voice message system using synthetic speech
US5524139A (en) System for automatic access to automated telephonic information services
WO2000018083A1 (en) Voice dialling system with contacts database including phonetic spelling
IL122647A (en) Method and device for retrieving information using an audio interface
EP1471499B1 (en) Method of distributed speech synthesis
CN112866086A (zh) 智能外呼的信息推送方法、装置、设备及存储介质
US7120234B1 (en) Integrated tone-based and voice-based telephone user interface
JPH11285039A (ja) 通信装置での直通選択機能を準備するための方法
KR0153642B1 (ko) 문자-음성변환 서비스 장치 및 그 제어 방법
US20020193993A1 (en) Voice communication with simulated speech data
GB2263042A (en) Voice activated system and method
KR0175251B1 (ko) 문음변환 방식을 이용한 자동 응답 시스템
EP0093022A1 (en) Apparatus for generating a plurality of electric signals
KR0128844B1 (ko) 음성합성을 이용한 정보통신 서비스 검색 장치 및 방법
KR970055729A (ko) 이동단말기에서의 음성인식에 의한 전화번호 송신방법 및 장치
KR950011485B1 (ko) 한국어 문자를 음성으로 변환하는 오디오텍스장치의 음성처리 장치 및 방법
KR0161766B1 (ko) 다이얼-아웃 서비스에 있어서 문자-음성 변환 기술을 이용한 가입자 호출 방법
CN210986161U (zh) 一种人工智能语音客服***
JP4857007B2 (ja) 切替えシステムおよび切替え方法
JPH07175495A (ja) 音声認識方式
KR930024399A (ko) 문음 변환 장치를 이용한 자동정보검색 시스템 및 그 제어방법
AU747487B2 (en) Transceiver for various information formats
JPH0832679A (ja) 制御信号伝送方法及び構内交換機システム
KR20010068773A (ko) 메일 음성 변환 장치

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070702

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee