FI116595B - Äänisignaalin käsittelylaite - Google Patents

Äänisignaalin käsittelylaite Download PDF

Info

Publication number
FI116595B
FI116595B FI20030089A FI20030089A FI116595B FI 116595 B FI116595 B FI 116595B FI 20030089 A FI20030089 A FI 20030089A FI 20030089 A FI20030089 A FI 20030089A FI 116595 B FI116595 B FI 116595B
Authority
FI
Finland
Prior art keywords
signal
section
analysis
peak
period
Prior art date
Application number
FI20030089A
Other languages
English (en)
Swedish (sv)
Other versions
FI20030089A (fi
Inventor
Joji Kane
Akira Nohara
Original Assignee
Matsushita Electric Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2008595A external-priority patent/JP2712692B2/ja
Priority claimed from JP2008592A external-priority patent/JP2712691B2/ja
Priority claimed from JP2017348A external-priority patent/JPH03220600A/ja
Priority claimed from JP2026506A external-priority patent/JP2712703B2/ja
Priority claimed from JP2026507A external-priority patent/JP2712704B2/ja
Priority claimed from JP2034297A external-priority patent/JP2712708B2/ja
Application filed by Matsushita Electric Ind Co Ltd filed Critical Matsushita Electric Ind Co Ltd
Publication of FI20030089A publication Critical patent/FI20030089A/fi
Application granted granted Critical
Publication of FI116595B publication Critical patent/FI116595B/fi

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Selective Calling Equipment (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Description

116595 Äänisignaalin käsittelylaite
Esillä oleva keksintö koskee äänisignaalin käsittelylaitetta äänen ilmaisun ja äänentunnistuksen menetelmien kannalta.
5 Viime aikoina on äänenilmaisulaitteita äänen esiintymisen/puuttumi- sen ilmaisemiseksi käytetty laajalti sellaisiin sovellutuksiin kuin äänentunnistus, puhujan tunnistus, laitteen käyttö ääniohjauksella, ja tiedon syöttäminen tietokoneeseen äänen avulla.
Kuvio 1 on lohkokaavio joka esittää aiemmin tunnettua äänenil-10 maisulaitetta, jonka rakenne ja toiminta tullaan tämän jälkeen selittämään. Te-hoilmaisuosa 19 ilmaisee tulosignaalin tehoarvon arvon antamiseksi verrattavaksi komparaattorilla 21 ja sitten komparaattori 21 vertaa arvoa ennalta määrättyyn kynnystason asetusosan 20 asettamaan arvoon, jotta tuotettaisiin ääni-ilmaistu-signaali, kun arvo on suurempi kuin ennalta määrätty asetusarvo.
15 Aiemmin tunnetun mukaisesti yllä kuvatun kaltainen äänenilmaisulai- te kuitenkin, jopa silloin jos tuleva ääni on heikko, kun tuleva signaali sisältää jonkin muun häiriön kuin ääni, tehonilmaisuosan 19 ilmaisema teho on suurempi kuin kynnyksenasetusosan 20 asetusarvo, aiheuttaa ääni-ilmaistu-signaalin lähettämisen, mikä siten muodostaa hankaluuksia usein esiintyvien virheellisten 20 ilmaisujen muodossa.
Esillä oleva keksintö pyrkii ilmaisemaan äänen tarkasti kepstrianalyy-v : siä käyttämällä.
: V: Esillä olevan keksinnön mukainen signaalinilmaisulaite sisältää; : ‘ “: kepstrin laskentalaitteen äänisignaalin kepstrin muodostamiseksi, 25 keskiarvon laskentalaitteen kepstrin laskentalaitteen lähtevän kepst- :. rin tekemiseksi tasaiseksi; kynnysarvon asetuslaitteen äänen ilmaisun kynnystason asettami seksi keskiarvon laskentalaitteelta tulevan kepstrin keskiarvon perusteella, ja äänenilmaisulaitteen, johon keskiarvon laskentalaitteelta tuleva ’· 30 kepstrin keskiarvo, kepstrin laskentalaitteelta tuleva kepstrin lähtöarvo ja kyn- nysarvon asetuslaitteelta lähtevä kynnysarvosignaali syötetään, ja joka ilmaisee • äänen.
. · · ·, Esillä olevan keksinnön mukaisella rakenteella kepstrin laskentalaite ]·’ laskee tulevan signaalin kepstriarvon lasketun signaalin saamiseksi ja kepstrin
• I
'···’ 35 keskiarvosignaalin lasketusta signaalista. Sen jälkeen suoritetaan äänen ilmaisu » » t • I » « » 1 1 6595 2 signaalin perusteella, joka ylittää kepstrin keskiarvosignaalin ja jota laskettu kyn-nysarvosignaali ohjaa ja joka on asetettu kepstrin keskiarvosignaalilla.
Esillä olevan keksinnön tarkoituksena on taijota sellainen laite, että käsittelyaika kepstrin huippuarvon saamiseksi on lyhyt.
5 Esillä olevan keksinnön mukainen signaalinilmaisulaite sisältää; kepstrin laskentalaitteen tulevan äänen kepstrin laskemiseksi, huippuarvon ilmaisulaitteen kepstrin laskentalaitteelta lähtevän kepstrin huippuarvon ilmaisemiseksi, analyysijakson asetuslaitteen analyysijakson asettamiseksi huippuar-10 von ilmaisulaitteelta tulevan huippuarvo-ilmaistu-signaalin ja toimintamoodin asetussignaalin perusteella, ja äänenilmaisulaitteen, johon huippuarvon ilmaisulaitteelta tuleva huippuarvo-ilmaistu signaali syötetään äänen ilmaisemiseksi, huippuarvon ilmaisulaitteen huippuarvon ilmaisujakson, jota ana-15 lyysijakson asetuslaitteen lähtösignaali ohjaa.
Esillä olevan keksinnön mukaisella rakenteella kepstrin laskentalaite laskee tulevan äänen kepstrin sen syöttämiseksi huippuarvon ilmaisulaitteelle. Huippuarvon ilmaisulaite ilmaisee kepstrin laskentalaitteelta tulevan kepstrin huippuarvon analyysijakson sisällä, jonka analyysijakson asetuslaite osoittaa, 20 huippuarvon syöttämiseksi äänenilmaisulaitteeseen. Äänenilmaisulaite vertaa huippuarvon ilmaisulaitteelta tulevaa huippuarvoa ennalta määrättyyn kynnysar-v ; voon äänen ilmaisemiseksi. Toimintamoodi ja osa huippuarvon ilmaisulaitteelta :V: tulevasta huippuarvo-ilmaistu-signaalista syötetään analyysijakson asetuslait- teeseen. Toimintamoodin yhdessä tilassa analyysijakson asetuslaite lähettää 25 ennalta määrätyn analyysijakson huippuarvon ilmaisulaitteelle, ja samaan ai-kaan se asettaa analyysijakson lähtöön toisen toimintamoodin aikana huippuar-’*··. vo-ilmaistu-lähtösignaalin ohjaamana. Toisessa toimintamoodissa analyysijak son asetuslaite toimii tavalla jossa se ohjaa edellisessä toimintamoodissa asete- , , tun analyysijakson huippuarvon ilmaisulaitteelle, mikä samalla pienentää ana- » · · :;; _: 30 lyysijaksoa ja lyhentää käsittelyaikaa.
* · * ‘ Esillä olevan keksinnön on tarkoitus toteuttaa samanlainen päämäärä t * kuin yllä.
i « » · ; 1 * ·. Esillä olevan keksinnön mukainen signaalinilmaisulaite sisältää; •« · kepstrin laskentalaitteen tulevan äänen kepstrin laskemiseksi, * * 35 huippuarvon ilmaisulaitteen kepstrin laskentalaitteelta tulevan kepst- rin huippuarvon laskemiseksi, 3 116595 jaksodatan asetuslaitteen analysoitavan kefrenssijakson asettamiseksi huippuarvon ilmaisulaitteelta tulevan huippuarvo-ilmaistu-lähtösignaalin perusteella, ensimmäisen muistiryhmän johon asetettu jaksodatan asetuslaitteen 5 lähtöarvo syötetään ensimmäisen kytkimen kautta, toisen muistiryhmän aiemman jaksodatan asettamista varten, toisen kytkimen muistin lähdön valitsemiseksi useista muistiryhmistä, ohjauslaitteen ensimmäisen ja toisen kytkimen ohjausta varten, ja äänenilmaisulaitteen johon huippuarvon ilmaisulaitteelta tuleva huip-10 puarvo-ilmaistu-lähtösignaali syötetään äänen ilmaisemista varten, huippuarvon ilmaisulaitteen huippuarvon ilmaisujakson ollessa yhden muistiryhmän, joka on valittu toisella kytkimellä, lähdön ohjaamana.
Esillä olevan keksinnön mukaisella rakenteella ohjausosa ohjaa toi-mintamoodin ohjaamana, tuleeko kefrenssianalyysijakso, joka ohjataan huippu-15 arvon ilmaisuosaan, saada ensimmäisestä muistista vai toisesta muistista, ja se ohjaa, tuleeko jaksonasetusosalta tuleva data tallentaa ensimmäiseen muistiin vai ei. Yhdessä toimintamoodissa ohjausosa toimii sillä tavoin, että toiselta muistilta tuleva kefrenssianalyysijakso ohjataan huippuarvon ilmaisuosaan, ja kefrenssianalyysijakso syötetään tulevan äänen ohjaamana jaksonasetusosasta ja 20 tallennetaan ensimmäiseen muistiin. Toisessa toimintamoodissa ohjausosa toimii sillä tavoin, että kefrenssianalyysijakso ensimmäiseltä muistilta ohjataan v ; huippuarvon ilmaisuosaan, mikä siten sallii käsittelyajan lyhentämisen.
Esillä olevan keksinnön tarkoituksena on toteuttaa samanlainen : tavoite kuin yllä.
:'"; 25 Esillä olevan keksinnön mukainen signaalinkäsittelylaite sisältää; kepstrin laskentaosan, johon ääni syötetään ja jossa kepstri laske- .··*. taan, huippuarvon ilmaisuosan, jossa huippuarvo ilmaistaan määrätyssä . . analyysijaksossa kepstristä, 30 äänenilmaisuosan ääni-ilmaistu-lähtösignaalin saamiseksi huippuar- • · ‘ · · · ’ vo-ilmaistu-lähtösignaalista, : analyysijakson asetusosan optimaalisen analyysijakson laskemista varten huippuarvo-ilmaistu-lähtösignaalin perusteella, ja määrätyn analyysijak-. son ohjaamiseksi huippuarvon ilmaisuosaan, I t ’;··[ 35 analyysijakson muistin analyysijakson informaation tallentamista var- :-‘i ten, ja 4 116595 analyysijakson luokitteluosan analyysijakson luokittelemiseksi optimaalisen analyysijakson perusteella ja luokitellun analyysijakson tallentamisen analyysijakson muistiin, analyysijakson, jota analyysijakson asetusosa ohjaa huippuarvon il-5 maisuosaan ohjattavaksi analyysijakson luokitteluosalla moodinasetustulon ohjaamana, ja analyysijakson luokitteluosan, joka tarkistaa optimaalisen analyysijakson analyysijakson muistin sisältöä vastaan moodinasetustulon ohjaamana, analyysijakson ohjaamiseksi tarkistetun tuloksen perusteella analyysijak-10 son asetusosaan.
Esillä olevan keksinnön mukaisella rakenteella kepstrin laskentaosa laskee tulevan äänen kepstrin ja syöttää kepstrin huippuarvon ilmaisuosaan. Huippuarvon ilmaisuosa ilmaisee kepstrin laskentaosalta syötetyn kepstrin huippuarvon analyysijakson mukaisesti, joka on syötetty analyysijakson asetusosal-15 ta. Sen jälkeen äänenilmaisuosa ilmaisee äänen esiintymisen/puuttumisen huippuarvon ilmaisuosalta tulevan signaalin osasta ääni-ilmaistu-lähtösignaalin saamiseksi. Tämän jälkeen suoritetaan jaksonasetusosan jaksonasetustoiminta ja analyysijakson luokitteluosan luokittelunkäsittelytoiminta seuraavalla tavalla. Ensiksi, kun moodinasetustulona on "REKISTERÖINTI", analyysijakson ase-20 tusosa syöttää ennalta määrätyn leveän analyysijakson huippuarvon ilmaisuosaan ja laskee optimaalisen analyysijakson kepstrin huippuarvon perusteella : : tulevalle äänelle, joka on syötetty huippuarvon ilmaisuosalta, optimaalisen ana- v.: lyysijakson syöttämiseksi analyysijakson luokitteluosaan. Analyysijakson luokit- : ': teluosa vertaa optimaalisen analyysijakson dataa analyysijakson dataan, joka on : 25 tallennettu analyysijakson muistiin, ja jos molemmat datat ovat luokaltaan toisis- taan poikkeavia, se tallentaa lisäksi optimaalisen analysointijakson datan ana-,*·. lyysijakson muistiin. Tämän jälkeen, kun moodinasetustulo on "TUNNISTUS", analyysijakson asetusosa syöttää analyysijakson datan, joka on syötetty ana- , , lyysijakson muistista analyysijakson luokitteluosan ohjaamana, tai ennalta mää- • « » :: 30 rätyn leveän analyysijakson asetetun arvon huippuarvon ilmaisuosaan, ja laskee » · ’*;·* optimaalisen analyysijakson tulevan äänen, joka on syötetty huippuarvon ilmai- : suosasta, kepstrin huippuarvon mukaisesti, optimaalisen analyysijakson syöttä- miseksi analyysijakson luokitteluosaan. Analyysijakson luokitteluosa valitsee optimaalisen analyysijakson kanssa samanlaisen analyysijakson muistista ja ohjaa ’;··* 35 muistia syöttämään valitun analyysijakson analyysijakson asetusosalle. Yllä ku-
t I
5 116595 vatut samanlaiset analyysijaksot määritellään kahdeksi analyysijaksoksi joiden päällekkäin asetettu jakso on suurempi kuin ennalta määrätty osa.
Esillä olevan keksinnön tarkoituksena on ilmaista ääni tarkasti.
Esillä olevan keksinnön mukainen signaalinohjauslaite sisältää; 5 tehonlaskentaosan tulevan signaalin tehon laskemista varten, kepstrin laskentaosan tulevan signaalin kepstrin laskemista varten, huippuarvon ilmaisuosan kepstrin laskentaosalta tulevan kepstrin huippuarvon ilmaisemista varten, S/N-laskentaosan tulevan signaalin S/N-suhteen laskemista varten 10 tehonlaskentaosan ja huippuarvon ilmaisuosan antamien lähtösignaalien perusteella, signaalinilmaisuosan tulevan signaalin esiintymisen/puuttumisen ilmaisemiseksi huippuarvon ilmaisuosan lähtösignaalin perusteella, ja ohjauslaitteen tulevan signaalin lähettämisen ohjaamiseksi loogisella 15 tulolla S/N-laskentaosan lähtösignaalista ja signaalinilmaisuosan lähtösignaalis-ta.
Esillä olevan keksinnön mukaisella rakenteella tehonlaskentaosa laskee tulevan signaalin tehon, ja kepstrin laskentaosa ilmaisee huippuarvon ilmaisuosan kautta lasketun kepstrin huippuarvon. Signaalinilmaisuosa ilmaisee sig-20 naalin esiintymisen/puuttumisen kepstrin huippuarvosta, ja kun signaali esiintyy, se syöttää signaali-ilmaistu-signaalin AND-osalle. S/N-laskentaosa laskee myös , : S/N-suhteen käyttämällä tulevan signaalin tehoa, joka saadaan tehonlaskenta- v,: osalta, ja kepstrin huippuarvoa, joka saadaan huippuarvon ilmaisuosalta, ja kun :[[[: laskettu S/N on yhtä suuri tai suurempi kuin määritelty S/N-arvo, se syöttää las- 25 ketun S/N-suhteen AND-osalle. AND-osa toimii tavalla jossa se ottaa loogisen tulon S/N-ilmaisuosalta tulevasta signaalista ja signaalinilmaisuosalta tulevasta .··*, signaalista kytkimen ohjaamiseksi. Näin ollen, kun tulevan signaalin S/N-suhde on hyvä ja signaali esiintyy, AND-osa toimii lähtevän signaalin tuottamiseksi.
. . Esillä olevan keksinnön on tarkoitus tarjota sellainen laite, joka toimii
• · I
30 vain tunnistettavan tulevan äänen esiintyessä, ilmaisten äänen tarkasti kepstri-‘ ' analyysiä käyttämällä.
i : ’: Esillä olevan keksinnön mukainen signaalinkäsittelylaite sisältää; äänianalyysiosan tulevan äänen analysoimista varten ja analysoidun ,;. signaalin lähettämistä varten, 35 sovitusosan analysoidun signaalin vertaamiseksi malliin ja tunnistet- tu-signaalin lähettämiseksi, 6 116595 kepstrin laskentaosan kepstrin laskemiseksi tulevasta äänestä ja kepstrin lähettämistä varten, huippuarvon ilmaisuosan kepstrin huippuarvon ilmaisemiseksi ja huippuarvosignaalin lähettämistä varten, 5 äänenilmaisuosan äänen esiintymisen/puuttumisen ilmaisemiseksi signaalin huippuarvon avulla, ja ensimmäisen ohjaussignaalin lähettämiseksi sovitusosaan, ohjausosan toisen ohjaussignaalin lähettämiseksi sovitusosalle moo-dinasetustulossignaalin ja huippuarvon ilmaisuosalta tulevan huippuarvosignaa-10 Iin ohjaamana, ja huippuarvomuistin huippuarvosignaalin tallentamista varten; ja ohjausosan joka kirjoittaa huippuarvosignaalin huippuarvomuistiin moodiasetuksen "ASETUS" ohjaamana, ja joka kykenee vertaamaan huippuarvomuistin huippuarvosignaalia tulevan äänen kepstrin huippuarvosignaaliin 15 moodiasetuksen "TUNNISTUS" ohjaamana, jotta lähetettäisiin toinen ohjaussignaali joka vastaa kutakin verrattujen tulosten kefrenssieroa, ja sovitusosan joka lähettää tunnistettu-lähtösignaalin ensimmäisen ohjaussignaalin ja toisen ohjaussignaalin mukaisesti.
Esillä olevan keksinnön mukaisella rakenteella kepstrin laskentaosa 20 ilmaisee huippuarvon ilmaisuosan avulla tulevan äänen kepstrin huippuarvon. Tämän jälkeen äänenilmaisuosa ilmaisee äänen esiintymisen/puuttumisen il-:. : maistun kepstrin huippuarvon perusteella ja syöttää ensimmäisen ohjaussignaa- :,’]· Iin, joka vastaa äänen esiintymistä/puuttumista, sovitusosaan. Ohjausosa myös- \* kin, kun moodin asetus on "REKISTERÖINTI", tallentaa huippuarvon ilmai- 25 suosalta saadun kepstrin huippuarvosignaalin huippuarvomuistiin, ja kun moo-: ’. \ din asetus on "TUNNISTUS", se vertaa huippuarvon ilmaisuosalta saatua kepst- /··. rin huippuarvosignaalia huippuarvomuistiin talletettuun huippuarvosignaaliin ja syöttää toisen ohjaussignaalin vastaavan kefrenssierotuksen mukaisesti sovi-. . tusosaan. Äänianalyysiosa edelleen analysoi tulevan äänen käytettäväksi sovi- 30 tusosassa, joka puolestaan suorittaa analysoidun tulosignaalin sovitusproses-'·;·* soinnin aiemmin rekisteröidyn datan kanssa tunnistettu-lähdön saamiseksi.
: Tuolla hetkellä sovitusprosessoinnin aloitusta ohjataan äänenilmaisuosalta ja ohjausosalta tulevilla ensimmäisellä ja toisella ohjaussignaalilla. Tämä tarkoit-taa, että äänenilmaisuosalta tuleva ensimmäinen ohjaussignaali aloittaa sovitus-’··’ 35 toiminnan, kun ääni ilmaistaan, kun taas ohjausosalta tuleva toinen ohjaussig- > naali aloittaa sovitustoiminnan silloin kun ohjausosa määrää, kun moodin asetus 7 116595 on "TUNNISTUS", jottei ole mitään eroa tulevan äänen kepstrin kefrenssin ja aiemmin muistiin rekisteröidyn huippuarvosignaalin kefrenssin välillä kun moodin asetus on "ASETUS".
Esillä olevan keksinnön tarkoituksena on tarjota sellainen laite, joka 5 tunnistaa tehokkaasti vain rekisteröidyn tulosignaalin useiden tulosignaalien joukosta, ilmaisemalla äänen tarkasti kepstriä käyttämällä.
Esillä olevan keksinnön mukainen signaalinkäsittelylaite sisältää; äänianalyysiosan tulevan äänen analysoimiseksi ja analysoitu-signaalin tuottamiseksi, 10 sovitusosan analysoidun signaalin vertaamiseksi malliin ja tunnistet tu-signaalin tuottamiseksi, kepstrin laskentaosan kepstrin laskemiseksi tulevasta äänestä ja kepstrin lähettämistä varten, huippuarvon ilmaisuosan kepstrin huippuarvon ilmaisemiseksi määrä-15 tyssä jaksossa ja huippuarvosignaalin tuottamista varten, äänenilmaisuosan äänen esiintymisen/puuttumisen ilmaisemiseksi huippuarvosignaalin avulla ja ensimmäisen ohjaussignaalin lähettämiseksi sovi-tusosaan, analyysijakson käsittelyosan analyysijakson ohjaamiseksi huippuar-20 von ilmaisuosaan, ja optimaalisen analyysijakson laskemiseksi vastaten kepstrin huippuarvoa ja jakson lähettämisen, ja v : analyysijakson luokitteluosan analyysijakson luokittelemiseksi opti- v,: maalisen analyysijakson perusteella ja jakson tallentamiseksi analyysijakson muistiinpa 25 analyysijakson joka ohjataan huippuarvon ilmaisuosaan analyysijak- son käsittelyosan avulla ohjattavaksi analyysijakson luokitteluosan avulla moo- • 1 . · · ·, dinasetustulon moodin ohjaamana, analyysijakson luokitteluosan, joka tarkastaa optimaalisen jakson jak-, . somuistin analyysijakson dataa vastaan moodinasetustulon ohjaamana toisen 30 signaalin lähettämiseksi, joka vastaa tunnistettavaa äänisignaalia, sovitusosalle, ·;·' ja joka luokittelee jaksomuistin analyysijakson datan ja ohjaa analyysijakson : : *: analyysijakson käsittelyosalle, ja sovitusosan joka käyttää ensimmäistä ja toista ohjaussignaalia tun- t i » nistuskäsittelyn rajoittamiseksi tavalla, jossa se suoritetaan vain kun äänisignaali ‘; * * [ 35 esiintyy ja tulee tunnistaa.
8 116595
Esillä olevan keksinnön mukaisella rakenteella kepstrin laskentaosa ilmaisee huippuarvon ilmaisuosan avulla tulevan äänisignaalin kepstrin huippu-arvon analyysijaksossa, joka on määritelty analyysijakson käsittelyosalla. Ää-nenilmaisuosa ilmaisee äänen esiintymisen/puuttumisen kepstrin huippuarvon 5 perusteella ja syöttää ensimmäisen ohjaussignaalin sovitusosalle. Tuolla hetkellä huippuarvon ilmaisuosalle annettu analyysijakso on sellainen kuin alla on esitetty moodinasetustulon moodin mukaisesti. Ensiksi kun moodin asetus on "REKISTERÖINTI", analyysijakson käsittelyosa syöttää ennalta määrätyn analyysijakson huippuarvon ilmaisuosalle ja laskee optimaalisen analyysijakson vas-10 täten kepstrin huippuarvoa, lasketun jakson lähettämiseksi analyysijakson luokitteluosaan. Analyysijakson luokitteluosa suorittaa luokittelukäsittelyn alla esitetyn mukaisesti. Tämä tarkoittaa, että analyysijakson luokitteluosa vertaa optimaalista analyysijaksoa analyysijaksomuistiin, ja kun muistin jaksodatassa on analyysijakso, joka sisältää ja asettuu päällekkäin optimaalisen analyysijakson 15 kanssa suhteessa, joka on yhtä suuri tai suurempi kuin ennalta määrätty arvo (joka on määritelty samanlaisella analyysijaksolla), se syöttää samanlaisen analyysijakson analyysijakson käsittelyosan kautta huippuarvon ilmaisuosalle ja vertaa muistin analyysijaksoa analyysijaksoon, joka on yhdistetty kuten alla kuvatulla tavalla, tallentamista varten; kun muistin jaksodatassa taas ei ole mitään sa-20 manlaista analyysijaksoa, analyysijakson luokitteluosa kirjoittaa optimaalisen analyysijakson analyysijakson muistiin. Yhdistetty analyysijakson data sisältää v : optimaalisen analyysijakson ja päälle asetetun osan analyysijaksosta joka on , .· saatu muistidatasta, ja yhdistetyn analyysijakson alempi raja ja ylempi raja ovat ' jomman kumman yllä kuvatun analyysijakson sisällä. Silloin kun moodinasetus- 25 tulo on "TUNNISTUS", analyysijakson käsittelyosa syöttää ennalta määrätyn analyysijakson huippuarvon ilmaisuosaan ja laskee optimaalisen analyysijakson ,·*. huippuarvoa vastaten lasketun jakson lähettämiseksi analyysijakson luokitte luosalle. Analyysijakson luokitteluosa vertaa optimaalista analyysijaksoa ana-, ^ lyysijaksomuistin suhteen. Tuolla hetkellä, kun optimaalisen analyysijakson 30 kanssa samanlainen analyysijakso esiintyy muistissa, luokitteluosa syöttää * t ’;** muistin analyysijakson analyysijakson käsittelyosan kautta huippuarvon ilmai- I suosalle ja lähettää toisen ohjaussignaalin, joka vastaa tunnistettavaa signaalia; jos taas mitään sellaista jaksoa ei esiinny muistissa, ennalta määrätty ana-lyysijakso säilytetään sellaisena kuin se on huippuarvon ilmaisuosan ana- * t ;··’ 35 lyysijaksolle.
* « » 9 116595
Toisaalta äänianalyysiosa analysoi tulevan äänen, joka vastaa sovi-tusosan analyysikäsittelyä, joka puolestaan suorittaa analysoidun tulevan datan sovituskäsittelyn aiemmin rekisteröidyn data kanssa tunnistettu-lähdön saamiseksi. Tuolla hetkellä sovituskäsittelyosaa ohjataan siten, että käsittely suorite-5 taan vain kun ensimmäinen ja toinen ohjaussignaali vastaavat äänisignaalin esiintymistä ja tunnistettavaa signaalia, vastaavasti.
Kuvio 1 on tekniikan tasona olevasta äänenilmaisulaitteesta;
Kuvio 2 on lohkokaavio esillä olevan keksinnön toteutuksessa olevasta äänenilmaisulaitteesta; 10 Kuvio 3 on lohkokaavio toisen esillä olevan keksinnön toteutuksessa olevasta äänenilmaisulaitteesta;
Kuvio 4 on kepstrin ominaiskaavio;
Kuvio 5 on lohkokaavio toisen esillä olevan keksinnön toteutuksessa olevasta äänenilmaisulaitteesta; 15 Kuvio 6 on ajasta riippuva kepstrin ominaiskaavio;
Kuvio 7 on lohkokaavio toisen esillä olevan keksinnön toteutuksessa olevasta äänenilmaisulaitteesta;
Kuvio 8 on lohkokaavio toisen esillä olevan keksinnön toteutuksessa olevasta äänenilmaisulaitteesta; 20 Kuvio 9 on kepstrin ominaiskaavio;
Kuvio 10 on lohkokaavio toisen esillä olevan keksinnön toteutukses- : : ta; I t v, s Kuvio 11 on kepstrin ominaiskaavio, joka kuvaa esillä olevan keksin- : nön toteutuksen toimintaa; : ‘ : 25 Kuvio 12 on lohkokaavio toisen esillä olevan keksinnön toteutukses- Γ\: ta;
Kuvio 13 on lohkokaavio toisen esillä olevan keksinnön toteutukses-
* I
i » i ta; , , Kuvio 14 on lohkokaavio toisen esillä olevan keksinnön toteutukses- 30 ta; ja
Kuvio 15 on lohkokaavio toisen esillä olevan keksinnön toteutukses- ; : ; ta.
Piirroksia tarkastelemalla tullaan tämän jälkeen selittämään esillä olevan keksinnön toteutus.
;·\ 35 Kuviossa 2 esitetään lohkokaavio esillä olevan keksinnön toteutuk- sessa olevasta äänenilmaisulaitteesta. Kuviota 2 tarkastelemalla tullaan selittä- 10 116595 mään laitteen rakenne ja toiminta. Äänisignaali syötetään kepstrin laskenta-osaan 1, joka toimii kepstrin laskentalaitteena, joka puolestaan muodostaa signaalin kepstrin.
Termiä "kepstri", joka saadaan termistä "spektri", symboloi tässä so-5 vellutuksessa c(i), ja se saadaan käänteisellä Fourier-muunnoksella lyhytaikaisen spektrin S(co) logaritmista.
M
c(x) = Σ log! β(ω m) |2 θθε(τω m) 10 m=0 τ:η mittana on aika ja x(aika):aa nimitetään "kefrenssiksi", joka saadaan sanasta "frekvenssi" (taajuus).
Osa kepstristä syötetään keskiarvon laskentaosalle 2, joka toimii 15 keskiarvon laskentalaitteena, joka puolestaan muodostaa kepstrin keskiarvon. Äänenilmaisuosaan 3, joka toimii äänenilmaisulaitteena, syötetään kepstrin las-kentaosalta 1 tuleva kepstri ja kepstrin keskiarvo keskiarvon laskentaosalta 2. Tämän jälkeen äänenilmaisuosa 3 ilmaisee kepstrin huippuarvon, joka on yhtä suuri tai suurempi kuin kesptrin keskiarvo, ilmaisee äänen esiintymisen/puut-20 tumisen huippuarvon avulla, ja kun kepstrin keskiarvon ylittävä kepstri on suurempi kuin kynnysarvon asetusarvo, se muodostaa ääni-ilmaistu-signaalin. Tuol-. la hetkellä kynnysarvon asetusosa 4, joka toimii kynnysarvon asetuslaitteena, muodostaa huippuarvon ohjaussignaalin, jonka arvo on laskettu määritellyn yh-_’t tälön mukaisesti kepstrin keskiarvon perusteella, joka tulee keskiarvon laskenta- ;;; 25 osalta 2, ja määrittelee äänen ilmaisun minimitason äänenilmaisuosassa 3 kepstrin keskiarvon mukaisesti.
Esillä olevan yllä kuvatun toteutuksen mukaisesti laite voi ilmaista tarkasti kepstrin huippuarvon jopa häiriön esiintyessä, mikä siten sallii äänen ilmaisun suorittamisen suurella tarkkuudella.
; 30 Tämä tarkoittaa, että esillä olevalla keksinnöllä on rakenne, joka si- sältää kepstrin laskentaosan kepstrin arvon laskemiseksi äänisignaalista, kes-. ' . kiarvon laskentaosan kepstrin keskiarvon laskemiseksi asetetun kefrenssin jak- sosta, ääneniimaisuosan kepstrin huippuarvon määrittämiseksi ja määritetyn ar-von vertaamiseksi vertailuarvoon äänen esiintymisen/puuttumisen erottelemi-: ‘ : 35 seksi, ja kynnysarvon asetusosan ääneniimaisuosan vertailuarvon asettamiseksi käyttämällä kepstrin keskiarvoa, sillä seurauksella, että kepstrin huippuarvo voi- 11 116595 daan ilmaista tarkasti jopa häiriötä sisältävässä ympäristössä, mikä siten sallii äänen ilmaisun suorittamisen suurella tarkkuudella.
Piirroksia tarkastelemalla tullaan tämän jälkeen selittämään toisen esillä olevan keksinnön toteutus.
5 Kuviossa 3 esitetään lohkokaavio esillä olevan keksinnön toteutuk sessa olevasta äänenilmaisulaitteesta.
Kuviossa 4 esitetään kuviossa 3 olevan kepstrin laskentaosan kepst-ri, joka on esitetty verhokäyrällä todellisuudessa diskreetteihin arvoihin perustuen. Selitetään kuviossa 3 ja 4 esitetyn esillä olevan toteutuksen mukaisen ää-10 nenilmaisulaitteen rakenne ja toiminta. Ensin äänisignaali syötetään kepstrin laskentaosaan 5, joka puolestaan muodostaa kepstrin. Sen jälkeen osa kepstris-tä syötetään keskiarvon laskentaosaan 7, joka puolestaan muodostaa kepstrin keskiarvotason m kefrenssijaksossa a - b, joka on esitetty kuviossa 3. Kepstrin summausosaan 8 syötetään kepstrin laskentaosalta 5 tuleva kepstri ja kepstrin 15 keskiarvo keskiarvon laskentaosalta 7. Sen jälkeen kepstrin summausosa 8 summaa kepstrin arvon, joka on yhtä suuri tai suurempi kuin kepstrin keskiarvo-taso m kefrenssin leveydellä w kefrenssijakson a - b alueella, ja syöttää kepstri-summattu-tuloksen komparaattorille 9. Komparaattorille 9 syötetään kepstri-summattu-tulos kepstrin summausosalta 8 ja asetettu lähtöarvo kynnystason 20 asetusosalta 10, ja kun kepstri-summattu-tulos on suurempi kuin kynnysarvon asetusarvo, se antaa ääni-ilmaistu-signaalin. Tuolla hetkellä kynnysarvon ase-ν' : tusosa 10 laskee kynnysarvon määritellyn yhtälön mukaisesti kepstrin keskiarvo- :V: tason m, joka on esitetty kuviossa 4, mukaisesti, ja syöttää kynnysarvon ase- :' ’ ‘; tusarvon verrattavaksi kepstri-summattu-tuloksen kanssa komparaattoriin 9.
25 Esillä olevan keksinnön mukaisesti, kuten yllä kuvattiin, kepstrin huippuarvo voidaan ilmaista tarkasti ja riippuvuus kepstrin muodosta kepstrin huippuarvon lähellä tulee pienemmäksi siten, että kyky kepstrin huippuarvon ilmaisuun tulee suureksi, mikä siten sallii äänen ilmaisun suorittamisen suurella . . tarkkuudella. Kynnysarvon asettaminen kepstrin keskiarvon mukaiseksi myöskin : 30 sallii äänen ilmaisun suorittamisen riippumatta tulevan signaalin suuruudesta.
Tämä tarkoittaa, että äänenilmaisuosassa sallitaan olevan rakenteen, • joka sisältää kepstrin summausosan kepstrin lisäämiseksi, kun se on suurempi . ··. kuin kepstrin keskiarvo, ja komparaattorin kynnysarvon asetusosalta tulevan ,asetusarvon vertaamiseksi kepstrin summausosalta tulevan summatun tuloksen
> I
'’ 35 kanssa äänen ilmaisun suorittamiseksi, sillä vaikutuksella, että huippuarvon il- maisun riippuvuus kepstrin huippuarvon muodosta tulee vähäisemmäksi, mikä 12 116595 siten sallii äänen ilmaisun suorittamisen suurella tarkkuudella. Vaikutuksena edelleen on, että kynnysarvon asetusarvon määrittäminen kepstrin keskiarvon mukaan sallii äänen ilmaisun suorittamisen riippumatta tulevan signaalin suuruudesta.
5 Piirroksia tarkastelemalla tullaan tämän jälkeen selittämään toisen esillä olevan keksinnön toteutus.
Kuviossa 5 esitetään lohkokaavio äänenilmaisulaitteesta esillä olevan keksinnön toteutuksessa, ja kuviossa 6 esitetään kepstrin laskentaosan 11 lähtevä kepstri. Kuviossa 6 a - b ilmaisee kefrenssijakson, m1 ja mn ovat kepstrin 10 keskiarvoja jaksossa a - b hetkillä t1 ja tn, ja w on huippuarvon ilmaisuleveys. Käyttämällä kuviota 6 tullaan selittämään kuviossa 5 esitetyn toteutuksen rakenne ja toiminta. Ensiksi äänisignaali syötetään kepstrin laskentaosaan 11, joka puolestaa tuottaa kepstrin lähtöarvon. Osa kepstrin lähtöarvosta syötetään keskiarvon laskentaosaan 13, joka puolestaan muodostaa kepstrin keskiarvon kef-15 renssijaksossa a - b, joka on esitetty kuviossa 6. Muistiryhmälle 17, jossa on joukko n muistipaikkoja, syötetään kepstrin keskiarvo keskiarvon laskentaosalta 13, se tallentaa kepstrin keskiarvosta m1 lähtien hetkellä t1 arvot kepstrin keskiarvoon mn saakka hetkellä tn, kuten kuviossa 6 on esitetty, ja syöttää tallennetut arvot kepstrin summausosaan 14. Muistiryhmä 16, jossa on joukko n muisti-20 paikkoja joihin syötetään kepstrin lähtöarvo kepstrin laskentaosalta 11, tallentaa kepstrin arvosta hetkellä t1 arvoon hetkellä tn saakka ja syöttää tallennetut arvot v : kepstrin summausosaan 14. Kepstrin summausosalle 14 syötetään muistilta 16 tuleva kepstri ja kepstrin keskiarvo muistilta 17, se summaa kepstrin arvot jotka ovat suurempia kuin kepstrin keskiarvo kullakin hetkellä hetkestä t1 hetkeen tn 25 saakka ja kefrenssijakson a - b leveydeltä w, kuten kuviossa 6 on esitetty, ja :w syöttää kepstri-summattu-tuloksen komparaattorille 15. Komparaattorille 15 syö- ’···, tetään kepstri-summattu-tulos kepstrin summausosalta 14 ja kynnysarvo- asetettu-arvo, jonka kynnysarvon asetusosa 18 on laskenut, ja kun kepstri-sum-, . mattu-tulos on suurempi kuin kynnysarvo-asetettu-arvo, se lähettää ääni- • · | * 30 ilmaistu-signaalin. Tuolla hetkellä kepstrin keskiarvon mukaisesti hetkien t1 ja tn välillä, jotka on esitetty kuviossa 6, kynnysarvon asetusosa 18 syöttää kynnysar- • ; ‘; vo-asetettu-arvon verrattavaksi kepstri-summattu-tuloksen kanssa komparaatto- .·*·. riin 15. Muistiryhmät 16 ja 17 ovat sellaisessa tilassa, että kun uutta syöttöarvoa syötetään muistiryhmiin, vanha data siirretään seuraavaan muistipaikkaan, siten ; * ·' 35 että useita datoja voidaan aina tarkastella rinnakkaisesti. Esillä olevan yllä kuva- 13 116595 tun toteutuksen mukaisesti kepstrin huippuarvon ajasta riippuvien muutosten tarkastelu sallii tarkemman äänen ilmaisun suorittamisen.
Kuten yllä olevasta selityksestä ilmenee, esillä olevalla keksinnöllä on rakenne, joka sisältää kepstrin laskentaosan kepstrin arvon laskemiseksi ää-5 nisignaalista, keskiarvon laskentaosan kepstrin keskiarvon laskemiseksi asetetun kefrenssin jaksossa, äänenilmaisuosan kepstrin huippuarvon määrittämiseksi ja määritetyn arvon vertaamiseksi vertailuarvoon äänen esiintymisen/puuttu-misen erottamiseksi, ja kynnysarvon asetusosan äänenilmaisuosan vertailuarvon asettamiseksi käyttämällä kepstrin keskiarvoa, sillä vaikutuksella että kepst-10 rin huippuarvo voidaan ilmaista tarkasti jopa häiriötä sisältävässä ympäristössä, mikä siten sallii äänen ilmaisun suorittamisen suurella tarkkuudella.
Tämä tarkoittaa, että äänenilmaisuosalla sallitaan olevan rakenne, joka sisältää ensimmäisen muistiryhmän, joka muodostuu n joukosta kepstrin tallentamista varten, toisen muistiryhmän joka muodostuu n joukosta kepstrin 15 keskiarvon tallentamista varten, kepstrin summausosan kepstrien summaamiseksi kun ne ovat suurempia kuin kepstrin keskiarvo, ja komparaattorin ase-tusarvon, joka tulee kynnysarvon asetusosalta, vertaamiseksi kepstrin sum-mausosalta tulevan summatun tuloksen kanssa, sillä vaikutuksella, että datan akkumulointi ajallisessa sarjassa muistiryhmiin sallii kepstrin ajasta riippuvien 20 muutoksien ilmaisemisen ja tarkemman äänen ilmaisemisen suorittamisen.
Piirroksia tarkastelemalla tullaan tämän jälkeen selittämään toisen :: esillä olevan keksinnön toteutus.
: V: Kuviossa 7 esitetään lohkokaavio toisen esillä olevan keksinnön mu- : ' : kaisessa toteutuksessa olevasta äänenilmaisulaitteesta.
. ' . 25 Piirrosten mukaisesti tullaan selittämään laitteen rakenne ja toiminta.
: *, ·. Ensiksi tuleva ääni syötetään kepstrin laskentaosaan 71, joka toimii kepstrin las- ’, kentalaitteena, joka puolestaan tuottaa kepstrin. Kepstri syötetään huippuarvon ilmaisuosaan 72, joka toimii huippuarvon ilmaisulaitteena, joka puolestaan antaa , , kepstrin huippuarvon analyysijaksossa, jota analyysin asetusosa 73 ohjaa. Ää- : 30 nenilmaisuosa 74, joka toimii äänen ilmaisulaitteena, vertaa kepstrin huippuar- voa ennalta määrättyyn kynnysarvoon, ja kun se ilmaisee tulevan signaalin ole- van ääni, se antaa ääni-ilmaistu-signaalin. Tuolla hetkellä analyysijakson ase- .·*·. tusosa 73, joka toimii analyysijakson asetuslaitteena, johtaa analyysijakson ; huippuarvon ilmaisuosaan 72, ja analyysijakson asetusosaa 73 ohjataan toimin- ’ · · · ’ 35 tamoodin asetussignaalilla alla kuvattavalla tavalla. Ensiksi ensimmäisessä toi- :’ i mintamoodissa analyysijakson asetusosa 73 ohjaa ennalta määrätyn kefrenssi- 14 116595 analyysijakson huippuarvon ilmaisuosaan 72 ja asettaa kefrenssianalyysijakson, joka ohjataan huippuarvon ilmaisuosaan 72 toisessa toimintamoodissa kepstrin huippuarvon ohjaama, joka saadaan huippuarvon ilmaisuosalta 72. Sen jälkeen toisessa toimintamoodissa analyysijakson asetusosa 73 ohjaa analyysijakson, 5 joka on asetettu ensimmäisen toimintamoodin aikana, huippuarvon ilmaisuosaan 72.
Siirtymä ensimmäisestä moodista toiseen moodiin voidaan suorittaa joko manuaalisen toiminnan moodinasetussignaalilla, tai muodostamalla automaattisesti toimintamoodin asetussignaali sen jälkeen, kun määrätty aika on kulo lunut tai määrätty määrä äänenilmaisusignaaleja on lähetetty.
Yllä kuvatun esillä olevan toteutuksen mukaisesti huippuarvon analyysijakson asetus voidaan asettaa aiemmin siten, että analyysijakso kepstrin huippuarvon määrittämiseksi voidaan kaventaa käsittelynopeuden parantamiseksi. Myöskin ilmaistavan kepstrin huippuarvon alue ilmaistaan ensimmäisessä 15 toimintamoodissa, ja puhuja kaventaa sitä, mikä siten sallii tarkan äänen ilmaisun samalle ilmaistavalle puhujalle. Edelleen havaitaan, että vaikka ääni on väliaikaisesti päällekkäin toisen ääni/häiriösignaalin kanssa, ilmaistavan kepstrin huippuarvon alue tulee kaventaa, mikä siten sallii tarkan äänen ilmaisun suorittamisen.
20 Tämä tarkoittaa, mikä on ilmeistä yllä olevasta selityksestä, että esillä oleva keksintö sisältää kepstrin laskentalaitteen tulevan äänen kepstrin laske-v : mistä varten, huippuarvon ilmaisulaitteen kepstrin laskentalaitteen lähtevän ; V: kepstrin huippuarvon ilmaisemista varten, analyysijakson asetuslaitteen ana- lyysijakson asettamiseksi huippuarvon ilmaisulaitteen huippuarvo-ilmaistu-25 lähdön ja toimintamoodin asetussignaalin avulla, ja äänenilmaisuosan, johon : v. huippuarvon ilmaisulaitteen huippuarvo-ilmaistu-lähtösignaali syötetään, ja huip- '···. puarvon ilmaisulaitteen huippuarvon ilmaisjaksoa ohjataan analyysijakson ase tuslaitteen asettamalla lähtöarvolla siten, että kepstrin huippuarvon analyysijak- , , so voidaan aiemmin asettaa optimaalisesti ja kaventaa moodia siirtämällä, mikä * · · · : 30 siten sallii kepstrin huippuarvon määrittämiseksi tarvittavan käsittelyn nopeuden '···' parantamisen. Myöskin kepstrin huippuarvon, joka ilmaistaan puhujan mukai- • sesti, alueen kaventaminen sallii tarkan äänen ilmaisun suorittamisen samalle puhujalle. Edelleen analysoitavan kepstrin huippuarvo kaventuu jopa, kun ääni , on asetettu päällekkäin häiriön kanssa, mikä siten sallii erittäin tarkan äänen il- ‘; · ‘ 35 maisun suorittamisen ja erinomaisen käytettävyyden saavuttamisen.
» · ·
I I
15 116595
Piirroksia tarkastelemalla tullaan tämän jälkeen selittämään eräs esillä olevan keksinnön toteutus.
Kuvion 8 mukaisesti tullaan selittämään laitteen rakenne ja toiminta. Ensiksi kepstrin laskentaosa 75 muodostaa kepstrin tulevasta äänestä ja syöt-5 tää kepstrin huippuarvon ilmaisuosalle 76. Huippuarvon ilmaisuosa 76 ilmaisee kepstrin huippuarvon syötetystä kepstristä, ja sitä ohjataan sillä tavoin että kepstrin laskentaosalta 75 syötetyn kepstrin huippuarvoilmaisun leveyttä ohjataan käyttämällä kefrenssijakson dataa, joka saadaan toisen kytkimen 712 läpi jaksodatan muistiosalta 711. Äänenilmaisuosa 714 suorittaa äänen ilmaisun 10 kepstrin huippuarvosta, joka saadaan huippuarvon ilmaisuosalta 76, ennalta määrätyn kynnysarvon perusteella, ja ilmaistessaan tulevan signaalin olevan ääni, se lähettää ääni-ilmaistu-signaalin. Tuolla hetkellä jaksodatan asetusosa 78 asettaa kefrenssijakson ilmaistavaksi kepstrin huippuarvon perusteella, joka saadaan huippuarvon ilmaisuosalta 76. Jaksodata, joka on asetettu jaksodatan 15 asetusosalta 78, kirjoitetaan ensimmäiseen muistiryhmään 79 kytkemällä ensimmäinen kytkin 713 pois päältä ohjausosalta 77 tulevalla ohjaussignaalilla toimintamoodin ohjaamana. Ohjausosa 77 ohjaa, kuten yllä on kuvattu, ensimmäistä kytkintä 713 ja ohjaa myös toista kytkintä 712 toimintamoodin ohjaamana. Toista kytkintä 712 ohjataan sillä tavoin, että kytkin yhdistetään ensimmäi-20 seen muistiryhmään 79 silloin kun ensimmäinen kytkin 713 on pois päältä, ja se yhdistetään toiseen muistiryhmään 710 kun ensimmäinen kytkin 713 on päällä. : Jaksodatan muistiosan 111 ensimmäisen muistiryhmän 79 ja toisen muistiryh- : män 710 jaksodata syötetään toisen kytkimen 712 läpi huippuarvon ilmaisuosal- : : le 76 analyysijakson datana toimintamoodin ohjaamana. Jaksodata on aiemmin ' ’. 25 asetettu toisessa muistiryhmässä 710.
: \ . Kuviota 9 tarkastelemalla jaksodata, joka on syötetty huippuarvon il- ‘ · ·. maisuosaan 76, tullaan selittämään yksityiskohtaisesti tämän jälkeen.
Kepstrin laskentaosalta 75 saatu kepstri on esitetty kuviossa 9, ja se , , on esitetty verhokäyrällä todellisuudessa diskreeteistä arvoista. Vertailusymboli • # · : 30 p ilmaisee kepstrin huippuarvon kefrenssin, aO - bO ilmaisee analyysijakson, jo- ' ka on aiemmin tallennettu toiseen muistiryhmään 710, ja a1 - b1 ilmaisee ana- : lyysijakson joka on tallennettu ensimmäiseen muistiryhmään 79. Tulevalla ää- ; . neliä kepstrin huippuarvo sijoittuu kefrenssin kohtaan p, kuten kuviossa 9 on esi tetty.
I » ; 35 Ensiksi tarkastellaan tapausta, jossa ensimmäisen moodin aikana : . toinen kytkin 712 on kytketty toiseen muistiryhmään 710, ja ensimmäinen kytkin 16 116595 713 on kytketty ensimmäiseen muistiryhmään. Tuossa tapauksessa, tulevan äänen esiintyessä, koska toinen kytkin 712 on kytketty toiseen muistiryhmään 710, huippuarvon ilmaisuosa 76 määrittää kepstrin huippuarvon toisen muistin sisällön jaksodatassa aO - bO, ja saa kepstrin huippuarvon kefrenssin p. Jakso-5 datan asetusosa 78 valitsee, käyttämällä kefrenssiä p, joka on huippuarvon il-maisuosalla 76 saatu kepstrin huippuarvo, arvon lähellä kefrenssiä p jaksodatan a1 - b1 määrittämiseksi, ja tallentaa jaksodatan a1 - b1 ensimmäisen kytkimen 713 läpi ensimmäiseen muistiryhmään 79. Sen jälkeen, tarkastelemalla tapausta, jossa toisessa toimintamoodissa toinen kytkin 712 on kytketty ensimmäiseen 10 muistiryhmään 79, ja ensimmäinen kytkin 713 on pois päältä. Tuossa tapauksessa, koska toinen kytkin on kytketty ensimmäiseen muistiryhmään 79, huippuarvon ilmaisuosa 76 ilmaisee kepstrin huippuarvon ensimmäisen muistin jaksodatassa a1 - b1, joka on kuvattu kuviossa 7.
Esillä olevan toteutuksen mukaisesti, kuten yllä kuvattiin, kepstrin 15 huippuarvon analyysijakso on aiemmin asetettu muistiin tallennettavaksi siten, että optimaalinen kepstrin huippuarvon analyysijakso voidaan aina tuottaa, ja nollaus kapeammalle analyysijaksolle ilmaistun tuloksen mukaisesti, mikä siten sallii käsittelyajan lyhentämisen ja äänen ilmaisun suorittamisen suurella tarkkuudella häiriön eston suhteen. Huomataan myös, että kun analyysijakso on 20 kerran asetettu, analyysijakso on aina voimassa, mikä siten sallii tehokkaan ää-nenilmaisukäsittelyn suorittamisen erinomaisella käytettävyydellä, v : Muistiryhmiä ei rajoiteta kahteen joukkoon, ja mitään ongelmaa ei • esiinny, vaikka lisäjoukko lisätään tarvittaessa ryhmiin, joista joukkoa käytetään :' : selektiivisesti.
25 Tämä tarkoittaa, että edellisen esillä olevan keksinnön analyysijakson :v. asetuslaitteen sijasta esillä oleva keksintö sisältää jaksodatan asetuslaitteen, ’···, useita muistiryhmiä, ensimmäisen kytkimen jaksodatan kytkemiseksi ensimmäi seen muistiin, toisen kytkimen jaksodatan valitsemiseksi muistiryhmistä ja datan , . syöttämiseksi huippuarvon ilmaisuosalle, ja ohjausosan ensimmäisen ja toisen 30 kytkimen ohjaamiseksi toimintamoodin ohjaamana siten, että kepstrin ana-’ · * ' lyysijakso kapenee ennalta määrätyn analyysijakson ja tulosignaalin ohjaamana : samalla tavoin kuin edellisessä esillä olevassa keksinnössä, ja muistiryhmien • · · · . ‘ . määrän kasvu sallii analyysijakson asettamisen useilla tavoilla.
Kuviossa 10 esitetään lohkokaavio toisen esillä olevan toteutuksen ··’ 35 äänenkäsittelylaitteesta. Kuten kuviossa 10 on esitetty, kepstrin laskentaosa 81 . ‘i laskee tulevan äänen kepstrin ja syöttää lasketun kepstrin huippuarvon ilmai- 17 116595 suosaan 82, ja huippuarvon ilmaisuosa 82 ilmaisee kepstrin huippuarvon ana-lyysijaksossa, joka on syötetty analyysijakson asetusosalta 84, ja se syöttää huippuarvon äänenilmaisuosalle 83 ja äänijakson asetusosalle 84. Äänenil-maisuosa 83 ilmaisee äänen esiintymisen/puuttumisen kepstrin huippuarvosta, 5 joka on syötetty huippuarvon ilmaisuosalta 82, ääni-ilmaistu-lähtöarvon saamiseksi. Äänijakson asetusosa 84 laskee optimaalisen analyysijakson kepstrin huippuarvon ohjaamana, joka on syötetty huippuarvon ilmaisuosalta 82, ja syöttää lasketun arvon analyysijakson luokitteluosaan 85, ja syöttää edelleen analyysijakson datan, joka on syötetty analyysijakson muistista 86, analyysijakson 10 luokitteluosan 85 toimesta moodinasetustulon ohjaamana, tai ennalta määrätyn analyysijakson datan huippuarvon ilmaisuosalle 82. Analyysijakson luokitteluosa 85 vertaa optimaalista analyysijakson dataa analyysijakson dataan, joka on tallennettu analyysijakson muistiin 86, luokittelukäsittelyn suorittamiseksi ja tallentaa datan analyysijakson muistiin 86 moodinasetustulon ohjaamana tai lukee 15 datan analyysijakson muistista 86 analyysijakson ohjaamista varten.
Selitetään rakenteeltaan yllä olevan kaltaisen laitteen toiminta.
Tuleva ääni lasketaan sen kepstristä kepstrin laskentaosalla 81, ilmaistaan sitten kepstrin huippuarvon osalta huippuarvon ilmaisuosalla 82, ilmaistaan sitten äänen esiintymisen/puuttumisen osalta äänenilmaisuosalla 83, ja lähete-20 tään ääni-ilmaistu-signaalina. Tuolla hetkellä huippuarvon ilmaisuosa 82 toimii sillä tavoin, että osa 82 määrää kefrenssin kepstrin huippuarvon määrittämiseksi v : analyysijakson mukaisesti, joka on syötetty äänijakson asetusosalta 84, huippu- :V: arvon ilmaisun suorittamiseksi. Kuviota 11 tarkastelemalla tullaan tämän jälkeen selittämään analyysijakson asetusosan 84, analyysijakson luokitteluosan 85 ja 25 analyysijakson muistin 86 toiminta. Keps-trin laskentaosan määrittämä kepstri on :v. esitetty kuviossa 11, jossa ordinaatan akseli edustaa kepstrin tasoa ja abskissa ’ · · ·, esittää kepstriä. Viitesymbolit p1 ja p2 osoittavat kefrenssiarvot, jotka on määrätty huippuarvon ilmaisuosalla 82, ja jaksot aO - bO, a2 - b2 ja a3 - b3 osoittavat ana- . , lyysijaksoja, jotka on lähetetty analyysijakson asetusosasta 84, analyysijakson < * · ·’·; : 30 muistista 86 ja analyysijakson luokitteluosalta 85, vastaavasti. Ensiksi, kun moo- ' * · · ‘ din asetustulo on tilassa "REKISTERÖINTI", analyysijakson asetusosa 84 syöttää j leveimmän analyysijakson aO - bO huippuarvon tunnistusta varten huippuarvon * * * * : ilmaisuosaan 82, ja kepstri, jonka huippuarvo on kefrenssillä p1, joka on osoitettu ehjällä viivalla kuviossa 11, tulevan äänen ohjaamana, saadaan huippuarvon il-·*! 35 maisuosasta 82. Analyysijakson asetusosa 84 laskee optimaalisen analyysijak- •i son a3 - b3, joka on kapeampi kuin analyysijakso aO - bO, kefrenssin p1 suhteen, 18 116595 ja syöttää lasketun jakson analyysijakson luokitteluosaan 85. Analyysijakson luokitteluosa 85 vertaa optimaalista analyysijaksoa analyysijakson muistin 86 sisältämään analyysijaksoon, ja kun analyysijaksoa, joka sisältää optimaalisen analyysijakson, jonka osuus on yhtä suuri tai suurempi kuin ennalta määrätty arvo 5 (joka määritellään samanlaiseksi analyysijaksoksi), ei esiinny, se tallentaa optimaalisen analyysijakson a3 - b3 analyysijakson muistiin 86, kun taas silloin kun analyysijakso esiintyy, se korvaa samanlaisen analyysijakson yhdistetyllä alla kuvattavalla analyysijaksolla, ja tallentaa yhdistetyn analyysijakson. Yhdistetty analyysijakso on analyysijakso, joka sisältää päällekkäin asetetun optimaalisen ana-10 lyysijakson ja muistin analyysijakson muodostaman yhdistetyn analyysijakson, ja jonka alemmat ja ylemmät rajat sisältyvät kumpaankin yllä kuvatuista jaksoista.
Sen jälkeen, kun moodin asetukseksi tulee "TUNNISTUS" analyysijakson a3 - b3 ollessa tallennettuna muistiin, analyysijakson asetusosa 84 syöttää ennalta määrätyn jakson aO - bO tai muistin analyysijakson, joka on le-15 veämpi kuin aO - bO, huippuarvon ilmaisuosalle 82.
Nyt olettamalla, että kepstri, jolla on huippuarvo kefrenssillä p1, saadaan tulevan äänen seurauksena, kuten katkoviivalla kuviossa 11 on esitetty, huippuarvon ilmaisuosalta 82, analyysijakson asetusosa 84 laskee analyysijakson a3 - b3 p1:n ohjaamana, analyysijakson luokitteluosa 85 tarkistaa ana-20 lyysijakson esiintymisen, joka on samanlainen kuin analyysijakso a3 - b3 analyysijakson muistissa 86, ja koska jakso esiintyy tuossa tapauksessa, huippuar-.·' : von ilmaisuosalle 82 syötetään analyysijakso a3 -b3 muistista 86. Tuolla hetkel- V: lä, koska analyysijakso on rajoitettu lähellä huippua olevaan arvoon, huippuar- von ilmaisu huippuarvon ilmaisuosalla 82 voidaan käsitellä suurella nopeudella.
• '*·; 25 Kun tuleva ääni, jolla on huippuarvo kefrenssillä p2, esiintyy, analyysijakson ase- ;v. tusosa 84 laskee optimaalisen analyysijakson a2 - b2, analyysijakson luokitte- luosa 85 tarkistaa jakson, joka on samanlainen kuin optimaalinen analyysijakso ja koska jaksoa ei esiinny tuossa tapauksessa, analyysijaksona, joka syötetään , . huippuarvon ilmaisuosalle 82, säilyy aO - bO.
* · · : 30 Esillä olevan yllä kuvatun keksinnön toteutusten mukaisissa äänen käsittelylaitteissa analyysijakso useiden puhujien äänestä luokitellaan ryhmään : tai yksittäiseksi, kun "REKISTERÖITY", jolloin analyysijakso huippuarvon ilmai- . · ·1. sulle voidaan määritellä ja asettaa tunnistettaessa. Näin ollen äänen ilmaisu voi daan käsitellä suurella nopeudella ja analyysijakso luokitellaan ja määritellään, *· 35 jolloin toiminta voidaan suorittaa tehokkaasti häiriön eston suhteen, kun kepstrin ‘ ·: huippu ilmaistaan, ja tarkka äänen ilmaisu voidaan suorittaa.
19 116595
Kuten yllä olevista toteutuksista on ilmeistä, esillä olevan keksinnön signaalinkäsittelylaitteella on rakenne, joka sisältää analyysijakson asetusosan optimaalisen analyysijakson laskemiseksi huippuarvon ilmaisuosan antaman lähtevän huippuarvon ohjaamana, ja analyysijakson syöttämiseksi moo-5 dinasetustulon ohjaamana huippuarvon ilmaisuosalle, ja analyysijakson luokitteluosan optimaalisen analyysijakson luokittelemiseksi, joka on laskettu analyysijakson asetusosalla, ja analyysijakson tallennettuna analyysijakson muistiin jonoon; ja sillä on vaikutuksena, että koska useiden puhujien ääni, joka ei rajoitu yksittäiseen ääneen, luokitellaan ja kepstrin huipun analyysijakso asetetaan 10 ryhmittäin tai yksittäin rekisteröitäessä, jolloin kepstrin huippuarvon analyysijakso tunnistettaessa voidaan määritellä suorittamaan suurinopeuksinen käsittely. Laitteella on myös sellainen toinen erinomainen vaikutus, että analyysijakso luokitellaan ryhmiin tai yksittäin, jolloin jopa häiriön esiintyessä ilmaistaessa kepstrin huippuarvoa saadaan erittäin hyvä äänenilmaisutoiminta, mikä sallii tarkan ää-15 nen ilmaisun suorittamisen.
Kuviota 12 tarkastellen tullaan tämän jälkeen selittämään toisen esillä olevan keksinnön toteutus.
Kuten kuviossa 12 on esitetty, tehonlaskentaosalle 91 syötetään tuleva ääni, se laskee sen tehon ja syöttää lasketun tehon S/N-laskentaosaan 94. 20 Kepstrin laskentaosalle 92 syötetään myös tuleva ääni, se laskee kepstrin ja syöttää kepstrin huippuarvon ilmaisuosalle 93. Huippuarvon ilmaisuosa 93 ilmai-: : see kepstrin huippuarvon ja syöttää huippuarvon S/N-laskentaosalle 94 ja ää- v nenilmaisuosalle 95. Äänenilmaisuosa 95 ilmaisee äänen esiintymisen/ puuttu- ’': misen huippuarvon ilmaisuosan 93 kepstrin huipusta ja syöttää tuloksen AND- 25 osalle 96. S/N-laskentaosalle 94 syötetään teho tehonlaskentaosalta 91 ja I · kepstrin huippuarvo huippuarvon ilmaisuosalta 93, ja se laskee S/N-suhteen .··. syötetystä datasta ja syöttää lasketun tuloksen parempi/heikompi-tuloksen las ketusta tuloksesta määriteltynä arvona AND-osalle 96. AND-osa 96 on raken-, . nettu silla tavoin, että se ottaa loogisen tulon äänenilmaisuosalta 95 ja S/N- ;;;,: 30 laskentaosalta syötetyistä signaaleista kytkimen 97 ohjaamiseksi.
‘ ’ Selitetään yllä olevan rakenteen mukaisen laitteen toiminta.
: Tulevasta äänisignaalista lasketaan sen teho tehonlaskentaosalla 91 ja siitä ilmaistaan kepstrin huippuarvo kepstrinlaskentaosalla 92 ja huippuarvon ilmaisuosalla 93. Äänenilmaisuosa 95 ilmaisee kepstrin huippuarvoa käyttämällä 35 äänisignaalin esiintymisen/puuttumisen ja syöttää äänisignaalin esiintymis-': tä/puuttumista osoittavan signaalin AND-osalle 96. Käyttämällä äänisignaalin tu- 20 116595 lotehoa, joka saadaan tehoniaskentaosalta 91, ja kepstrin huippuarvoa, joka saadaan huippuarvon ilmaisuosalta 93, S/N-laskentaosa 94 laskee tulevan äänisignaalin S/N-suhteen, ilmaisee onko S/N-suhde yhtä suuri tai suurempi kuin määritelty arvo, tai pienempi kuin määritelty arvo, ja syöttää ilmaistun signaalin 5 AND-osalle 96. AND-osa 96 toimii siten että osa 96, vain kun se saa signaalin, joka osoittaa, että tulevan äänisignaalin S/N-suhde on yhtä suuri tai suurempi kuin määritelty arvo joka saadaan S/N-laskentaosalta 94, ja kun se saa signaalin, joka ilmaisee, että ääni esiintyy äänen ilmaisulta 95 äänisignaalitulossa, syöttää signaalin kytkimen 97 kääntämiseksi päälle kytkimeen 7 ja sallii tulevan ää-10 nisignaalin läpäistä, jotta saadaan lähtevä äänisignaali.
Esillä olevan keksinnön toteutuksen signaalinohjauslaitteen mukaisesti tulokseksi saadaan, että lähtevä äänisignaali saadaan vain kun ääni esiintyy äänisignaalin tulossa ja sen S/N-suhde on hyvä, joten äänisignaalin tulon häiriöteho on suuri, lähtevää äänisignaalia ei saada. Toisena ilmiönä on myös, 15 että saadulla lähtevällä äänisignaalilla on hyvä S/N-suhde, jolloin kun lähtevä äänisignaali syötetään äänentunnistuslaitteeseen ja vastaavaan, voidaan saada hyvä tulos. Silloin esillä olevaa keksintöä voidaan soveltaa muuhunkin signaalin kuin äänisignaaliin.
Tämä tarkoittaa yllä olevassa toteutuksessa, että esillä oleva keksintö 20 sisältää S/N-laskentaosan S/N-suhteen laskemiseksi tulevan signaalin tehoi-neen ja kepstrin huippuineen, ja signaalinilmaisuosan signaalin ilmaisemiseksi : tulevan signaalin kepstrin huippuarvosta, ja sillä on rakenne, jossa on AND-osa ’: loogisen tulon ottamiseksi S/N-laskentaosalta tulevasta S/N-suhteesta ja signaa- :" ’: linilmaisuosalta tulevasta ilmaistusta lähtöarvosta, se syöttää signaalin kytkimen ; ‘ ‘ *. 25 ohjaamiseksi ja ohjaa tulevan signaalin läpikulkua lähtevän signaalin saamisek- : v, si, jolloin vain signaalin esiintyessä tulossa ja kun sen S/N-suhde on hyvä, lähte- ’ ·. vä signaali voidaan lähettää.
Näin ollen saadaan ilmiö, että jos tulevan signaalin häiriöteho on suu-, . ri, lähtevää signaalia ei lähetetä. Vaikutuksena on myös, että koska saadun läh- I · : 30 tevän signaalin S/N-suhde on hyvä, hyvä tulos voidaan saada kun lähtevä sig- ‘ : naali syötetään äänentunnistuslaitteeseen ja vastaavaan.
| : ‘: Kuviota 13 tarkastelemalla tullaan tämän jälkeen selittämään toisen I i i # esillä olevan keksinnön toteutuksen signaalinohjauslaite. Toteutus on samanlainen kuin kuviossa 12.
t I * ···* 35 Kuviossa 13 laite on rakennettu siten, että komparaattori 913 vertaa
= I
’ i tehoniaskentaosalta 98 tulevaa tehoa tulevaan vertailusignaaliin ja syöttää ver- 21 116595 ratun tuloksen AND-osaan 114. AND-osa 114 ottaa loogisen tulon äänenil-maisuosalta 912, S/N-laskentaosalta ja komparaattorilta 913 syötetyistä signaaleista kytkimen 915 ohjaamista varten.
Selitetään laitteen, jolla on yllä kuvattu rakenne, toiminta.
5 Tehonlaskentaosa 98 laskee tulevan äänisignaalin tehon ja sen jäl keen komparaattori 913 ilmaisee, onko teho yhtä suuri tai suurempi kuin määritelty arvo, tai pienempi kuin määritelty arvo, ja syöttää ilmaistun signaalin AND-osalle 114. Kepstrin laskentaosa 99 ilmaisee huippuarvon ilmaisuosan 910 avulla tulevan äänisignaalin kepstrin huippuarvon. Kepstrin huippuarvoa käyttämällä 10 äänenilmaisuosa 912 ilmaisee äänisignaali esiintymisen/puuttumisen ja syöttää signaalin, joka ilmaisee äänisignaalin esiintymistä/puuttumista osoittavan signaalin AND-osalle 114. Käyttämällä äänisignaalin tulotehoa, joka saadaan te-honlaskentaosalta 98, ja kepstrin huippuarvoa, joka saadaan huippuarvon ilmai-suosalta 910, S/N-laskentaosa 911 laskee S/N-suhteen, joka on yhtä suuri tai 15 suurempi kuin määritelty arvo, ja syöttää ilmaistun signaalin AND-osalle 114. AND-osa 114 toimii siten, että vain kun tuo osa saa signaalin, joka osoittaa, että äänisignaalin tuloteho on yhtä suuri tai suurempi kuin komparaattorilta 913 tuleva määritelty arvo, signaalin, joka osoittaa, että tulevan äänisignaalin S/N-suhde on yhtä suuri tai suurempi kuin S/N-laskentaosalta 911 tuleva määritelty arvo, ja 20 edelleen signaalin, joka ilmaisee, että ääni esiintyy äänenilmaisuosalta 912 tulevassa äänisignaalitulossa, tuo osa syöttää signaalin kytkimen 915 kytkemiseksi : päälle kytkimeen 915, sallii tulevan äänisignaalin mennä läpi ja muodostaa läh- tevän äänisignaalin. Yllä kuvatun esillä olevan keksinnön toteutuksen mukaisesti : lähtevä äänisignaali voidaan lähettää vain kun ääni esiintyy äänisignaalin tulos- “; 25 sa, S/N-suhde on hyvä ja tarpeeksi tehoa on käytettävissä. Näin ollen laitteella on vaikutus, että ääni, jossa on riittävästi tehoa ja hyvä S/N-suhde saadaan läh-**·, teväksi äänisignaaliksi. Myöskin, koska myös teho ilmaistaan, äänen tulostatus voidaan ilmaista, ja esimerkiksi käyttämällä toteutuksen signaalinohjauslaitetta äänen tunnistukseen, se sallii signaalin, jolla on hyvä puhestatus, erityisesti hyvä : 30 puhujan ääntämistaso, valitsemisen, mikä samalla aiheuttaa paremman tulok- ’·.'* sen saamisen.
j Tämä tarkoittaa, että laite rakennetaan tavalla, jossa se sisältää , ' *. komparaattorin signaalin tulotehon vertaamiseksi määrätyn arvon kanssa ja kyt- ’·, kimen ohjaamiseksi ottamalla looginen tulo S/N-laskentaosan lähtevästä S/N- 1 t ‘’ 35 suhteesta, jolloin vain kun signaali esiintyy signaalitulossa, S/N-suhde on hyvä ja : '! teho on riittävä, lähtevä signaali voidaan tuottaa. Näin ollen laite aiheuttaa, että 22 116595 saadaan signaali, jolla on riittävä teho ja hyvä S/N-suhde. Myöskin, koska myös teho ilmaistaan, äänen tulostatus voidaan ilmaista ja signaali, jolla on hyvä pu-hestatus, erityisesti hyvä puhujan ääntämistaso, voidaan valita, joka samalla aiheuttaa, että kun käytetään esillä olevan keksinnön mukaista signaalinohjauslai-5 tetta äänentunnistuslaitteessa ja vastaavassa, saadaan hyvä tulos.
Kuviota 14 tarkastelemalla tullaan tämän jälkeen selittämään toisen esillä olevan keksinnön toteutus.
Kuvio 14 on lohkokaavio toisen esillä olevan keksinnön toteutuksessa olevasta signaalinkäsittelylaitteesta. Kuviota 14 käyttämällä alla tullaan selittä-10 mään laitteen rakenne. Kepstrin laskentaosa 101 laskee kepstrin tulevasta äänestä ja syöttää kepstrin huippuarvon ilmaisuosalle 102. Huippuarvon ilmai-suosa 102 ilmaisee kepstrin huippuarvon ja syöttää huippuarvon ohjausosalle 103 ja äänenilmaisuosalle 106. Äänenilmaisuosa 106 ilmaisee äänen esiintymi-sen/puuttumisen kepstrin huippuarvosignaalista, joka on syötetty huippuarvon 15 ilmaisosalta 102, ja syöttää ensimmäisen ohjaussignaalin sovitusosalle 107. Ohjausosa 103 syöttää kepstrin huippuarvosignaalin, joka on syötetty huippuarvon ilmaisosalta 102, huippuarvomuistiin 104 moodinasetustulos mukaisesti, ja käyttämällä huippuarvomuistista 104 syötettyä dataa, se lähettää toisen ohjaussignaalin sovitusosalle 107. Huippuarvomuisti 104, joka tallentaa kepstrin huippu-20 arvosignaalin huippuarvon ilmaisuosalta 102, tallentaa ja lukee dataa ohjausosan 103 kautta. Äänianalyysiosa 105 analysoi tulevan signaalin dataformaat-: tiin, jota käytetään sovitusosassa 107, ja syöttää analysoidun signaalin sovi- v tusosalle 107. Sovitusosalle 107 syötetään analysoitu signaali äänianalyysiosal- ta 105 ja ensimmäinen ja toinen ohjaussignaali äänenilmaisuosalta 106 ja ohja-."': 25 usosalta 103, ja ohjaussignaalien ohjaamana se tarkistaa analysoidun signaalin, . r t ; v, joka syötetään äänianalyysiosalta 105, mallin suhteen tunnistettu-lähdön saami- ,···, seksi.
Selitetään laitteen, jonka rakenne on yllä olevan kaltainen, toiminta. , . Ensiksi, kun moodinasetustulo on "REKISTERÖINTI", kepstrin laskentaosa 101 * I ♦ *;;/ 30 laskee kepstrin tulevasta äänestä, sen jälkeen äänenilmaisuosa 102 ilmaisee * *; · ‘ kepstrin huippuarvon, syöttää huippuarvon ohjausosalle 103 ja tallentaa sitten ; huippuarvon ohjausosan 103 kautta huippuarvomuistiin 104. Sen jälkeen ohja- j * * * j usosa 103 syöttää toisen ohjaussignaalin sovituskäsittelyn estämiseksi sovi- tusosalle 107. Sen jälkeen, kun moodinasetustulo on "TUNNISTUS", kepstrin ';·*[ 35 laskentaosa 101 laskee samalla tavoin tulevan äänen kepstrin ja sen jälkeen > huippuarvon ilmaisuosa 102 ilmaisee kepstrin huippuarvon. Sen jälkeen ää- 23 116595 nenilmaisuosa 106 ilmaisee äänen esiintymisen/puuttumisen huippuarvon ilmai-suosalta 102 tulevan kepstrin huippuarvosignaalin esiintymisen/puuttumisen perusteella, ja kun ääni esiintyy, se syöttää ensimmäisen ohjaussignaalin sovitus-prosessin suorittamiseksi sovitusosalle 107, kun taas äänen puuttuessa se syöt-5 tää ensimmäisen signaalin sovitusprosessin estämiseksi sovitusosalle 107. Samaan aikaan ohjausosa 103 vertaa huippuarvon ilmaisuosalta 102 tulevaa huippuarvosignaalia huippuarvomuistiin 104 aiemmin tallennettuun sisältöön, ja kun molempien kefrenssiarvot ovat lähellä toisiaan, se syöttää toisen signaalin sovituskäsittelyn suorittamista varten sovitusosalle 107, kun taas molempien 10 kefrenssiarvot eivät ole lähellä toisiaan, se syöttää toisen signaalin sovituskäsittelyn estämistä varten sovitusosalle 107. Sen jälkeen sovitusosa 107, kun sekä ensimmäinen että toinen signaali, jotka on syötetty äänenilmaisuosalta 106 ja ohjausosalta 103 ovat niitä, joilla sovituskäsittely suoritetaan, se vertaa ääniana-lyysiosalta 105 tulevaa analysoitua signaalia mallin dataan tunnistuskäsittelytoi-15 minnan suorittamiseksi, ja lähettää tuloksen tunnistettu-lähtösignaalina.
Yllä kuvatun esillä olevan keksinnön toteutuksen signaalin käsittelylaitteen mukaisesti, vain kun tulevan äänen kepstrin huippuarvon kefrenssi, eli puhujan äänitaajuus, on lähellä aiemmin rekisteröityä taajuutta, suoritetaan sovi-tusprosessointi mallin kanssa siten, että kun syötetään muu kuin rekisteröidyn 20 puhujan tuleva ääni, sovitusprosessointia ei suoriteta, mikä samalla sallii sovi-tusosan sovitusprosessoinnin tarvitseman prosessointiajan eliminoimisen, eli :, ·' kun syötetään muu kuin rekisteröidyn puhujan ääni, hylkäävä tulos annetaan vä- : : littömästi.
Edelleen, kun laite on rakennettu mikroprosessorin tai vastaavan : : 25 avulla, sovitusprosessoinnin käsittely voidaan pitää minimissään, jolloin CPU:n : v. kuormaa voidaan vähentää ja varata vähennetty osa toiselle prosessointikäsitte- .’···, lylle.
Havaitaan myös, että antamalla ulos tulos, sellainen kuin tunnistettu-. , lähtösignaali, se että tulosignaali on erilainen kuin rekisteröidyllä puhujalla, voi- I » t :: : 30 daan helposti suorittaa käyttämällä ohjausosan 103 ohjaussignaalia.
Kuten yllä olevasta toteutuksesta on ilmeistä, esillä olevalla keksin-j nöllä on rakenne, joka sisältää ohjausosan, joka tallentaa lähtevän huippuar- vosignaalin kepstrin huippuarvon ilmaisuosalta huippuarvomuistiin moodin-asetustulon ohjaamana, tai vertaa kepstrin huippuarvon ilmaisuosalta tulevaa 35 lähtevää huippuarvosignaalia huippuarvomuistin kanssa toisen ohjaussignaalin . · i syöttämiseksi sovitusosalle siten, että vain kun tulevan äänen äänitaajuus on lä- 24 116595 hellä aiemmin rekisteröityä taajuutta, sovitustoiminta voidaan suorittaa, jolloin seurauksena on, että kun muu ääni kuin rekisteröidyn puhujan ääni syötetään, sovitusprosessointia ei suoriteta prosessointikäsittelyn jättämiseksi pois, ja hylätty-tulos saadaan nopeasti. On myös toinen seuraus, että kun laite on rakennettu 5 mikroprosessorilla tai vastaavalla, sovitusprosessoinnin käsittely voidaan pitää minimissään, jolloin CPU:n kuormaa voidaan vähentää ja vähennetty osa varata toiselle prosessointikäsittelylle, josta seuraa rationalisoitu CPU:n rakenne.
Kuviota 15 tarkastelemalla tullaan tämän jälkeen selittämään toisen esillä olevan keksinnön toteutus.
10 Kuvio 15 on lohkokaavio toisen esillä olevan keksinnön toteutuksen signaalinkäsittelylaitteesta. Kuviota 15 käyttämällä alla tullaan selittämään laitteen rakenne. Kepstrin laskentaosa 208 laskee kepstrin tulevasta äänestä ja syöttää kepstrin huippuarvon ilmaisuosalle 209 ja huippuarvon ilmaisuosa 209 ilmaisee kepstrin huippuarvon ja syöttää huippuarvon analyysijakson käsittely-15 osalle 210 ja äänenilmaisuosalle 214. Äänenilmaisuosa 214 ilmaisee äänen esiintymisen/puuttumisen kepstrin huippuarvosta, joka syötetään huippuarvon ilmaisuosalta 209, ja se syöttää ensimmäisen ohjaussignaalin, joka vastaa äänisignaalin esiintymistä/puuttumista sovitusosalle 215. Analyysijakson käsittely-osa 210 asettaa optimaalisen analyysijakson kepstrin huippuarvon ohjaamana, 20 joka syötetään huippuarvon ilmaisuosalta 209, ja se syöttää asetetun jakson analyysijakson luokitteluosalle 211 ja syöttää myös samanlaisen analyysijakso-:.· · datan tai ennalta määrätyn analyysijakson datan, joka syötetään analyysijakson ;Y: muistilta 212, huippuarvon ilmaisuosalle 209 moodinasetustulon ohjaamana.
Analyysijakson luokitteluosa 211 vertaa optimaalista analyysijakson dataa, joka 25 on syötetty analyysijakson käsittelyosalta 210, analyysijakson dataan, joka on * * * syötetty analyysijakson muistilta 212, luokittelun suorittamiseksi, ja moo-’···'. dinasetustulon ohjaamana se kirjoittaa datan analyysijakson muistiin 212 tai lu kee sen sieltä analyysijakson ohjausta varten, ja syöttää luokitellun tuloksen toi-. . sena ohjaussignaalina sovitusosalle 215. Äänianalyysiosa 213 analysoi tulevan I * » : 30 signaalin dataformaattiin, jota käytetään sovitusosassa 215, ja syöttää analysoi- dun signaalin sovitusosalle 215. Sovitusosalle 215 syötetään tuleva ääni, joka • on analysoitu äänianalyysiosalla 213, ja ensimmäinen ja toinen ohjaussignaali
I · » I
.···. äänenilmaisuosalta 214 ja analyysijakson luokitteluosalta 211, ja ohjaussignaali’ lien ohjaamana se tarkistaa analysoidun signaalin, joka syötetään äänianalyy- ‘ · · ·' 35 siosalta 105, mallin suhteen tunnistettu-lähdön saamiseksi.
t *· 25 116595
Selitetään yllä olevan rakenteen sisältävän laitteen rakenne.
Kepstrin laskentaosa 208 ilmaisee huippuarvon ilmaisuosan 209 avulla tulevan äänen kepstrin huippuarvon, ja kepstrin huippuarvo syötetään sitten äänenilmaisuosalle 214 ja se ilmaisee äänen esiintymisen/puuttumisen. Ää-5 nenilmaisuosa 214 syöttää ensimmäisen ohjaussignaalin sovitusosalle 215 äänen esiintymisen/puuttumisen ohjaamana. Tällöin huippuarvon ilmaisuosa 209 toimii tavalla, jossa se ilmaisee kepstrin huippuarvon analyysijakson mukaisesti, joka on syötetty analyysijakson prosessointiosalta 210. Tuolla hetkellä ana-lyysijakso, joka on syötetty huippuarvon ilmaisuosaan 209, vastaa moo-10 dinasetustuloa myöhemmin esitettävällä tavalla. Äänianalyysiosa 213 analysoi tulevan äänen siten, että sovituskäsittely voidaan suorittaa sovitusosassa 215. Tarkastellaan nyt laitteen toimintaa tapauksessa, jossa moodinasetustulo on "REKISTERÖINTI" ja kun tulo on "TUNNISTUS".
Ensiksi, kun moodinasetustulo on "REKISTERÖINTI", analyysijakson 15 käsittelyosa 210 asettaa huippuarvon ilmaisun analyysijakson huippuarvon il- maisuosassa 209 ennalta määrätyksi jaksoksi, laskee analyysijakson suurella tarkkuudella kepstrin huippuarvon ohjaamana, joka saadaan huippuarvon ilmai- suosalta 209, ja se syöttää optimaalisen analyysijakson luokitteluosalle 211.
Analyysijakson luokitteluosa 211 tarkistaa, esiintyykö samanlainen analyysijakso 20 optimaalista analyysijaksoa varten analyysijakson muistissa 212, ja jos jaksoa ei esiinny, se tallentaa uudelleen optimaalisen analyysijakson analyysijakson muis- . : tiin 212, kun taas jakson esiintyessä se yhdistää optimaalisen analyysijakson ja ; analyysijaksomuistin 212 samanlaisen analyysijakson, kuten yllä kuvattiin, ja : : korvaa analyysijakson muistin 212 sisällön yhdistetyllä jaksolla tallennusta var- ·' '· 25 ten.
► · :v. Tämän jälkeen, kun moodinasetustuloksi tulee "TUNNISTUS", ana- lyysijakson käsittelyosa 210 syöttää aiemmin syötetyn analyysijakson datan » · huippuarvon ilmaisuosaan 209. Huippuarvon ilmaisuosa 209 ilmaisee kepstrin . , huippuarvon tulevan äänen ohjaamana, sitten analyysijakson käsittelyosa 210 30 laskee optimaalisen analyysijakson huippuarvon ohjaamana ja syöttää lasketun ’···’ jakson analyysijakson luokitteluosalle 211. Analyysijakson luokitteluosa 211 te- : kee tarkistuksen nähdäkseen, esiintyykö samanlainen jakso optimaaliselle syö- ;· ·. tetylle analyysijaksolle analyysijakson muistissa 212, ja jos jakso esiintyy, se syöttää samanlaisen analyysijakson analyysijakson käsittelyosan 210 läpi huip-’;** 35 puarvon ilmaisuosalle 209 korvaten aiemmin asetetun analyysijakson samanlai- :. ! sella analyysijaksolla, kun taas jos jaksoa ei esiinny, se säilyttää ennalta määrä- 26 116595 tyn analyysijakson ja syöttää jakson huippuarvon ilmaisuosalle 209. Edelleen osa 211 syöttää toisen ohjaussignaalin, joka osoittaa samanlaisen analyysijakson esiintymisen/puuttumisen, sovitusosalle 215. Kun ääni todella esiintyy äänen tulossa, ja tulevan äänen kepstrin huippuarvon analyysijakso on samanlai-5 nen kuin aiemmin rekisteröity jakso yllä kuvatun mukaisesti, sovitusosa 215 suorittaa sovitustoiminnan mallin suhteen ensimmäisellä ohjaussignaalilla, joka on syötetty äänenilmaisuosalta 214, ja toisella ohjaussignaalilla, joka on syötetty analyysijakson luokitteluosalta 211.
Yllä kuvatun kaltaisen esillä olevan keksinnön toteutuksen signaalin-10 käsittelylaitteen mukaisesti rekisteröitäessä äänisignaalia analyysijakso, joka vastaa kepstrin huippuarvoa, joka vastaa äänitaajuutta, joka osoittaa äänen luonteen, luokitellaan ja tallennetaan muistiin, jolloin samanlaiset tulevat äänet useiden tulevien rekisteröityjen äänien joukosta vastaavat yhdistettyä ana-lyysijaksoa ja ne tallennetaan, kun taas muut tulevat äänet vastaavat yksittäistä 15 analyysijaksoa, ja ne tallennetaan. Molemmissa tapauksissa, kun ääni tulee tunnistaa, analyysijaksoa, joka vastaa valinnaisen tulevan äänen kepstrin huippuarvoa, verrataan muistiin rekisteröityyn analyysijaksoon, jolloin se, onko tuleva ääni rekisteröity vai ei, voidaan määritellä. Myöskin asettamalla analyysijakso, kepstrin huippuarvon ilmaisun analyysikäsittely tulee suorittaa määrätyllä jaksol-20 la, mikä samalla sallii tulevan äänen esiintymisen/puuttumisen määrittämisen suorittamisen tehokkaasti ja suurella nopeudella. Edelleen häiriö, jossa ei ole kepstrin huippua, poistuu, aiheuttaen samalla virheellisen toiminnan eliminoin-V: nin. Edelleen vielä äänentunnistuskäsittely suoritetaan sen jälkeen kun tuleva ääni on käytännössä vahvistettu ja sen rekisteröinti on vahvistettu yllä kuvatulla 25 tavalla, mikä samalla sallii tunnistuksen suorittamisen tarvittaessa, ja laitteen : v. käyttämisen tehokkaasti.
! · · ·. Vaikutuksena on myös, että kun laite rakennetaan mikroprosessorilla ja vastaavalla, käsittelytoiminta ilman hukka-aikaa aiheuttaa osien käsittely-, . kuorman alenemisen, mikä samalla sallii monen käsittelyn suorittamisen ja ra- ;: 30 kenteen yksinkertaistumisen.
*···1 Kuten yllä olevasta toteutuksesta on ilmeistä, esillä olevan keksinnön * mukainen signaalinkäsittelylaite, jossa on ensimmäinen ohjaussignaalin tulolaite * 1 · · ja toinen ohjaussignaalin tulolaite sisällytettynä sovitusosaan ja sovitusosan, jo-ka vastaanottaa lähtevän tunnistuksen käyttämällä analysoitua lähtöä äänenil-35 maisulaitteelta, johon äänisignaali syötetään, tunnistustoimintaa ohjaamassa, ja laite on varustettu huippuarvon ilmaisulaitteella äänisignaalin kepstrin, joka on 27 116595 laskettu määritellyssä analyysijaksossa, huippuarvon ilmaisua varten ja ensimmäisen ohjaussignaalin tuottamista varten, joka vastaa äänisignaalin esiintymis-tä/puuttumista, ja on varustettu laitteella, jolla analyysijakso luokitellaan optimaalisen jakson perusteella, joka on laskettu tulevaa ääntä vastaten, jakson tallen-5 tamisen muistiin ja jakson syöttämisen huippuarvon ilmaisuosalle, laitteen ana-lyysijakson, joka vastaa valinnaista tulevaa ääntä, vertaamiseksi tallennetun analyysijakson kanssa valinnaisen tulevan äänen tunnistuskäsittelyssä ja toisen ohjaussignaalin tuottamisen, ja ensimmäisen ja toisen ohjaussignaalin, jotka rajoittavat tunnistuskäsittelyä tavalla, että se suoritetaan vain kun äänisignaali 10 esiintyy ja se tulee tunnistaa, jolloin tunnistuskäsittely suoritetaan tarvittaessa, kepstrin huippuarvon ilmaisun analysointinopeutta kasvatetaan asettamalla analyysijakso, ja häiriö, jossa ei ole kepstrin huippua, poistuu aiheuttaen virheellisen toiminnan eliminoitumisen. Myöskin tunnistuskäsittely suoritetaan tarvittaessa, mikä siten aiheuttaa laitteen tehokkaan käytön.
15 Lopputuloksena on myös, että käsittelytoiminta ilman hukka-aikaa ai heuttaa laitteen osien prosessointikuorman alenemisen, mikä siten sallii sen rakenteen yksinkertaistamisen.
Alan ammattimiehet edelleen ymmärtävät, että edellä oleva kuvaus sisältää edulliset toteutukset ja että useita muutoksia ja muunnelmia voidaan 20 tehdä keksintöön poikkeamatta sen hengestä ja sovellutusalueesta.
» · * · * · * · 1 a * « ·

Claims (3)

116595 1. Signaalinkäsittelylaite, joka käsittää: puheanalyysiosan (105) tulevan puheen analysoimista varten ja ana-5 lysoidun signaalin lähettämistä varten, kepstrin laskentaosan (101), jolla lasketaan kepstri mainitusta tulevasta puheesta ja jolla kepstri lähetetään, huippuarvon ilmaisuosan (102), jolla ilmaistaan mainitun kepstrin huippuarvo ja jolla lähetetään huippuarvosignaali, tunnettu siitä, että se 10 edelleen käsittää: sovitusosan (107), jolla analysoitua signaalia verrataan malliin ja lähetetään tunnistettu-signaali, puheilmaisuosan (106), jolla määrätään puhesignaalin esiintymi-nen/puuttuminen mainitulla huippuarvosignaalilla ja jolla lähetetään ensimmäi-15 nen ohjaussignaali mainitulle sovitusosalle (107), ohjausosan (103), jolla lähetetään toinen ohjaussignaali mainitulle sovitusosalle (107) vasteellisena moodinasetustulolle ja huippuarvolle huippuarvon ilmaisuosalta (102), ja huippuarvomuistin (104), johon mainittu huippuarvosignaali tallenne- 20 taan, jossa ohjausosa (103) kirjoittaa huippuarvosignaalin huippuarvomuistiin : (104) rekisteröintimoodissa ja vertaa huippuarvomuistin (104) huippuarvosignaa- lia tulevan äänen kepstrin huippuarvosignaaliin tunnistusmoodissa, toisen ohjaussignaalin lähettämiseksi, joka vastaa huippuarvosignaalien kefrenssiarvojen 25 tarkkuutta, ja sovitusosa (107) tuottaa tunnistettu-lähdön ensimmäisen ohjaussig-, ·, naalin ja toisen ohjaussignaalin mukaisesti. 2. Signaalinkäsittelylaite, joka käsittää: . . äänianalyysiosan (213) tulevan puheen analysoimista varten ja ana- : 30 lysoidun signaalin lähettämistä varten, ‘ · · ’ kepstrin laskentaosan (208), jolla lasketaan kepstri puhesignaalista ja • lähetetään kepstri, ja < · « · . ··. huippuarvon ilmaisuosan (209), jolla ilmaistaan mainitun kepstrin huippuarvo määrätyssä jaksossa ja lähetetään huippuarvosignaali, tunnettu ‘ ’ 35 siitä, että se edelleen käsittää: • * 116595 sovitusosan (215) analysoidun signaalin vertaamiseksi mallin ja tunnistetun signaalin lähettämiseksi, puheenilmaisuosan (214) puhesignaalin esiintymisen/puuttumisen määrittämiseksi huippuarvosignaalilla ja ensimmäisen ohjaussignaalin lähettämi-5 seksi sovitusosalle (215), analyysijakson käsittelyosan (210) analyysijakson asettamiseksi ja ohjaamiseksi huippuarvon ilmaisuosalle (209) ja optimaalisen analyysijakson laskemiseksi vastaten kepstrin huippuarvoa ja jakson lähettämiseksi, ja analyysijakson luokitteluosan (211), jolla analyysijakso luokitellaan 10 mainitun optimaalisen analyysijakson perusteella ja jolla jakso tallennetaan analyysijakson muistiin (212); jossa analyysijakso, joka on ohjattu huippuarvon ilmaisuosalle (209) analyysijakson käsittelyjakson (210) kautta ohjataan analyysijakson luokitteluosalla (211) vasteena tunnistusmoodinasetustulolle, 15 analyysijakson luokitteluosa (211) tarkistaa optimaalisen jakson jak- somuistin (212) analyysijaksodatan suhteen vasteena moodinasetustulolle, jotta lähetettäisiin toinen ohjaussignaali vastaten tunnistettavaa puhesignaalia sovitusosalle (215), ja jotta luokiteltaisiin jaksomuistin (212) analyysijakson data ja ohjattaisiin analyysijakso analyysijakson käsittelyosalle (210), ja 20 sovitusosa (215) käyttää ensimmäistä ja toista ohjaussignaalia tun- nistuskäsittelyn rajoittamiseksi sillä tavoin, että se suoritetaan vain kun puhesig-v ; naali esiintyy ja se tulee tunnistaa. : V: 3. Signaalinprosessointimenetelmä, joka käsittää vaiheet: :'' ’: analysoidaan puhesisäänmeno ja lähetetään analysoitu signaali, *»· ; . 25 lasketaan kepstri puhesisäänmenosta ja lähetetään kepstri, ja • · · ilmaistaan kepstrin huippuarvo ja lähetetään huippuarvosignaali, ’••i tunnettu siitä, että se edelleen käsittää vaiheet: • t ’ • · verrataan analysoitua signaalia malliin ja lähetetään tunnistettu sig- , . naali, * · · :;j 1· 30 määritetään puhesignaalin esiintyminen/puuttuminen huippuarvosig- ’ · · · ‘ naalilla ja lähetetään ensimmäinen ohjaussignaali vertailuvaihetta varten, • lähetetään toinen ohjaussignaali vertailuvaihetta varten vasteena .···. moodinasetustulolle ja huippuarvosignaalille, ja tallennetaan huippuarvosignaali rekisteröintimoodissa, ja » ( t 1 *«« » · ‘ » a * » 1 1 6595 verrataan tallennettua huippuarvosignaalia äänitulon kepstrin huippu-arvosignaalin tunnistusmoodissa toisen ohjaussignaalin lähettämiseksi, joka vastaa huippuarvosignaalien kefrenssiarvojen tarkkuutta, jossa vertailuvaiheessa tunnistettu ulostulo on ulostulo ensimmäisen oh-5 jaussignaalin ja toisen ohjaussignaalin mukaisesti. I » t s I 116595
1. Signalbearbetningsanordning innefattande: en talanalyssektion (105) för analysering av en talinmatning och ut-5 matning av en analyserad signal, en kepstrumberäkningssektion (101) for beräkning av ett kepstrum frän talininmatningen och mata ut kepstrumet, och en toppdetekteringssektion (102) for detektering av en topp hos kepstrumet och utmatning av toppsignalen, kännetecknadavatt vidare in-10 nefatta: en avstämningsstation (107) för jämförelse av den analyserade sig-nalen med en mail och mata ut en igenkänd signal, en taltdetekteringssektion (106) for bestämning av närvaron/fran-varon av en talsignal genom toppsignalen och utmatning av en första styrsig-15 nai tili avstämningssektionen (107), en styrsektion (103) för utmatning av en andra styrsignal tili avstämningssektionen (107) som svar pä en tillständsinställande inmatning och toppsignalen frän toppdetekteringssektionen (102), och ett toppvärdesminne (104) för lagring av toppsignalen, väri 20 styrsektionen (103) skriver toppsignalen i toppvärdesminnet (104) i registreringstillständ och jämför toppsignalen frän toppvärdesminnet (104) med '’:*·* kepstrumtoppsignalen hos röstinmatningen i igenkänningstillstand, för att mata V: ut den andra styrsignalen som motsvarar närheten hos kvefrensvärdena hos ; ; toppsignalerna, och .···. 25 avstämningssektionen (107) matar ut den igenkända utmatningen i : ν’, överensstämmelse med den första styrsignalen och den andra styrsignalen.
* · |..! 2. Signalbearbetningsanordning innefattande: en talanalyssektion (213) för analys av en talinmatning och utmatning av en analyserad signal, *·: : 30 en kepstrumberäkningssektion (208) för beräkning av ett kepstrum frän talinmatningen och utmatning av kepstrumet, och ·. en toppdetekteringssektion (209) för detektering av en topp hos kepstrumet vid ett bestämt intervall och utmatning av toppsignalen, k ä n n e-tecknadavattvidare innefatta: » 35 en avstämningssektion (215) för att jämföra den analyserade signa- . Ien med en mail och mata ut en igenkänd signal, 116595 en taldetekteringssektion (214) för bestämning av närvaron/fran-varon av en talsignal genom toppsignalen och utmatning av en första styrsig-5 nai tili avstämningssektionen (215), en analysintervallbearbetningssektion (210) för inställning och diri-gering av ett analysintervall tili toppdetekteringssektionen (209), och beräkning av ett optimalt analysintervall som motsvarar kepstrumtoppen och utmatning av intervallet, och 10 en analysintervallsklassificeringssektion (211) för klassificering av ett analysintervall pä grundval av det optimala analysintervallet och lagring av intervallet i ett analysintervallminne (212), väri analysintervallet som dirigerats tili toppdetekteringssektionen (209) genom analysintervallbearbetningssektionen (210) dirigeras av analysintervall-15 klassificeringssektionen (211) som svar pä en tillständsinställande inmatning, analysintervallklassificeringssektionen (211) kontrollerar det optimala intervallet mot analysintervalldata hos intervallminnet (212) som svar pä en tillständsinställande inmatning, för att mata ut en andra styrsignal som motsvarar talsignalen som skall igenkännas, tili avstämningssektionen (215),och för 20 att klassificera analysintervalldata hos intervallminnet (212) och för att dirigera analysintervallet tili analysintervallbearbetningssektionen (210), och ‘ avstämningssektionen (215) använder den första och andra styrsig- nalen för att begränsa igenkänningsbearbetningen sä att den utförs endast när ; . en talsignal föreligger och skall igenkännas. , · ·. 25
3. Signalbearbetningsmetod innefattande stegen att: i · ; · [ *t analysera en talinmatning och mata ut en analyserad signal, * · *,.! beräkna ett kepstrum frän talinmatningen och mata ut kepstrumet, och • · detektera en topp hos kepstrumet och mata ut en toppsignal, kän-n e t e c k n a d av att vidare innefatta stegen att: ί 30 jämföra den analyserade signalen med en mail och mata ut en igenkänd signal, : bestämma närvaron/fränvaron av en talsignal genom toppsignalen , · * * och mata ut en första styrsignal för jämförelsesteget, mata ut en andra styrsignal för jämförelsesteget som svar pä en till-...: 35 ständsinställande inmatning och toppsignalen, och , ’·· lagra toppsignalen i registreringstillständ, och 116595 lagra toppsignalen i registreringstillständ, och jämföra den lagrade toppsignalen med kepstrumtoppsignalen hos röstinmatningen i registreringstillständ, för att mata ut den andra styrsignalen som motsvarar närheten mellan kvefrensvärdena hos toppsignalerna, där 5 i jämförelsesteget den igenkända utmatningen är en utmatning i överensstämmelse med den första styrsignalen och den andra styrsignalen. » · * » * · » * • » * • · * * ' I « » » · · ‘ > · it * «
FI20030089A 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite FI116595B (fi)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
JP859590 1990-01-18
JP2008595A JP2712692B2 (ja) 1990-01-18 1990-01-18 信号制御装置
JP859290 1990-01-18
JP2008592A JP2712691B2 (ja) 1990-01-18 1990-01-18 信号処理装置
JP1734890 1990-01-26
JP2017348A JPH03220600A (ja) 1990-01-26 1990-01-26 音声検出装置
JP2650690 1990-02-06
JP2026506A JP2712703B2 (ja) 1990-02-06 1990-02-06 信号処理装置
JP2650790 1990-02-06
JP2026507A JP2712704B2 (ja) 1990-02-06 1990-02-06 信号処理装置
JP3429790 1990-02-14
JP2034297A JP2712708B2 (ja) 1990-02-14 1990-02-14 音声検出装置

Publications (2)

Publication Number Publication Date
FI20030089A FI20030089A (fi) 2003-01-21
FI116595B true FI116595B (fi) 2005-12-30

Family

ID=27548141

Family Applications (4)

Application Number Title Priority Date Filing Date
FI910293A FI115569B (fi) 1990-01-18 1991-01-18 Äänisignaalin käsittelylaite
FI20030089A FI116595B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite
FI20030087A FI117953B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite
FI20030088A FI116594B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite

Family Applications Before (1)

Application Number Title Priority Date Filing Date
FI910293A FI115569B (fi) 1990-01-18 1991-01-18 Äänisignaalin käsittelylaite

Family Applications After (2)

Application Number Title Priority Date Filing Date
FI20030087A FI117953B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite
FI20030088A FI116594B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite

Country Status (9)

Country Link
US (1) US5195138A (fi)
EP (4) EP0614171B1 (fi)
KR (1) KR960005739B1 (fi)
AU (1) AU644124B2 (fi)
CA (1) CA2034333C (fi)
DE (4) DE69130294T2 (fi)
FI (4) FI115569B (fi)
HK (4) HK184795A (fi)
NO (4) NO306489B1 (fi)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5414674A (en) * 1993-11-12 1995-05-09 Discovery Bay Company Resonant energy analysis method and apparatus for seismic data
US5502717A (en) * 1994-08-01 1996-03-26 Motorola Inc. Method and apparatus for estimating echo cancellation time
JP4307557B2 (ja) 1996-07-03 2009-08-05 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 音声活性度検出器
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
JP3878482B2 (ja) * 1999-11-24 2007-02-07 富士通株式会社 音声検出装置および音声検出方法
US6876965B2 (en) 2001-02-28 2005-04-05 Telefonaktiebolaget Lm Ericsson (Publ) Reduced complexity voice activity detector
US7426470B2 (en) * 2002-10-03 2008-09-16 Ntt Docomo, Inc. Energy-based nonuniform time-scale modification of audio signals
WO2006005337A1 (en) * 2004-06-11 2006-01-19 Nanonord A/S A method for analyzing fundamental frequencies and application of the method
US8264909B2 (en) * 2010-02-02 2012-09-11 The United States Of America As Represented By The Secretary Of The Navy System and method for depth determination of an impulse acoustic source by cepstral analysis
WO2014168730A2 (en) * 2013-03-15 2014-10-16 Apple Inc. Context-sensitive handling of interruptions
CN104967793B (zh) * 2015-07-28 2023-09-19 格科微电子(上海)有限公司 适用于cmos图像传感器的电源噪声抵消电路
CN111883183B (zh) * 2020-03-16 2023-09-12 珠海市杰理科技股份有限公司 语音信号筛选方法、装置、音频设备和***

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1116300A (en) * 1977-12-28 1982-01-12 Hiroaki Sakoe Speech recognition system
WO1988007739A1 (en) * 1987-04-03 1988-10-06 American Telephone & Telegraph Company An adaptive threshold voiced detector

Also Published As

Publication number Publication date
NO992256L (no) 1991-07-19
EP0614169A1 (en) 1994-09-07
CA2034333A1 (en) 1991-07-19
DE69132148T2 (de) 2000-09-21
EP0614169B1 (en) 1998-09-30
US5195138A (en) 1993-03-16
DE69132148D1 (de) 2000-05-31
DE69132147T2 (de) 2000-09-21
NO992256D0 (no) 1999-05-10
FI115569B (fi) 2005-05-31
DE69112855T2 (de) 1996-02-15
FI20030088A (fi) 2003-01-21
HK1010008A1 (en) 1999-06-11
DE69130294T2 (de) 1999-05-06
NO306489B1 (no) 1999-11-08
HK1010006A1 (en) 1999-06-11
EP0614170A1 (en) 1994-09-07
NO992258D0 (no) 1999-05-10
EP0439073A1 (en) 1991-07-31
FI117953B (fi) 2007-04-30
AU644124B2 (en) 1993-12-02
HK184795A (en) 1995-12-15
KR960005739B1 (ko) 1996-05-01
NO992257D0 (no) 1999-05-10
EP0614171B1 (en) 2000-04-26
DE69130294D1 (de) 1998-11-05
NO992258L (no) 1991-07-19
FI116594B (fi) 2005-12-30
FI20030089A (fi) 2003-01-21
EP0614171A1 (en) 1994-09-07
HK1010007A1 (en) 1999-06-11
AU6868891A (en) 1991-07-25
NO910221L (no) 1991-07-19
EP0439073B1 (en) 1995-09-13
KR910014869A (ko) 1991-08-31
NO910221D0 (no) 1991-01-18
FI20030087A (fi) 2003-01-21
DE69112855D1 (de) 1995-10-19
NO308337B1 (no) 2000-08-28
FI910293A (fi) 1991-07-19
CA2034333C (en) 1996-04-16
NO308336B1 (no) 2000-08-28
NO992257L (no) 1991-07-19
DE69132147D1 (de) 2000-05-31
NO308335B1 (no) 2000-08-28
FI910293A0 (fi) 1991-01-18
EP0614170B1 (en) 2000-04-26

Similar Documents

Publication Publication Date Title
FI116595B (fi) Äänisignaalin käsittelylaite
US4386432A (en) Currency note identification system
CA1116300A (en) Speech recognition system
KR101519104B1 (ko) 목적음 검출 장치 및 방법
US20020165718A1 (en) Audio classifier for half duplex communication
US5187673A (en) Method and apparatus for determining the distribution of constituent subpopulations within a population of particles having overlapping subpopulations
US5295223A (en) Voice/voice band data discrimination apparatus
WO2016008365A1 (zh) 纸币卡钞判断***及方法
CA1218457A (en) Method and apparatus for determining the endpoints of a speech utterance
US7127392B1 (en) Device for and method of detecting voice activity
US8559656B2 (en) System and method for automatic microphone volume setting
CN111595339B (zh) 一种提高uwb在室内测距精度的方法及测距***
US20040199468A1 (en) Sheet handling apparatus
US4972490A (en) Distance measurement control of a multiple detector system
US5924052A (en) Method for detecting signals by means of fuzzy-logic classification
JP4206115B2 (ja) トーン検出方法及びトーン検出システム
JP2007514379A5 (fi)
CA1336212C (en) Distance measurement control of a multiple detector system
JP3513645B2 (ja) 狭帯域信号検出方法
JPH0673079B2 (ja) 音声区間検出回路
JP2999868B2 (ja) 信号検出方法
JPH07141586A (ja) 車両感知装置
KR100349656B1 (ko) 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법
JPS596420B2 (ja) オンライン文字特徴抽出方法
JPH0719947A (ja) ヘリコプタ音と車両音との識別装置

Legal Events

Date Code Title Description
FG Patent granted

Ref document number: 116595

Country of ref document: FI