IVRtalsvartelefonsvararetalsyntesspeech recognitiontaligenkänningIP telefonitext to speech Bokmärk sidan
 
Speech recognition

Speech recognition

Speech Recognition (eg. Automatic Speech Recognition (ASR)) heter på svenska taligenkänning, och är processen att elektroniskt eller datatekniskt känna igen mänskligt, naturligt tal. Naturligt tal räknas som ett viktigt steg för att få intuitiva människostyrda gränssnitt till datorer.

Taligenkänning bör inte blandas ihop med röstigenkänning, som behandlar identifiering av vem som talar. Det bedrivs omfattade forskning kring förståelsen av naturligt tal. Moderna taligenkänningssystem bygger oftast på statistiska metoder där tal tolkas i flera nivåer med hjälp av hypoteser och grammatiker som definierar troliga/kända kombinationer av språkelement. I mer avancerade system är dessa modeller ofta adaptiva och därmed öppna för inlärning av nya grammatikelement genom en halvautomatisk analys av vilka fraser som misslyckas att bli korrekt förstådda, följt av korrigering av de grammatiska och akustiska modellerna.

Nivåer i ASR:
akustik - identifiering av fonem, dvs ljudstyrka för frekvenserkombinationer och akustiskt förlopp
ord - ihopsättning av fonem
ordföljder - urval av troligaste ordföljder jämfört med en stor databas med talat språk
grammatik - verifiering av hypotetiska ordföljder mot grammatik som gäller för det specifika domänen (till exempel en grammatik för biljettbokningar innhåller vanliga fraser och meningar som har med biljetter att göra, men det finns ingen anledning att till exempel ha med grammatik för fotbollsammanhang)
semantik - uttydning av informationsbärande element


Källa: Wikipedia Speech Recognition

Annons:
Bozoka hjälper sina kunder att skapa innovativa och privärda IVR lösningar med speech recognition och text to speech eller egna ljudfiler och knappstyrt. Vill du veta mer om Bozokas IVR och taltjänster?


Tjänsten är beta. Denna sida kommer att fyllas med mer innehåll. Testa gärna med mobilen genom att skriva in Ivr.se.