Sinds 3.300 jaar kunnen wij schrijven en sinds 100.000 jaar is er spraak. Het mondkeelkanaal van de mens werd groter, blijkt uit menselijke resten, waardoor het fysiek mogelijk werd om te praten.
Voor spraakherkenning is voorspelbaarheid belangrijk. We passen onze spraakherkenning aan aan de wereld om ons heen. Als ik nu ineens iets typ niet over taal, maar over roeien, dan ben je de weg kwijt. Context dus!
En hoe is het dan mogelijk dat computers spraak herkennen? Dat is toch nog lastiger, zou je denken.
Spraakherkenning in de praktijk: callcenters
Een commerciële toepassing van spraakherkenning ligt in callcenters. Spraakherkenning scheelt geld, doordat mensen sneller kunnen worden doorverwezen. Spraakherkenning maakt een receptie overbodig.
Hoe werkt spraakherkenning dan? De gewone spraakherkenning is onvoldoende; je moet de context weten. Hoe spreken mensen met jouw callcenter, welke woorden gebruiken ze, zeggen ze u of jij?
Daarom worden bij het begin van een project eerst zo’n 1000 vragen uitgeschreven. Het taalgebruik wordt gebruikt om de computer te trainen zodat de herkenning beter wordt. Bovendien worden de dialogen gebruikt om de verschillende onderwerpgroepen te bepalen. Op deze manier worden mensen na het inspreken van hun vraag snel doorverbonden met de juiste medewerker.
Ook basale emoties zijn te herkennen met spraakherkenning. De computer herkent het stemvolume, net als de gespannenheid van de stembanden. In combinatie met de woorden wordt de emotie van de stem bepaald. Toch blijft de herkenning van emoties lastig door culturele verschillen: een Nederlander is tegenover een druk pratende Italiaan wellicht altijd ietwat depressief 😉 Kort door de bocht, maar je begrijpt de problemen nu, denk ik.
Geweldig! Arjan van Hessen vertelde over spraakherkenning op een congres waar ik was. In onderstaand filmpje vertelt Arjan over de commerciële toepassing en de achtergrond van spraakherkenning. Hij werkt aan de universiteit waar ik studeerde (en vakken volgde in deze richting). Ik houd hem in de gaten!
Eeeeh eeeh eeeh: er?
Overigens heette mijn scriptie er staat een paard in de gang. Dit was een onderzoek naar de verwerving van het woordje er door kinderen. Weer zo’n interessante taaluiting: er. Probeer er maar eens uit te leggen aan een buitenlander! Uitkomst: met 6 jaar kunnen kinderen dit type zinnen produceren.
Hier zie je Arjan met een uitgebreidere uitleg van taaltechnologie en spraakherkenning.
Bron foto: A.Currell
[profiel-anneke]