New AI Model Can Mimic Any Human Voice

Een recente aankondiging van een Canadese start-up zorgt voor opschudding in de media. Ze introduceerden een AI-model dat in staat is om de stem van een persoon te synthetiseren uit slechts een audio-opname van één minuut. Met andere woorden, je kunt iedereen alles laten zeggen wat je wilt.


Het systeem, genaamd Lyrebird naar de Australische vogel, vertrouwt op deep learning-modellen ontwikkeld door de Universiteit van Montréal, waar de technologische start-up gevestigd is. Aanvankelijk werkten de ontwikkelaars aan een onderzoeksartikel dat keek naar het gebruik van neurale netwerken om audio te genereren uit een reeks samples. Deze studie werd later de basis voor hun model voor spraaksynthese. Ze stellen dat Lyrebird “stem-DNA kan comprimeren tot een unieke sleutel en deze sleutel kan gebruiken om alles te genereren met de bijbehorende stem”. Het doet dit met een snelheid van 1000 zinnen in minder dan een halve seconde. Het maakt het zelfs mogelijk om de emoties van de spraak te beheersen, zoals sympathie, boosheid, wat ook maar bij je stemming past.


TechCrunch noemde de technologie een “stemnabootsing voor het tijdperk van nepnieuws”, terwijl The Inquirer het bedrijf definieerde als een “sinistere start-up”. Lyrebird reageerde met een persbericht gericht aan ontwikkelaars wereldwijd, met de wens bewustzijn te creëren over het bestaan van dergelijke technologie, en de betrouwbaarheid van audiobewijs in rechtbanken of voor andere doeleinden in twijfel te trekken.


Bron: Clique. Afbeelding: InsideHook

Picked Articles ...
Loading stories...

Comments (0)

Share your thoughts and join the technology debate!

No comments yet

Be the first to share your thoughts!