Voicemod este o companie din Valencia care a dezvoltat un software de schimbare a vocii utilizând inteligența artificială și o platformă de sunete. Această tehnologie permite conversia instantanee a vorbirii-în-vorbire, iar Voicemod afirmă că transformă vocile în timp real și cu o latență redusă, permițând utilizatorilor să converseze ca în viața reală.
Potrivit lui Jaime Bosch, CEO și cofondatorul Voicemod, compania își antrenează modelul AI folosind seturi de date publice disponibile și actori vocali profesioniști, ceea ce oferă un spectru larg de expresii vocale, tonuri și emoții. Prin tehnici de învățare automată, modelul învață să înțeleagă, să analizeze și să prevadă modelele și particularitățile discursului unei persoane.
“Când un utilizator vorbește prin intermediul software-ului sau aplicației noastre, intrarea vocii lor este procesată în timp real”, a declarat Bosch pentru TNW. “Modelul nostru AI aplică apoi modelele și transformările învățate asupra intrării, permițând conversia instantanee a vocii.”
Voicemod se adresează în principal industriei divertismentului, inclusiv jucătorilor, streamerilor, creatorilor de conținut și utilizatorilor pe platforme precum Discord, Twitch, Zoom și WhatsApp.
Pentru a răspunde cererii crescute de exprimare personală, pseudonimitate și creativitate online, alături de cele 100 de opțiuni vocale din portofoliu, startup-ul lansează acum colecția numită “AI Humans”. Deși Voicemod oferă deja filtre de voce umană, noua colecție este considerată cea mai realistă până în prezent.
Antrenată pe înregistrările actorilor vocali, AI Humans constă în 20 de avataruri sonore care acoperă o varietate de personalități, genuri și vârste.
Printre personaje se numără Joe, un bărbat în vârstă de 80 de ani cu un ton “rașinos și sarcastic”, și Jennifer, o femeie de 25 de ani cu un caracter “energic și prietenos”. Utilizatorii pot personaliza și tonul fiecărui personaj pentru a schimba percepția asupra genului și vârstei vocii.
Mai jos puteți viziona un videoclip care vă poate da o idee despre cum sună aceste personaje.
Voicemod este o platformă care oferă tehnologie de generare a vocii utilizând inteligența artificială. Această tehnologie aduce numeroase oportunități interesante pentru industrii care doresc să cultive explorarea creativă și autoexprimarea, să îmbunătățească personalizarea și să promoveze includerea în spațiile digitale.
Cu toate acestea, pe lângă impactul pozitiv pe care generarea vocii cu ajutorul inteligenței artificiale îl poate avea, există și numeroase riscuri asociate acestei tehnologii. Printre acestea se numără utilizarea abuzivă, fraudarea, falsificarea identității și chiar furtul vocilor, ceea ce afectează în special actorii de voce profesioniști.
Pentru a reduce aceste riscuri, Voicemod lucrează activ la dezvoltarea unei tehnologii de marcaj pentru a ajuta platformele să identifice și să urmărească vocile generate de AI. De asemenea, au implementat măsuri pentru a proteja proprietatea intelectuală a actorilor vocali cu care colaborează.
Potrivit lui Bosch, AI va deveni “unealta” acestor profesioniști. “Un lucru care poate fi trecut cu vederea în aceste discuții este că în spatele fiecărui caz de utilizare a AI în timp real, cazul la care Voicemod se axează, se află un om care controlează efectiv AI-ul”, a declarat el pentru TNW.
Voicemod are deja peste 40 de milioane de descărcări pe desktop.
În viitor, planifică să lanseze și o versiune mobilă, iar în același timp lucrează la parteneriate B2B cu companii de jocuri și platforme pentru căști VR.
Software-ul este disponibil gratuit, cu opțiunea de a achiziționa versiunea PRO plătită care deblochează funcții și conținut suplimentare.