Az Audiobox, a Voicebox utódja, még tovább fejleszti a generatív mesterséges intelligenciát a hangzásban azáltal, hogy egyesíti a beszéd generálási és szerkesztési képességeit, a hangeffektusokat (rövid, diszkrét hangok, például kutyaugatás, autókürt, mennydörgés stb.) és a hangképeket. , különféle beviteli mechanizmusokkal, hogy maximalizálja a vezérelhetőséget minden használati esetre.
*** Linkek ***
Blog: [ Ссылка ]
Audiobox: [ Ссылка ]
* Legyél Te is Tagja az Mp3Pintyo csatornának *
[ Ссылка ]
*** DISCORD***
Mp3Pintyo szerver: [ Ссылка ]
*** Támogatás ***
Patreon: [ Ссылка ]
1. (Sound effects)
Text to audio generation:
A felhasználók megadhatják a kívánt hang rövid leírását, és megkérhetik a modellt, hogy generálja azt.
2. Description to speech 1 (Described Voices)
Hasonlóképpen, egy hang generálásához a felhasználó beírhatja, hogy "Egy fiatal nő magas hangmagassággal és gyors tempóban beszél".
Leírja és generálja a beszédet: A felhasználók megadhatják a kívánt hang rövid leírását, valamint a narrálandó átiratot, és megkérhetik a modellt, hogy generáljon beszédet.
A szöveges felszólítás nem csak egy hang, hanem az akusztikai környezet leírására is használható
3. Vocal restylization (Restyled Voices)
A modell azt is lehetővé teszi a felhasználók számára, hogy egy hangalapú hangbevitelt szöveges stílusú felszólítással kombináljanak, hogy szintetizálják az adott hang beszédét bármilyen környezetben (pl. "egy katedrálisban") vagy bármilyen érzelemben (pl. "szomorúan és lassan beszél"). Tudomásunk szerint az Audiobox az első olyan modell, amely lehetővé teszi a kettős bemenetet (hangsúgó és szöveges leíró súgó) a szabad hangalakításhoz.
Vokális restylizáció: Az Audiobox képes átstilizálni egy hangot, hogy úgy hangozzon, mintha egy másik környezetben lenne - ebben a példában egy nagy katedrálisban.
4. Text-to-audio infilling
Az Audiobox örökölte a Voicebox irányított hanggenerálási képzési célját és a flow-matching modellezési módszert, hogy lehetővé tegye a hangfeltöltést. A kitöltéssel a felhasználók a modellt a hanghatások csiszolására is használhatják (például különböző mennydörgéshangok hozzáadása egy esős hangzásvilághoz).
Hangszerkesztés generatív kitöltéssel: A felhasználók kivághatnak egy hangszegmenst, és az Audiobox segítségével újratermelhetik azt. Szöveges leírás megadásával az Audiobox képes olyan hanghatásokat beilleszteni egy eső hangját tartalmazó hangklipbe, mint például "kutyaugatás".
*** BUYING MY ARTS ***
► [ Ссылка ]
► [ Ссылка ]
*** STAY ACTIVE FOR A FOLLOW ***
►TWITTER: [ Ссылка ]
►INSTAGRAM: [ Ссылка ]
►PINTEREST: [ Ссылка ]
►SOUNDCLOUD: [ Ссылка ]
Ещё видео!