Hirdetés

A Microsoft új mesterséges intelligenciája képes lemásolni egy ember hangját mindössze három másodperces hangfelvételből

0 comment

A Microsoft bejelentette egy új típusú mesterséges intelligencia létrehozását, amely könnyedén képes valósághű hangzású beszédet generálni az összes szükséges intonációval. Az eszköz a „VALL-E” nevet kapta. A legkülönösebb az, hogy mindössze 3 másodpercnyi hangfelvételt kell elemeznie bármely személy hangjáról, hogy tökéletesen lemásolja azt.

A Microsoft nem hozza nyilvánosságra az új mesterséges intelligencia alapelveit, nem fogja közzétenni a forráskódokat, és nem valószínű, hogy a VALL-E-n alapuló nyilvános kereskedelmi eszközt hozna létre. Inkább egy kísérletről van szó, egy másik nyelvi modell – a GPT-3 – kiegészítésének köztes fejlesztési szakaszáról. A Microsoft végső célja valószínűleg egy olyan univerzális beszédgenerátor létrehozása, amely helyettesítheti az emberek munkáját tetszőleges tartalmak létrehozásában.

még szintén kedvelheted

Hirdetés