Új AI-modellek érkeznek, a Microsoft lépése mindent megváltoztathat
A mesterséges intelligencia világa folyamatosan fejlődik, és a Microsoft most újabb lépéseket tett a területen. A vállalat három új, nagy kapacitású AI modellt mutatott be, ezzel tovább erősítve jelenlétét a dinamikusan bővülő piacon.
A Microsoft kutatólaborja három új rendszert jelentett be, amelyek különböző funkciókra specializálódtak: a MAI-Transcribe-1, a MAI-Voice-1 és a MAI-Image-2. Ezek a rendszerek a multimodális mesterséges intelligencia-ökoszisztéma kibővítésére szolgálnak, lehetővé téve a szöveg, hang és képi tartalmak generálását.

A MAI-Transcribe-1 modell képes 25 különböző nyelven beszédet szöveggé alakítani, miközben a Microsoft szerint több mint kétszer olyan gyors, mint az Azure Fast. A zajos környezetekben is hatékonyan működik, és a jövőben a Microsoft Teams részévé válik.
A MAI-Voice-1 fejlesztés célja a hangkészítés generálása, amely képes egy percnyi hanganyagot előállítani mindössze egy másodperc alatt, egyedi hangszínnel.
A vizuális tartalmak terén a MAI-Image-2 modell új lehetőségeket kínál, erősítve a multimodális képességeket.
A MAI Superintelligence csapat, Mustafa Suleyman vezetésével, irányította az új modellek kidolgozását. Suleyman 2024-ben csatlakozott a céghez, és azóta fontos szerepet tölt be a vállalat AI-stratégiájában.
Technológiai háttérként a Microsoft az Nvidia GB200 chipeket kezdte használni, amely növeli a számítási kapacitást. "Innen fokozatosan növekszünk a következő 12–18 hónapban, hogy csúcsszintű számítási kapacitást érjünk el" – mondta Suleyman.
A vállalat több mint 13 milliárd dollárt fektetett az AI fejlesztésekbe, és hosszú távú stratégiával kívánja integrálni az új modelleket termékeibe, hogy tovább erősítse pozícióját a globális AI versenyben.
