Nvidia ogłosiła uruchomienie platformy dla deweloperów – Maxine, która naprawia główne wady podczas rozmów wideo. Korzystając z technologii sztucznej inteligencji, nowa usługa poprawia jakość obrazu, eliminuje szumy tła i pilnuje, żeby rozmówca zawsze był w kadrze.

Algorytmy Maxine są w stanie nawet lekko obrócić głowę, sprawiając wrażenie, jakby użytkownik patrzył bezpośrednio w kamerę lub zastępować ją wirtualnym awatarem. Ponadto system może rozpoznawać mowę, tłumaczyć z języka obcego i tworzyć napisy w czasie rzeczywistym.

Inną ważną cechą platformy Nvidia jest złagodzenie wymagań dotyczących jakości połączenia. Przekazując tylko „kluczowe punkty twarzy”, technologia zmniejsza zapotrzebowanie na przepustowość „do jednej dziesiątej” w porównaniu do wideo skompresowanego przez kodek H. 264.

 

 

Jak zauważa The Verge, kompresja wideo, natychmiastowe tłumaczenie i niektóre inne funkcje Maxine nie są nowe i zostały już wdrożone w innych usługach. Na przykład funkcja, która kieruje wzrok do aparatu, jest dostępna w Microsoft Surface Pro X i Apple FaceTime. Jednak technologia Nvidia w wideo demonstracyjnym wygląda imponująco.

 

 

Co jest ważne, że Maxine nie jest kolejną usługą wideo dla użytkowników, jest ona przede wszystkim zestawem narzędzi dla firm zewnętrznych. Dokładna funkcjonalność będzie zależała od tego, jak programiści zintegrują je do swoich aplikacji.

Do tej pory Nvidia ogłosiła jedno partnerstwo z firmą komunikacyjną Avaya.

Źródło:
Zdjęcie główne: theverge.com