Wartość rynku usług syntezy mowy wzrośnie do 3,03 mld dolarów w 2022 roku. Średnioroczny wzrost na poziomie ponad 15 proc. wskazuje na bardzo dynamiczny rozwój tego rynku. Pomaga w tym równie dynamiczny rozwój segmentu sztucznej inteligencji, na której usługi syntezy mowy opierają swoje działanie. Pionierami w tej dziedzinie są Polacy.

Według raportu „Text-to-Speech Market by Vertical and Geography – Global Forecast to 2022” skumulowany roczny wskaźnik wzrostu na rynku syntezy mowy w latach 2017–2022 ma wynieść 15,21 proc., by do roku 2022 przekroczyć wartość 3 mld dolarów. Systemy text2speech są powszechnie używane w smartfonach do nawigacji i wspomagania pracy wirtualnych asystentów. Znajdziemy je w komputerach i telewizorach, gdzie pomagają osobom niewidomym i słabo widzącym podczas nawigacji po menu czy przeglądania stron internetowych. Pionierami w tej dziedzinie są Polacy.

Możemy wrzucić do chmury tekst w prawie 30 językach z całego świata, powiedzieć, w jakim głosie powinno być to powiedziane, a to, co zrobi nam chmura, to wygeneruje plik audio mp3 z danym tekstem. Co ciekawe, jest to usługa, która została utworzona w Polsce, w Gdańsku. Mamy usługę zrobioną przez Polaków, z której korzysta cały świat – mówi w wywiadzie dla agencji informacyjnej Newseria Innowacje Tomasz Stachlewski z Amazon Web Services.

Zdaniem 63 proc. menadżerów ankietowanych przez PWC w raporcie „Bot.Me: A revolutionary partnership. How AI is pushing man and machine closer together”, dzięki sztucznej inteligencji możemy liczyć na poprawę interakcji z urządzeniami. Ponadto konsumenci coraz mniej zwracają uwagę na to, czy komunikują się z człowiekiem czy z systemem sztucznej inteligencji. Usługi text2speech opierają się na algorytmach sztucznej inteligencji.

Wykorzystujemy usługi sztucznej inteligencji po to, aby w najbardziej realistyczny sposób konwertować tekst na audio, zatem nie chodzi o przeczytanie sylab, słów, ale musimy wykrywać kontekst, aby wiedzieć, kiedy zaintonować, kiedy się zatrzymać, kiedy dać znak zapytania – wyjaśnia Tomasz Stachlewski.

Analitycy z firmy Tractica szacują, że wartość całego rynku SI dla przedsiębiorstw wzrośnie z 1,6 mld dolarów w roku ubiegłym do niemal 60 mld dolarów w 2025 roku. W swoim raporcie wymieniają ponadto sektory reklamy, finansów, opieki zdrowotnej, a także przemysł lotniczy i kosmiczny jako te, które będą liderami w stosowaniu rozwiązań SI. Jak jednak podkreślają, należy się liczyć z silnym wzrostem zainteresowania rozwiązaniami SI w niemal każdym sektorze gospodarki.

Rośnie zapotrzebowanie na usługi wykorzystujące sztuczną inteligencję, coraz więcej systemów, aplikacji, ma mieć właśnie tę cząstkę sztucznej inteligencji, text2speech jest właśnie takim przykładem, coraz więcej firm pragnie to wykorzystywać. W grach komputerowych nie potrzebujemy lektorów, którzy będą nagrywać tekst, nagle technologia zamiany dowolnego tekstu na audio jest dostępna na wyciągnięcie ręki więc gry, strony internetowe, możemy robić w ten sposób, aby komunikowały się z użytkownikami – wyjaśnia ekspert.

Systemy sztucznej inteligencji dopiero zaczynają się rozwijać, choć jak wynika z przytaczanych raportów, ich rozwój będzie niezwykle dynamiczny, a SI w takiej czy innej formie pojawi się w zasadzie w każdym aspekcie naszego życia.

Trudno mówić o prognozach, to klienci pokazują, czego oczekują i jak będzie się kształtował rynek. Naszym zadaniem jest dostarczać te rzeczy, których potrzebują i z których będą budować nowe funkcjonalności – podsumowuje przedstawiciel Amazon Web Services.

źródło: Agencja Informacyjna Newseria

Kan