ElevenLabs – polski start-up z dużymi osiągnięciami
ElevenLabs jest polskim start-upem, który wykorzystuje AI do replikowania głosów w niemal 30 językach, w tym polskim. Co ciekawe, firma działa głównie na rynku globalnym, lecz przede wszystkim na terenie USA. Niedawno ElevenLabs poinformowało, że otrzymało kolejne 80 mln dolarów w ramach finansowania. Najnowsze finansowanie wycenia start-up na ponad miliard dolarów.
Jak dokładnie działa technologia ElevenLabs? Za jej pomocą możemy sklonować głos danej postaci, w tym również osoby publicznej i użyć go w filmiku. W przypadku osób publicznych takich jak politycy i aktorzy istnieje istotny warunek. Otóż nagrania muszą mieć charakter komediowy, tak aby, słuchacz wiedział, że ma do czynienia z parodią.
Mimo że Start-up wystartował w 2022 roku jest aktualnie niezwykle popularny. Wpisując w wyszukiwarkę AI voice generator jako jeden z pierwszych wyników pojawi się właśnie strona ElevenLabs.
Firma zajmuje się rozwijaniem realistycznej, wszechstronnej i świadomej kontekstowo AI. Oznacza to, że z łatwością można generować mowę w setkach nowych i istniejących głosach w aż 29 językach. Technologia ta jest tworzona z myślą o edukacji, audiobookach, streamingu, grach, filmach oraz rozmowach w czasie rzeczywistym. Firma jest już w trakcje rozwijania narzędzia do dubbingu AI, które pozwoli na automatyczne zmienianie dowolnego audio i video na konkretny język przy zachowaniu oryginalnego głosu mówcy.
Sfałszowane nagranie
ElevenLabs cieszy się ostatnio dużą popularnością na całym świecie. Niestety nie wszyscy korzystającą ze sztucznej inteligencji firmy w dobrych celach. Nie tak dawno zostało stworzone nagranie z głosem prezydenta Joe Bidena, w którym nawoływał ludzi, aby nie głosowali w prawyborach w New Hampshire. ElevenLabs musiało interweniować w tej sprawie i zawiesiło konto użytkownika, który stworzył nagranie.
Nie ulega wątpliwościom, że nagranie wzbudziło wiele niepokoju wśród społeczeństwa. W końcu jasno to pokazuje, iż fałszowanie treści przy użyciu AI jest teraz niezwykle łatwe.
Skąd jednak w ogóle wiadomo o takiej sytuacji? Otóż skoro rozwinęła się taka technologia, to musiały też powstać tak zwane środki zapobiegawcze. W tym przypadku mamy do czynienia z firmą Pindrop Security, która zajmuje się wykrywaniem oszustw głosowych.
Pracownicy Pindrop Security dokładnie przeanalizowali nagranie i porównali audio z próbkami z bazy danych systemów zmieniających tekst na mowę. Stąd też badacze firmy mają niemal 100 proc. pewność, że do stworzenia nagrania została wykorzystana technologia ElevenLabs.