Dźwięk generatywny
Dźwięk generatywny odnosi się do tworzenia plików audio z baz danych klipów audio . Ta technologia różni się od głosów AI , takich jak Siri firmy Apple lub Alexa firmy Amazon , które wykorzystują zbiór fragmentów, które są łączone ze sobą na żądanie.
Dźwięk generatywny wykorzystuje sieci neuronowe do poznania właściwości statystycznych źródła dźwięku, a następnie odtwarza te właściwości.
Implikacje
Dzięki tej technologii głos osoby może być replikowany, aby wypowiadać frazy, których być może nigdy nie wypowiedziała. Może to doprowadzić do użycia przeciwko nim syntetycznej wersji głosu osoby publicznej.
Technologia
Ta metoda wykorzystuje generatywną sieć przeciwstawną (GAN) , głęboką technikę uczenia maszynowego , w której dwa modele uczenia maszynowego współpracują ze sobą, tworząc realistyczny dźwięk.