Dźwięk generatywny

Dźwięk generatywny odnosi się do tworzenia plików audio z baz danych klipów audio . Ta technologia różni się od głosów AI , takich jak Siri firmy Apple lub Alexa firmy Amazon , które wykorzystują zbiór fragmentów, które są łączone ze sobą na żądanie.

Krzywe dźwięku

Dźwięk generatywny wykorzystuje sieci neuronowe do poznania właściwości statystycznych źródła dźwięku, a następnie odtwarza te właściwości.

Implikacje

Dzięki tej technologii głos osoby może być replikowany, aby wypowiadać frazy, których być może nigdy nie wypowiedziała. Może to doprowadzić do użycia przeciwko nim syntetycznej wersji głosu osoby publicznej.

Technologia

Ta metoda wykorzystuje generatywną sieć przeciwstawną (GAN) , głęboką technikę uczenia maszynowego , w której dwa modele uczenia maszynowego współpracują ze sobą, tworząc realistyczny dźwięk.

Zobacz też