Kaldi (oprogramowanie)

Kaldi
Deweloperzy Daniel Povey i inni
Wersja stabilna
Wersja 3122 / Październik 2013 ; 9 lat temu ( 2013-10 )
Magazyn https://github.com/kaldi-asr/kaldi
Napisane w C++
System operacyjny Unix ( Linux , BSD , OSX 10.{8,9} itp.), Windows (przez Cygwin )
Typ Rozpoznawanie mowy
Licencja Licencja Apache v.2.0
Strona internetowa kaldi-asr .org

Kaldi to zestaw narzędzi do rozpoznawania mowy typu open source napisany w języku C++ do rozpoznawania mowy i przetwarzania sygnałów , dostępny bezpłatnie na licencji Apache License v2.0.

Kaldi ma na celu dostarczenie oprogramowania, które jest elastyczne i rozszerzalne i jest przeznaczone do użytku przez badaczy automatycznego rozpoznawania mowy (ASR) do budowania systemu rozpoznawania.

Obsługuje transformacje liniowe, MMI , wzmocniony trening dyskryminacyjny MMI i MCE , trening dyskryminacyjny przestrzeni cech i głębokie sieci neuronowe .

Kaldi jest w stanie generować funkcje, takie jak mfcc , fbank , fMLLR itp. Dlatego w ostatnich badaniach głębokich sieci neuronowych popularnym zastosowaniem Kaldi jest wstępne przetwarzanie surowego kształtu fali na funkcję akustyczną dla kompleksowych modeli neuronowych.

Kaldi został włączony jako część wyzwania CHiME Speech Separation and Recognition Challenge podczas kilku kolejnych wydarzeń. Oprogramowanie zostało początkowo opracowane w ramach warsztatów w 2009 roku na Uniwersytecie Johnsa Hopkinsa .

Nazwa Kaldi pochodzi od legendarnego etiopskiego pasterza kóz Kaldiego , który podobno odkrył roślinę kawy .

Zobacz też

Linki zewnętrzne