głęboko osadzony
Typ | Prywatny |
---|---|
Przemysł | Przetwarzanie języka naturalnego |
Założony | 22 czerwca 2018 |
Założyciele |
|
Siedziba | , |
Produkty | Stóg siana, głęboko osadzona Chmura |
Liczba pracowników |
> 40 |
Strona internetowa |
deepset to startup, który zapewnia programistom narzędzia do budowania gotowych do produkcji systemów przetwarzania języka naturalnego (NLP) . Została założona w 2018 roku w Berlinie przez Milos Rusic, Malte Pietsch i Timo Möller. deepset jest autorem i utrzymuje oprogramowanie open source Haystack oraz jego komercyjną ofertę SaaS Deepset Cloud.
Historia
W czerwcu 2018 roku Milos Rusic, Malte Pietsch i Timo Möller współtworzyli deepset w Berlinie w Niemczech . W tym samym roku firma obsługiwała pierwszych klientów, którzy chcieli wdrożyć NLP , dopasowując modele językowe BERT do swojej domeny.
W lipcu 2019 roku firma udostępniła wstępną wersję oprogramowania FARM typu open source .
W listopadzie 2019 roku firma udostępniła wstępną wersję oprogramowania open source Haystack.
W latach 2020 i 2021 deepset opublikował kilka artykułów z badań stosowanych na EMNLP , COLING i ACL , wiodących konferencjach w dziedzinie NLP . W 2020 r. wkład badawczy obejmował modele w języku niemieckim o nazwach GBERT i GELECTRA oraz zestaw odpowiadający na pytania dotyczące pandemii COVID-19 o nazwie COVID-QA, który został stworzony we współpracy z firmą Intel i został opatrzony komentarzami ekspertów biomedycznych.
W 2021 r. wkład badawczy obejmował niemieckie modele i zbiory danych do odpowiadania na pytania i wyszukiwania fragmentów o nazwach GermanQuAD i GermanDPR, semantyczną metrykę podobieństwa odpowiedzi oraz podejście do multimodalnego wyszukiwania tekstów i tabel, aby umożliwić odpowiadanie na pytania na podstawie danych tabelarycznych. Stóg siana zawiera implementacje wszystkich trzech wkładów, umożliwiając wykorzystanie badań w ramach open source.
W listopadzie 2021 r. zaprzestano rozwoju frameworka FARM, a jego główne funkcje zostały zintegrowane z frameworkiem Haystack.
W kwietniu 2022 roku firma ogłosiła swoją komercyjną ofertę SaaS Deepset Cloud.
Według stanu na październik 2022 r. najpopularniejszy dopracowany model językowy stworzony przez deepset został pobrany ponad 7 milionów razy.
Produkty i aplikacje
Haystack to kompleksowa platforma Pythona do tworzenia semantycznych rozwiązań wyszukiwania. Dzięki modułowym elementom konstrukcyjnym twórcy oprogramowania mogą wdrażać potoki w celu rozwiązywania różnych zadań wyszukiwania w dużych zbiorach dokumentów, takich jak odpowiadanie na pytania , pobieranie dokumentów lub podsumowanie . Integruje się z Hugging Face Transformers , Elasticsearch , OpenSearch i innymi. Framework ma aktywną społeczność na GitHub , gdzie jak dotąd ponad 140 osób przyczyniło się do jego ciągłego rozwoju, a także cieszy się żywą społecznością na Meetup . Enterprise , BetterUp, Etalab i Sooth.ai.
Platforma Deepset Cloud wspiera klientów w budowaniu skalowalnych aplikacji NLP , obejmując cały proces prototypowania, eksperymentowania, wdrażania i monitorowania. Jest zbudowany na stogu siana.
FARM był platformą do adaptacji modeli reprezentacji. Jedną z głównych koncepcji było wdrożenie modeli adaptacyjnych, które obejmowały modele językowe i dowolną liczbę głowic predykcyjnych. FARM wspierał adaptację domeny i dostrajanie tych modeli za pomocą zaawansowanych opcji, takich jak akumulacja gradientu, walidacja krzyżowa lub automatyczne szkolenie mieszanej precyzji . Jego główne funkcje zostały zintegrowane z Haystack w listopadzie 2021 roku i wtedy zaprzestano jego rozwoju.
Finansowanie
28 kwietnia 2022 r. firma deepset ogłosiła rundę inwestycyjną serii A o wartości 14 mln USD prowadzoną przez GV , z udziałem Harpoon Ventures, Acequia Capital oraz zespołu doświadczonych założycieli komercyjnego oprogramowania open source i uczenia maszynowego , takich jak Alex Ratner (Snorkel AI ), Mustafa Suleyman ( Deepmind ), Spencer Kimball ( Corrach Labs ), Jeff Hammerbacher ( Cloudera ) i Emil Eifrem ( Neo4j ). Poprzednią rundę inwestycyjną typu pre-seed w wysokości 1,6 mln USD, która odbyła się 8 marca 2021 r., prowadziły System.One i Lunar Ventures, które również uczestniczyły w kolejnej rundzie Serii A.