pandy (oprogramowanie)

pandy
Oryginalni autorzy Wesa McKinneya
Deweloperzy Wspólnota
Pierwsze wydanie 11 stycznia 2008 ; 15 lat temu ( 11.01.2008 ) [ potrzebne źródło ]
Wersja stabilna
1.5.3 / 18 stycznia 2023 r . ; 44 dni temu ( 18 stycznia 2023 )
Magazyn
Napisane w Python , Cython , C
System operacyjny Międzyplatformowe
Typ Obliczenia techniczne
Licencja Nowa licencja BSD
Strona internetowa pandy .pydata .org

pandas to biblioteka oprogramowania napisana dla języka programowania Python do manipulacji i analizy danych . W szczególności oferuje struktury danych i operacje do manipulowania tabelami numerycznymi i szeregami czasowymi . Jest to wolne oprogramowanie udostępniane na trzyklauzulowej licencji BSD . Nazwa pochodzi od terminu „ pan el data ta ”, ekonometrycznego określenia zbiorów danych które obejmują obserwacje w wielu okresach czasu dla tych samych osób. Jego nazwa jest grą samego wyrażenia „analiza danych Pythona”. Wes McKinney zaczął budować pandy w AQR Capital, kiedy był tam badaczem w latach 2007-2010.

Funkcje biblioteki

  • Wiele wbudowanych metod dostępnych do szybkiej manipulacji danymi stało się możliwe dzięki wektoryzacji
  • Obiekt DataFrame do manipulacji danymi wielowymiarowymi ze zintegrowanym indeksowaniem.
  • Obiekt szeregowy do manipulacji danymi jednowymiarowymi ze zintegrowanym indeksowaniem
  • strukturami danych w pamięci i różnymi formatami plików .
  • Wyrównanie danych i zintegrowana obsługa brakujących danych.
  • Przekształcanie i obracanie zestawów danych.
  • Dzielenie oparte na etykietach, fantazyjne indeksowanie i podzbiory dużych zestawów danych.
  • Wstawianie i usuwanie kolumn struktury danych.
  • Grupuj według silnika, umożliwiając operacje dzielenia, stosowania i łączenia na zestawach danych.
  • Łączenie i łączenie zbiorów danych.
  • Hierarchiczne indeksowanie osi do pracy z danymi wielowymiarowymi w strukturze danych o niższych wymiarach.
  • Funkcjonalność szeregów czasowych: generowanie zakresów dat i konwersje częstotliwości, statystyki ruchomych okien, regresje liniowe ruchomych okien , przesuwanie i opóźnianie dat.
  • Zapewnia filtrowanie danych.

Biblioteka jest wysoce zoptymalizowana pod kątem wydajności, z krytycznymi ścieżkami kodu napisanymi w Cythonie lub C .

Ramki danych

Pandas jest używany głównie do analizy danych i związanej z tym manipulacji danymi tabelarycznymi w DataFrames. Pandy umożliwiają importowanie danych z różnych formatów plików, takich jak wartości oddzielone przecinkami , JSON , Parquet , tabele lub zapytania bazy danych SQL oraz Microsoft Excel . Pandy umożliwiają różne operacje manipulacji danymi, takie jak łączenie, przekształcanie, wybieranie, a także czyszczenie danych i kłótnie o dane cechy. Rozwój pand wprowadził do Pythona wiele porównywalnych funkcji pracy z DataFrame, które zostały ustanowione w języku programowania R. Biblioteka pandas jest zbudowana na innej bibliotece NumPy , która jest zorientowana na wydajną pracę z tablicami zamiast na funkcjach pracy na DataFrames.

Historia

Deweloper Wes McKinney rozpoczął pracę nad pandami w 2008 roku w firmie AQR Capital Management z powodu zapotrzebowania na wysokowydajne, elastyczne narzędzie do przeprowadzania ilościowej analizy danych finansowych. Przed opuszczeniem AQR udało mu się przekonać zarząd, aby pozwolił mu otworzyć bibliotekę .

Inny pracownik AQR, Chang She, dołączył do akcji w 2012 roku jako drugi główny współpracownik biblioteki.

W 2015 roku pandy dołączyły do ​​sponsorowanego fiskalnie projektu NumFOCUS, organizacji charytatywnej non-profit 501 (c) (3) w Stanach Zjednoczonych.

Oś czasu:

  • Rozpoczęcie rozwoju pand
  • 2009: Pandas staje się open source
  • Publikacja pierwszej edycji Python for Data Analysis
  • 2015: Pandas staje się projektem sponsorowanym przez NumFOCUS
  • 2018: Pierwszy osobisty sprint głównego programisty

Zobacz też

Dalsza lektura

  •   McKinney, Wes (2017). Python do analizy danych: walka o dane z Pandas, NumPy i IPython (wyd. 2). Sewastopol: O'Reilly. ISBN 978-1-4919-5766-0 .
  •   Molin, Stefanie (2019). Praktyczna analiza danych z Pandami: wydajnie wykonuj zbieranie danych, kłótnie, analizy i wizualizacje za pomocą Pythona . Paczka ISBN 978-1-7896-1532-6 .
  •   Chen, Daniel Y. (2018). Pandy dla każdego: analiza danych w języku Python . Boston: Addison-Wesley. ISBN 978-0-13-454693-3 .
  •   VanderPlas, Jake (2016). „Manipulacje danymi za pomocą Pand” . Podręcznik nauki o danych w języku Python: niezbędne narzędzia do pracy z danymi . O'Reilly. s. 97–216. ISBN 978-1-4919-1205-8 .
  • Pathak, Chankey (2018). Książka kucharska pandy . s. 1–8.

Linki zewnętrzne