pandy (oprogramowanie)
Oryginalni autorzy | Wesa McKinneya |
---|---|
Deweloperzy | Wspólnota |
Pierwsze wydanie | 11 stycznia 2008 potrzebne źródło ] | [
Wersja stabilna | 1.5.3 / 18 stycznia 2023 r
|
Magazyn | |
Napisane w | Python , Cython , C |
System operacyjny | Międzyplatformowe |
Typ | Obliczenia techniczne |
Licencja | Nowa licencja BSD |
Strona internetowa |
pandas to biblioteka oprogramowania napisana dla języka programowania Python do manipulacji i analizy danych . W szczególności oferuje struktury danych i operacje do manipulowania tabelami numerycznymi i szeregami czasowymi . Jest to wolne oprogramowanie udostępniane na trzyklauzulowej licencji BSD . Nazwa pochodzi od terminu „ pan el data ta ”, ekonometrycznego określenia zbiorów danych które obejmują obserwacje w wielu okresach czasu dla tych samych osób. Jego nazwa jest grą samego wyrażenia „analiza danych Pythona”. Wes McKinney zaczął budować pandy w AQR Capital, kiedy był tam badaczem w latach 2007-2010.
Funkcje biblioteki
- Wiele wbudowanych metod dostępnych do szybkiej manipulacji danymi stało się możliwe dzięki wektoryzacji
- Obiekt DataFrame do manipulacji danymi wielowymiarowymi ze zintegrowanym indeksowaniem.
- Obiekt szeregowy do manipulacji danymi jednowymiarowymi ze zintegrowanym indeksowaniem
- strukturami danych w pamięci i różnymi formatami plików .
- Wyrównanie danych i zintegrowana obsługa brakujących danych.
- Przekształcanie i obracanie zestawów danych.
- Dzielenie oparte na etykietach, fantazyjne indeksowanie i podzbiory dużych zestawów danych.
- Wstawianie i usuwanie kolumn struktury danych.
- Grupuj według silnika, umożliwiając operacje dzielenia, stosowania i łączenia na zestawach danych.
- Łączenie i łączenie zbiorów danych.
- Hierarchiczne indeksowanie osi do pracy z danymi wielowymiarowymi w strukturze danych o niższych wymiarach.
- Funkcjonalność szeregów czasowych: generowanie zakresów dat i konwersje częstotliwości, statystyki ruchomych okien, regresje liniowe ruchomych okien , przesuwanie i opóźnianie dat.
- Zapewnia filtrowanie danych.
Biblioteka jest wysoce zoptymalizowana pod kątem wydajności, z krytycznymi ścieżkami kodu napisanymi w Cythonie lub C .
Ramki danych
Pandas jest używany głównie do analizy danych i związanej z tym manipulacji danymi tabelarycznymi w DataFrames. Pandy umożliwiają importowanie danych z różnych formatów plików, takich jak wartości oddzielone przecinkami , JSON , Parquet , tabele lub zapytania bazy danych SQL oraz Microsoft Excel . Pandy umożliwiają różne operacje manipulacji danymi, takie jak łączenie, przekształcanie, wybieranie, a także czyszczenie danych i kłótnie o dane cechy. Rozwój pand wprowadził do Pythona wiele porównywalnych funkcji pracy z DataFrame, które zostały ustanowione w języku programowania R. Biblioteka pandas jest zbudowana na innej bibliotece NumPy , która jest zorientowana na wydajną pracę z tablicami zamiast na funkcjach pracy na DataFrames.
Historia
Deweloper Wes McKinney rozpoczął pracę nad pandami w 2008 roku w firmie AQR Capital Management z powodu zapotrzebowania na wysokowydajne, elastyczne narzędzie do przeprowadzania ilościowej analizy danych finansowych. Przed opuszczeniem AQR udało mu się przekonać zarząd, aby pozwolił mu otworzyć bibliotekę .
Inny pracownik AQR, Chang She, dołączył do akcji w 2012 roku jako drugi główny współpracownik biblioteki.
W 2015 roku pandy dołączyły do sponsorowanego fiskalnie projektu NumFOCUS, organizacji charytatywnej non-profit 501 (c) (3) w Stanach Zjednoczonych.
Oś czasu:
- Rozpoczęcie rozwoju pand
- 2009: Pandas staje się open source
- Publikacja pierwszej edycji Python for Data Analysis
- 2015: Pandas staje się projektem sponsorowanym przez NumFOCUS
- 2018: Pierwszy osobisty sprint głównego programisty
Zobacz też
- matplotlib
- LiczbaPy
- Dask
- SciPy
- R (język programowania)
- nauka scikit
- modele statystyk
- Lista oprogramowania do analizy numerycznej
Dalsza lektura
- McKinney, Wes (2017). Python do analizy danych: walka o dane z Pandas, NumPy i IPython (wyd. 2). Sewastopol: O'Reilly. ISBN 978-1-4919-5766-0 .
- Molin, Stefanie (2019). Praktyczna analiza danych z Pandami: wydajnie wykonuj zbieranie danych, kłótnie, analizy i wizualizacje za pomocą Pythona . Paczka ISBN 978-1-7896-1532-6 .
- Chen, Daniel Y. (2018). Pandy dla każdego: analiza danych w języku Python . Boston: Addison-Wesley. ISBN 978-0-13-454693-3 .
- VanderPlas, Jake (2016). „Manipulacje danymi za pomocą Pand” . Podręcznik nauki o danych w języku Python: niezbędne narzędzia do pracy z danymi . O'Reilly. s. 97–216. ISBN 978-1-4919-1205-8 .
- Pathak, Chankey (2018). Książka kucharska pandy . s. 1–8.
Linki zewnętrzne