Pandas (software)

Abbozzo software
Questa voce sull'argomento software è solo un abbozzo.
Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento.
Pandas
software
Logo
Logo
Schermata di esempio
Schermata di esempio
GenereAnalisi dei dati
SviluppatoreWes McKinney, J. Brock Mendel, Joris Van den Bossche e Jeff Reback
Ultima versione2.2.2 (10 aprile 2024)
Sistema operativoMultipiattaforma
LinguaggioPython
LicenzaBSD modificata [1]
(licenza libera)
Linguainglese
Sito webgithub.com/pandas-dev/pandas
Modifica dati su Wikidata · Manuale

In informatica, Pandas è una libreria software scritta per il linguaggio di programmazione Python per la manipolazione e l'analisi dei dati. In particolare, offre strutture dati e operazioni per manipolare tabelle numeriche e serie temporali. È un software libero rilasciato sotto la licenza BSD a tre clausole.[2] Il nome deriva dal termine "panel data", termine econometrico per set di dati che include osservazioni su più periodi di tempo per gli stessi individui.[3]

Storia

Wes McKinney ha iniziato a lavorare su Pandas nel 2008 mentre era impiegato presso AQR Capital Management per la necessità di avere uno strumento flessibile e ad alte prestazioni per eseguire analisi quantitative su dati finanziari.

Prima di lasciare AQR è stato in grado di convincere il management a permettergli di rendere open source la libreria.

Un altro impiegato AQR, Chang She, si è unito allo sforzo nel 2012 come secondo maggior contributore alla libreria.

Esempi

Curve

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

df = pd.DataFrame(np.random.randn(100, 5), columns=list('ABCDE'))
df=df.cumsum() # Return cumulative sum over a DataFrame or Series axis
df.plot()
plt.show()

Grafici a barre

df = pd.DataFrame(np.random.rand(10, 5), columns=list('ABCDE'))
df.plot.bar(stacked=True)
plt.show()

Trama scatola (Box plot)

df = pd.DataFrame(np.random.rand(7, 5), columns=list('ABCDE'))
df.plot.box()
plt.show()

Histogram

data = pd.Series(np.random.normal(size=100))
data.hist(grid=False)
plt.show()

Note

  1. ^ Pandas License
  2. ^ License – Package overview – pandas 0.21.1 documentation, su pandas, 12 dicembre 2017. URL consultato il 13 dicembre 2017.
  3. ^ Wes McKinney, pandas: a Foundational Python Library for Data Analysis and Statistics (PDF), su dlr.de, 2011. URL consultato il 2 agosto 2018.

Bibliografia

  • Wes McKinney, Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython, 2nd, Sebastopol, O'Reilly, 2017, ISBN 978-1-4919-5766-0.
  • Daniel Y. Chen, Pandas for Everyone : Python Data Analysis, Boston, Addison-Wesley, 2018, ISBN 978-0-13-454693-3. URL consultato il 6 settembre 2021 (archiviato dall'url originale il 6 settembre 2021).

Voci correlate

  • NumPy
  • SciPy
  • Scikit-learn

Altri progetti

Altri progetti

  • Wikimedia Commons
  • Collabora a Wikimedia Commons Wikimedia Commons contiene immagini o altri file su Pandas

Collegamenti esterni

  • (EN) Sito ufficiale, su pandas.pydata.org. Modifica su Wikidata
  • (EN) Blog ufficiale, su pandas.pydata.org. Modifica su Wikidata
  • Pandas / Pandas (altra versione), su packages.debian.org. Modifica su Wikidata
  • Repository sorgenti di Pandas, su github.com. Modifica su Wikidata
  • Sito di segnalazione bug, su github.com. Modifica su Wikidata
  • (EN) Pandas, su Free Software Directory. Modifica su Wikidata
  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica