Pandalar kitaplığı, python tabanlı veri bilimini kolay bir yolculuk haline getirir. Verileri okumak, birleştirmek, sıralamak, temizlemek ve daha fazlası için popüler bir Python kitaplığıdır. Pandaların kullanımı ve veri kümelerine uygulanması kolay olsa da, öğrenilmesi gereken birçok veri işleme işlevi vardır.

Pandaları kullanabilirsiniz, ancak verilerle ilgili sorunları çözmek için yeterince kullanmama ihtimaliniz yüksek. İşte her veri bilimcisinin bilmesi gereken pandaların işlevlerini manipüle eden değerli veri listemiz.

Pandaları Sanal Ortamınıza Kurun

Devam etmeden önce, pip kullanarak pandaları sanal ortamınıza yüklediğinizden emin olun:

pip yükleme pandaları

Yükledikten sonra içe aktarın pandalar komut dosyanızın en üstünde ve devam edelim.

1. pandalar. Veri çerçevesi

Kullan pandalar. Veri çerçevesi() pandalarda bir DataFrame oluşturmak için. Bu işlevi kullanmanın iki yolu vardır.

Veri çerçevesine bir sözlük geçirerek sütun bazında bir DataFrame oluşturabilirsiniz. pandalar. Veri çerçevesi() işlev. Burada, her anahtar bir sütundur, değerler ise satırlardır:

instagram viewer
ithal pandalar
DataFrame = pandalar. DataFrame({"A": [1, 3, 4], "B": [5, 9, 12]})
yazdır (DataFrame)

Diğer yöntem, DataFrame'i satırlar arasında oluşturmaktır. Ancak burada değerleri (satır öğeleri) sütunlardan ayıracaksınız. Her listedeki (satır verileri) veri sayısı da sütun sayısıyla uyumlu olmalıdır.

ithal pandalar
DataFrame = pandalar. DataFrame([[1, 4, 5], [7, 19, 13]], sütunlar= ["J", "K", "L"])
yazdır (DataFrame)

2. Pandalarda Okuma ve Excel'e veya CSV'ye Yazma

Pandalarla Excel veya CSV dosyalarını okuyabilir veya yazabilirsiniz.

Excel veya CSV dosyalarını okuma

Bir Excel dosyasını okumak için:

#excel dosya yolu ile example.xlsx'i değiştirin
DataFrame = DataFrame.read_excel("example.xlsx")

Bir CSV dosyasını nasıl okuyacağınız aşağıda açıklanmıştır:

#Ornek.csv'yi CSV dosya yolunuzla değiştirin
DataFrame = DataFrame.read_csv("example.csv")

Excel veya CSV'ye Yazma

Excel'e veya CSV'ye yazmak, iyi bilinen bir panda işlemidir. Ve yeni hesaplanan tabloları ayrı veri sayfalarına kaydetmek için kullanışlıdır.

Bir Excel sayfasına yazmak için:

DataFrame.to_excel("full_path_of_the_destination_folder/filename.xlsx")

CSV'ye yazmak istiyorsanız:

DataFrame.to_csv("full_path_of_the_destination_folder/filename.csv")

Pandaları kullanarak bir DataFrame'deki her sütunun merkezi eğilimlerini de hesaplayabilirsiniz.

Her sütunun ortalama değerini nasıl alacağınız aşağıda açıklanmıştır:

DataFrame.mean()

Medyan veya mod değeri için değiştirin kastetmek() ile medyan() veya mod().

4. DataFrame.transform

pandalar DataFrame.transform() bir DataFrame'in değerlerini değiştirir. Bir işlevi argüman olarak kabul eder.

Örneğin, aşağıdaki kod, DataFrame'deki her değeri kullanarak üç ile çarpar. Python'un lambda işlevi:

DataFrame = DataFrame.transform (lambda y: y*3)
yazdır (DataFrame)

5. DataFrame.isnull

Bu işlev bir Boole değeri döndürür ve boş değerler içeren tüm satırları şu şekilde işaretler: Doğru:

DataFrame.isnull()

Yukarıdaki kodun sonucunun daha büyük veri kümeleri için okunması zor olabilir. Böylece isnull().sum() yerine işlev. Bu, her sütun için tüm eksik değerlerin bir özetini döndürür:

DataFrame.isnull().sum()

6. Dataframe.info

bu bilgi() fonksiyon bir temel pandalar operasyonu. Bunun yerine her sütun için eksik olmayan değerlerin özetini döndürür:

DataFrame.info()

7. DataFrame.describe

bu betimlemek() işlevi size bir DataFrame'in özet istatistiğini verir:

DataFrame.describe()

8. DataFrame.replace

Kullanmak DataFrame.replace() pandas yönteminde, seçili satırları diğer değerlerle değiştirebilirsiniz.

Örneğin, geçersiz satırları değiştirmek için Nan:

# Bunun çalışması için numpy kurulumunu pip yaptığınızdan emin olun
numpy'yi içe aktar
ithal pandalar
# Yerinde bir anahtar kelime eklemek ve onu True olarak ayarlamak, değişiklikleri kalıcı hale getirir:
DataFrame.replace([geçersiz_1, geçersiz_2], numpy.nan, inplace=Doğru)
yazdır (DataFrame)

9. DataFrame.fillna

Bu işlev, boş satırları belirli bir değerle doldurmanıza izin verir. hepsini doldurabilirsin Nan ortalama değere sahip bir veri kümesindeki satırlar, örneğin:

DataFrame.fillna (df.mean(), yerinde = Doğru)
yazdır (DataFrame)

Ayrıca sütuna özel olabilirsiniz:

DataFrame['column_name'].fillna (df[column_name].mean(), inplace = True)
yazdır (DataFrame)

10. DataFrame.dropna

bu damla() yöntem, boş değerler içeren tüm satırları kaldırır:

DataFrame.dropna (yerinde = Doğru)
yazdır (DataFrame)

11. DataFrame.insert

pandaları kullanabilirsin sokmak() DataFrame'e yeni bir sütun ekleme işlevi. Üç anahtar kelimeyi kabul eder, sütun adı, verilerinin bir listesi ve yer, bir sütun indeksidir.

Bu nasıl çalışır:

DataFrame.insert (sütun = 'C', değer = [3, 4, 6, 7], loc=0)
yazdır (DataFrame)

Yukarıdaki kod, yeni sütunu sıfır sütun dizinine ekler (ilk sütun olur).

12. DataFrame.loc

Kullanabilirsiniz yer belirli bir dizindeki öğeleri bulmak için. Örneğin, üçüncü satırdaki tüm öğeleri görüntülemek için:

DataFrame.loc[2]

13. DataFrame.pop

Bu işlev, bir panda DataFrame'den belirli bir sütunu kaldırmanıza olanak tanır.

kabul eder kalem anahtar sözcüğü, açılan sütunu döndürür ve onu DataFrame'in geri kalanından ayırır:

DataFrame.pop (öğe= 'sütun_adı')
yazdır (DataFrame)

14. DataFrame.maks, min

Pandaları kullanarak maksimum ve minimum değerleri elde etmek kolaydır:

DataFrame.min()

Yukarıdaki kod, her sütun için minimum değeri döndürür. Maksimumu elde etmek için değiştirin dk ile maksimum.

15. DataFrame.join

bu katılmak() pandaların işlevi, DataFrame'leri farklı sütun adlarıyla birleştirmenize olanak tanır. Sol, sağ, iç veya dış birleştirmeyi kullanabilirsiniz. Bir DataFrame'e diğer iki kişiyle soldan katılmak için:

#Daha kısa sütunlarla daha uzun sütunları sol birleştirme
newDataFrame = df1.join([df_shorter2, df_shorter3], how='left')
yazdır (newDataFrame)

DataFrames'ı benzer sütun adlarıyla birleştirmek için, sola veya sağa bir sonek ekleyerek bunları ayırt edebilirsiniz. Bunu dahil ederek yapın lsoneki veya rs eki anahtar kelime:

newDataFrame = df1.join([df2, rsuffix='_', nasıl='dış') 
yazdır (newDataFrame)

16. DataFrame.combine

bu birleştirmek() işlevi, belirlenen ölçütlere göre benzer sütun adları içeren iki DataFrame'i birleştirmek için kullanışlıdır. kabul eder işlev anahtar kelime.

Örneğin, yalnızca maksimum değerlere dayalı olarak benzer sütun adlarına sahip iki DataFrame'i birleştirmek için:

newDataFrame = df.combine (df2, numpy.minimum)
yazdır (newDataFrame)

Not: Ayrıca özel bir seçim işlevi tanımlayabilir ve numpy.minimum.

17. DataFrame.astype

bu astype() işlevi, belirli bir sütunun veya DataFrame'in veri türünü değiştirir.

Bir DataFrame'deki tüm değerleri dizeye değiştirmek için, örneğin:

DataFrame.astype (str)

18. DataFrame.sum

bu toplam() pandalarda işlev, her sütundaki değerlerin toplamını döndürür:

DataFrame.sum()

Ayrıca kullanarak tüm öğelerin kümülatif toplamını bulabilirsiniz. cumsum():

DataFrame.cumsum()

19. DataFrame.drop

pandalar damla() işlevi, bir DataFrame'deki belirli satırları veya sütunları siler. Bunu kullanmak için sütun adlarını veya satır dizini ve bir eksen sağlamanız gerekir.

Belirli sütunları kaldırmak için, örneğin:

df.drop (sütunlar=['sütun1', 'sütun2'], eksen=0)

Örneğin 1, 3 ve 4 dizinlerindeki satırları bırakmak için:

df.drop([1, 3, 4], eksen=0)

20. DataFrame.corr

Tamsayı veya kayan sütunlar arasındaki korelasyonu bulmak ister misiniz? pandalar bunu kullanarak bunu başarmanıza yardımcı olabilir. doğru() işlev:

DataFrame.corr()

Yukarıdaki kod, tüm tamsayı veya kayan sütunlar arasındaki korelasyon dizisini içeren yeni bir DataFrame döndürür.

21. DataFrame.add

bu Ekle() işlevi, DataFrame'deki her değere belirli bir sayı eklemenizi sağlar. Bir DataFrame aracılığıyla yinelenerek ve her öğe üzerinde çalışarak çalışır.

İlişkili:Python'da Döngüler İçin Nasıl Kullanılır

Tamsayıları veya kayan noktaları içeren belirli bir sütundaki değerlerin her birine 20 eklemek için, örneğin:

DataFrame['interger_column'].add (20)

22. DataFrame.sub

Toplama işlevi gibi, ayrıca bir DataFrame veya belirli bir sütundaki her değerden bir sayı çıkarabilirsiniz:

DataFrame['interger_column'].sub (10)

23. DataFrame.mul

Bu, pandaların toplama fonksiyonunun bir çarpma versiyonudur:

DataFrame['interger_column'].mul (20)

24. DataFrame.div

Benzer şekilde, bir sütundaki veya DataFrame'deki her veri noktasını belirli bir sayıya bölebilirsiniz:

DataFrame['interger_column'].div (20)

25. DataFrame.std

Kullanmak standart() işlevi, pandalar ayrıca bir DataFrame'deki her sütun için standart sapmayı hesaplamanıza izin verir. Bir veri kümesindeki her sütunu yineleyerek ve her biri için standart sapmayı hesaplayarak çalışır:

DataFrame.std()

26. DataFrame.sort_values

Ayrıca değerleri belirli bir sütuna göre artan veya azalan şekilde sıralayabilirsiniz. Bir DataFrame'i azalan düzende sıralamak için, örneğin:

newDataFrame = DataFrame.sort_values ​​( = "colmun_name" ile azalan = True)

27. DataFrame.melt

bu erimek() pandalardaki işlev, bir DataFrame'deki sütunları ayrı satırlara çevirir. Bir DataFrame'in anatomisini ortaya çıkarmak gibidir. Böylece her bir sütuna atanan değeri açıkça görmenizi sağlar.

newDataFrame = DataFrame.melt()

28. DataFrame.count

Bu işlev, her sütundaki toplam öğe sayısını döndürür:

DataFrame.count()

29. DataFrame.query

pandalar sorgu() öğeleri, dizin numaralarını kullanarak aramanıza olanak tanır. Örneğin, üçüncü satırdaki öğeleri almak için:

DataFrame.query('4') # Dördüncü dizindeki sorguyu çağırın

30. DataFrame.where

bu nerede() function, bir sütunda belirli değerler almak için bir koşulu kabul eden bir panda sorgusudur. Örneğin, her yaştan 30'un altına düşmek için Yaş kolon:

DataFrame.where (DataFrame['Yaş'] < 30)

Yukarıdaki kod, 30'dan küçük tüm yaşları içeren bir DataFrame çıktısı verir, ancak Nan koşulu karşılamayan satırlara.

Verileri Pandalarla Bir Profesyonel Gibi İşleyin

pandalar, Python ile küçükten büyüğe veri kümelerini işlemek için işlevler ve yöntemlerden oluşan bir hazinedir. Kütüphane ayrıca analiz veya makine öğrenimi için verileri temizlemek, doğrulamak ve hazırlamak için de kullanışlıdır.

Bunda ustalaşmak için zaman ayırmak, bir veri bilimcisi olarak hayatınızı kesinlikle kolaylaştırır ve bu çabaya değer. Bu nedenle, işleyebileceğiniz tüm işlevleri almaktan çekinmeyin.

Bilmeniz Gereken 20 Python Fonksiyonu

Python Standart Kitaplığı, programlama görevlerinize yardımcı olacak birçok işlev içerir. En kullanışlı kod hakkında bilgi edinin ve daha sağlam kod oluşturun.

Sonrakini Oku

PaylaşCıvıldamakE-posta
İlgili konular
  • Programlama
  • piton
  • Programlama
  • veri tabanı
Yazar hakkında
Idowu Omisola (123 Makale Yayınlandı)

Idowu akıllı teknoloji ve üretkenlik konusunda tutkulu. Boş zamanlarında kodlamayla uğraşıyor ve canı sıkılınca satranç tahtasına geçiyor ama arada sırada rutinden kopmayı da seviyor. İnsanlara modern teknolojinin yolunu gösterme tutkusu onu daha fazla yazmaya motive ediyor.

Idowu Omisola'dan Daha Fazla

Haber bültenimize abone ol

Teknik ipuçları, incelemeler, ücretsiz e-kitaplar ve özel fırsatlar için bültenimize katılın!

Abone olmak için buraya tıklayın