Pivot tablolar, MS Excel'de en çok saygı duyulan ve yaygın olarak kullanılan araçlar arasında yer almaya devam ediyor. İster bir veri analisti, veri mühendisi, ister normal bir kullanıcı olun, MS Excel için zaten bir zaafınız var demektir.

Bununla birlikte, özellikle Python'da, MS Excel'in araçlarını ve yardımcı programlarını çoğaltmak için artan bir kapsam vardır. Python'un DataFrame'lerinde birkaç satır kodla kapsamlı pivot tablolar oluşturabileceğinizi biliyor muydunuz?

Evet doğru; merak ediyorsanız, işte bunu nasıl yapabilirsiniz.

Pivot Tablolar Oluşturmak için Ön Koşullar

Diğer programlama dilleri gibi, Python'un da kodlamaya başlamadan önce birkaç ön koşulu yerine getirmeniz gerekir.

Python'da ilk pivot tablonuzu oluştururken en iyi duruma getirilmiş deneyimi elde etmek için ihtiyacınız olacak:

  • Python IDE'si: Çoğu Python kodunun, sistemlerinde önceden kurulmuş entegre bir geliştirme ortamı (IDE) vardır. Bir kaç tane var Piyasadaki Python uyumlu IDE'ler, Jupyter Notebook, Spyder, PyCharm ve diğerleri dahil.
  • instagram viewer
  • Örnek veri: Örnek olarak, üzerinde çalışmanız için örnek bir veri kümesi burada. Alternatif olarak, bu kodları doğrudan canlı verilerinizde değiştirmekten çekinmeyin.

Veri örneği bağlantısı:Örnek Süper Mağaza

Temel Kitaplıkları İçe Aktarma

Python, üçüncü taraf kitaplıkları konsepti üzerinde çalıştığı için, aşağıdakileri içe aktarmanız gerekir. pandalar Pivot oluşturmak için kitaplık.

Pandaları şu amaçlarla kullanabilirsiniz: bir Excel dosyasını Python'a içe aktarın ve verileri bir DataFrame'de saklayın. Pandaları içe aktarmak için içe aktarmak aşağıdaki şekilde komut verin:

içe aktarmak pandalar olarak pd

Python'da Pivotlar Nasıl Oluşturulur

Kitaplık artık kullanılabilir olduğundan, Excel dosyasını Python'da pivot oluşturma ve test etme temeli olan Python'a aktarmanız gerekir. İçe aktarılan verileri aşağıdaki kodla bir DataFrame'de saklayın:

# Yeni bir DataFrame oluşturun
# burada kendi yolunuzla değiştirin
yol = "C://Kullanıcılar//kullanıcı/OneDrive//Masaüstü//"
# dosya adını buradan tanımlayabilirsiniz
dosya = "Örnek - Superstore.xls"
df = pd.read_excel (yol + dosya)
df.kafa()

Neresi:

  • df: DataFrame verilerini depolamak için değişken adı
  • dosya: Pandalar kitaplığı için takma ad
  • read_excel(): Bir Excel dosyasını Python'a okumak için pandalar işlevi
  • yol: Excel dosyasının depolandığı konum (Örnek Mağaza)
  • dosya: İçe aktarılacak dosya adı
  • kafa(): Varsayılan olarak DataFrame'in ilk beş satırını görüntüler

Yukarıdaki kod, Excel dosyasını Python'a aktarır ve verileri bir DataFrame'de saklar. Son olarak, kafa işlevi verinin ilk beş satırını görüntüler.

Bu işlev, verilerin Python'a doğru şekilde aktarılmasını sağlamak için kullanışlıdır.

Python'da Hangi Pivot Tablo Alanları Var?

Excel'deki karşılığı gibi, bir pivot tablo da Python'da benzer bir alan grubuna sahiptir. İşte bilmeniz gereken birkaç alan:

  • Veri: Veri alanı, bir Python DataFrame içinde depolanan verileri ifade eder.
  • Değerler: Bir pivot içinde kullanılan sütun verileri
  • dizin: Verileri gruplandırmak için bir dizin sütunu/sütunları
  • Sütunlar: Sütunlar, bir DataFrame içindeki mevcut verilerin toplanmasına yardımcı olur

Dizin İşlevini Kullanmanın Arkasındaki Amaç

Dizin işlevi, bir pivot tablonun birincil öğesi olduğundan, verilerin temel düzenini döndürür. Başka bir deyişle, verilerinizi gruplandırabilirsiniz. dizin işlev.

Listelenen ürünler için bazı toplu değerleri görmek istediğinizi varsayalım. Segment kolon. Python'da önceden tanımlanmış bir toplam (ortalama değer) belirlenmiş sütunları anindex değeri olarak tanımlayarak hesaplayabilirsiniz.

df.pivot_table (dizin = "Segment")

Neresi:

  • df:Verileri içeren DataFrame
  • Pivot tablo:Python'da özet tablo işlevi
  • dizin: Bir sütunu dizin olarak tanımlamak için yerleşik işlev
  • Segment: Dizin değeri olarak kullanılacak sütun

Python'un değişken adları büyük/küçük harf duyarlıdır, bu nedenle bu kılavuzda listelenen önceden tanımlanmış değişken adlarından uzaklaşmaktan kaçının.

Çoklu İndeks Değerleri Nasıl Kullanılır?

Birden çok dizin sütunu kullanmak istediğinizde, sütun adlarını bir liste indeks fonksiyonu içinde. Tek yapmanız gereken, bir dizi içindeki sütun adlarını belirtmektir. köşeli parantez ([ ]), Aşağıda gösterildiği gibi:

df.pivot_table (dizin = ["Kategori", "Alt Kategori"])

Pivot işlevi, çıktıdaki dizin sütununu girintiler. Python görüntüler kastetmek her bir indeks değerine karşı tüm sayısal değerlerin.

Çıktıdaki Değerleri Kısıtlamayı Öğrenin

Python varsayılan olarak tüm sayısal sütunları seçtiğinden, son çıktıda gösterilen sonuçları ince ayar yapmak için değerleri kısıtlayabilirsiniz. Kullan değerler görmek istediğiniz sütunları tanımlama işlevi.

df.pivot_table (dizin = ["Bölge", "Kategori", "Alt Kategori"], değerler = "Satış")

Nihai çıktıda, üç dizin sütunu ve her bir öğeye karşılık gelen Satış sütununun ortalama değerleri olacaktır.

Pivot Tabloda Toplama İşlevlerini Tanımlama

Varsayılan olarak ortalama değerleri hesaplamak istemediğinizde ne olur? Pivot tablo, basit bir ortalama hesaplamanın ötesine geçen birçok başka işlevselliğe sahiptir.

Kodu nasıl yazacağınız aşağıda açıklanmıştır:

df.pivot_table (dizin = ["Kategori"], değerler = "Satış", aggfunc = [toplam, maks, min, len])

Neresi:

  • toplam: Değerlerin toplamını hesaplar
  • maksimum: Maksimum değeri hesaplar
  • dk: Maksimum değeri hesaplar
  • uzunluk: Değerlerin sayısını hesaplar

Bu işlevlerin her birini ayrı kod satırlarında da tanımlayabilirsiniz.

Özet Tabloya Genel Toplamlar Nasıl Eklenir

Genel toplamlar olmadan hiçbir veri varlığı tamamlanmış sayılmaz. Veri sütunu başına genel toplamları hesaplamak ve görüntülemek için kenar boşlukları ve kenar boşlukları_adı işlev.

df.pivot_table (dizin = ["Kategori"], değerler = "Satış", aggfunc = [sum, max, min, len], margins=True, margins_name='Genel Toplamlar')

Neresi:

  • kenar boşlukları: Genel toplamı hesaplama işlevi
  • kenar boşlukları_adı: Dizin sütununda kategorinin adını belirtin (örneğin, Genel Toplamlar)

Son Kodu Değiştirin ve Kullanın

İşte son kod özeti:

içe aktarmak pandalar olarak pd
# burada kendi yolunuzla değiştirin
yol = "C://Kullanıcılar//kullanıcı/OneDrive//Masaüstü//"
# dosya adını buradan tanımlayabilirsiniz
dosya = "Örnek - Superstore.xls"
df = pd.read_excel (yol + dosya)
df.pivot_table (dizin = ["Bölge", "Kategori", "Alt Kategori"], değerler = "Satış",
aggfunc = [toplam, maks, min, uzunluk],
kenar boşlukları=Doğru,
kenar boşlukları_adı='Genel Toplamlar')

Python'da Pivot Tablolar Oluşturma

Pivot tabloları kullanırken seçenekler sonsuzdur. Python, veri tutarsızlıkları ve sistem gecikmeleri konusunda endişe duymadan geniş veri dizilerini kolayca işlemenizi sağlar.

Python'un işlevleri yalnızca verileri özetlere yoğunlaştırmakla sınırlı olmadığından, Python ile bir dizi ilgili işlevi gerçekleştirirken birden çok Excel çalışma kitabını ve sayfasını birleştirebilirsiniz.

Python ile her zaman ufukta yeni bir şey vardır.