Büyük veri varlıkları, özellikle onları web sitelerinden, sunuculardan veya diğer veri kaynaklarından çekmeniz gerektiğinde dağınıktır.

MS Excel gibi UI tabanlı uygulamalar, basit veri kümeleriyle başa çıkmak için iyidir, ancak veriler büyüdüğünde sorun yaşayabilir. Bu, daha karmaşık veri tabanlı işlemleri gerçekleştirmek için Python'a geçmeniz için iyi bir nedendir.

Python'un üçüncü taraf kitaplığı Pandas, mevcut veri kümelerinizi hızlı bir şekilde sıralamanıza yardımcı olmak için uzun bir yol kat eder. Verilerinizi Python'da sıralamak istiyorsanız, bu makale bu görevi gerçekleştirmenin birkaç yolunu inceliyor.

Verileri Sıralamak için Python Kullanmanın Ön Koşulları

Verilerinizi Python'da sıralamadan önce birkaç önkoşulla ilgilenmeniz gerekir:

  • Bir Python IDE'si indirin. kullanabilirsiniz Python uyumlu IDEdiğerleri arasında Jupyter Notebook, PyCharm ve Spyder gibi. Bunların her biri, tüm Python sürümleriyle uyumludur.
  • pandaları yükle. Yapabileceğiniz panda paketine ihtiyacınız olacak. PIP kullanarak yükleyin veya tercih ettiğiniz yöntem.
  • instagram viewer
  • Örnek veri kümesi. İndir örnek veri seti Listelenen kodları uygulamak için. Alternatif olarak, bu prosedürleri özel verileriniz üzerinde kullanabilirsiniz.

Python'da Pandalar Kitaplığını İçe Aktarma

Pandas, Excel, CSV ve diğer veri biçimlerini işlemek için kullanabileceğiniz üçüncü taraf bir Python kitaplığıdır.

Örnek bir Excel dosyasıyla çalışmak için pandalar kitaplığını içe aktararak başlayın. Bundan sonra, kullanacaksınız Excel verilerini Python'a okumak için içe aktarma prosedürü.

Kitaplığı İçe Aktarmak için

içe aktarmak pandalar olarak pd

Excel Verilerini Yüklemek için Yeni Bir DataFrame Oluşturun

dosya = "Örnek - Superstore.xls"
df = pd.read_excel (dosya)
df.kafa()

Neresi:

  • df içe aktarılan verileri depolayan bir DataFrame nesnesidir.
  • pd Pandalar kitaplığı için bir takma addır.
  • read_excel Excel dosyasını Python'a okumak için bir yöntemdir.
  • dosya Excel dosyasına giden bir yoldur.
  • kafa DataFrame'den ilk beş satırı döndüren bir yöntemdir.

Programınız verileri yükledikten sonra, çeşitli şekillerde sıralamak için mevcut birçok DataFrame yöntemini kullanabilirsiniz.

1. DataFrame'de Tek Bir Sütuna Göre Sıralama

Verileriniz çok sayıda satır ve sütuna sahip olacağından, genellikle verileri belirli bir sütuna veya sütunlara göre sıralamak isteyeceksiniz.

Python, verileri varsayılan olarak artan düzende sıralar. Sıralama düzenini değiştirmek istiyorsanız, bunu kodunuzda açıkça belirtmelisiniz.

Tek Sütuna Göre Sırala (Artan Düzen)

df.sort_values ​​(tarafından = "Müşteri Kimliği")

Tek Sütuna Göre Sırala (Azalan Düzende)

Yı kur artan parametre Yanlış sütununuzu azalan düzende sıralamak için.

df.sort_values ​​(tarafından = "Müşteri Kimliği", artan=Yanlış)

Neresi:

  • df verileri içeren bir DataFrame nesnesidir.
  • sıralama_değerleri veri değerlerine göre sıralamak için bir yöntemdir.
  • ile sütun adını tanımlayan bir parametredir.
  • artan sıralama düzenini tanımlayan bir parametredir.

2. Bir DataFrame'de Birden Çok Sütunu Sıralama

Gereksinimleriniz gerektiriyorsa, DataFrame'lerinizi aynı anda birden çok sütuna göre sıralayabilirsiniz. Böyle bir senaryoda, bir listede sütun referanslarını tanımlamanız gerekir.

Artan Çoklu Sütunlara Göre Sırala

df.sort_values ​​(tarafından = ["Müşteri Kimliği", "Şehir"])

Birden Çok Sütuna Göre Azalan Sıralama

işlevi kullanın artan = Yanlış Sütunlarınızı azalan düzende sıralamak için. Unutmayın, aynı anda sıralamak için bir listedeki sütunların adlarını belirtmeniz gerekir.

df.sort_values ​​(tarafından = ["Müşteri Kimliği", "Şehir"], artan = Yanlış)

Farklı Sıralama Düzenlerinde Birden Çok Sütuna Göre Sıralama

Sıralamanın temelleri ortadan kalktığında, bir sütunu azalan düzende ve diğerini artan düzende sıralamak istediğinizde ne olur? Bu gereksinimleri dahil etmek için kodunuzu biraz değiştirmeniz gerekir.

Örneğin, sıralamak için Bölge ve Şehir sırasıyla azalan ve artan sırada sütunlar:

df.sort_values ​​(tarafından = ["Bölge", "Şehir"], artan = [Yanlış, Doğru])

Bu kodun açıklaması basittir; DataFrame adını tanımlarsınız ve sıralama_değerleri bir listedeki sütun adlarıyla birlikte işlev görür. Kullanmalısın Boole sıralama düzenini belirtmek için değerler.

İşlevi bu şekilde çağırmak, Python'un önce DataFrame'in Bölge sütununa göre azalan düzende sıralayacağı anlamına gelir. Ardından, aynı Bölgeye sahip satırlar, artan düzende Şehir sütununa göre sıralanır.

3. DataFrame'deki Sütunları Dizine Göre Sıralama

Dizin değişkeni, bir Python Veri Çerçevesi içindeki her satıra atanan varsayılan değerdir. İndeks değerlerini tanımlayabilir veya Python'un kendi başına bir indeks değeri belirlemesine izin verebilirsiniz.

Verileri indeks değerine göre sıralamak için sort_index işlev. Bu işlev, orijinal veri kümesinde yer alan herhangi bir değer yerine dizine göre sıralama yapar.

df.sort_index()

sort_values ​​ile olduğu gibi, bir artan sıralamanın yönünü belirtmek için parametre. Örneğin, bir değer iletin Yanlış verileri azalan düzende sıralamak için:

df.sort_index (artan = Yanlış)

4. Bir DataFrame'deki Sütunları Satırlar Yerine Sıralama

DataFrame'deki satırları sıralamak yerine sütunlarını sıralayabilirsiniz. Bunu, sort_index yöntemini çağırarak ve onu ileterek yapabilirsiniz. eksen değeri olan parametre 1:

df.sort_index (eksen=1)

Bu adım, DataFrame'i sütunlarına göre artan düzende sıralar. DataFrame'in sütunlarını azalan düzende sıralamak için sıralama adımınızda sıralama düzenini belirtebilirsiniz.

df.sort_index (eksen=1, artan = Yanlış)

5. Sıralama Sırasında DataFrame'i Değiştirme

İki sıralama yöntemi, orijinal verilerin bir kopyasını yeni sıralanmış durumunda döndürerek çalışır. Depolama alanından tasarruf etmek veya daha kısa kod yazmak için bunun yerine orijinal DataFrame verilerini değiştirebilirsiniz. Her yöntem bir kabul eder yerinde değiştirilmiş bir kopya döndürmek yerine verileri değiştiren boole parametresi.

df.sort_values ​​(tarafından = ["Müşteri Kimliği", "Şehir"], artan = Yanlış, yerinde = Doğru)

Python'da Verileri Sıralamayı Öğrenmek

Python, Excel'in yerleşik işlevlerinin çoğunu birkaç satır kodla çoğaltır. Sıralama prosedürlerinden verileriniz üzerinde ayrıntılı Pivot tablolar oluşturmaya kadar, adını siz koyun ve Python'da yapabilirsiniz.

Python'da hala yeniyseniz ve ipleri öğreniyorsanız, bu adımlar kodlama becerilerinizi nispeten kolay bir şekilde geliştirecektir.