Büyük veri varlıkları, özellikle onları web sitelerinden, sunuculardan veya diğer veri kaynaklarından çekmeniz gerektiğinde dağınıktır.
MS Excel gibi UI tabanlı uygulamalar, basit veri kümeleriyle başa çıkmak için iyidir, ancak veriler büyüdüğünde sorun yaşayabilir. Bu, daha karmaşık veri tabanlı işlemleri gerçekleştirmek için Python'a geçmeniz için iyi bir nedendir.
Python'un üçüncü taraf kitaplığı Pandas, mevcut veri kümelerinizi hızlı bir şekilde sıralamanıza yardımcı olmak için uzun bir yol kat eder. Verilerinizi Python'da sıralamak istiyorsanız, bu makale bu görevi gerçekleştirmenin birkaç yolunu inceliyor.
Verileri Sıralamak için Python Kullanmanın Ön Koşulları
Verilerinizi Python'da sıralamadan önce birkaç önkoşulla ilgilenmeniz gerekir:
- Bir Python IDE'si indirin. kullanabilirsiniz Python uyumlu IDEdiğerleri arasında Jupyter Notebook, PyCharm ve Spyder gibi. Bunların her biri, tüm Python sürümleriyle uyumludur.
- pandaları yükle. Yapabileceğiniz panda paketine ihtiyacınız olacak. PIP kullanarak yükleyin veya tercih ettiğiniz yöntem.
- Örnek veri kümesi. İndir örnek veri seti Listelenen kodları uygulamak için. Alternatif olarak, bu prosedürleri özel verileriniz üzerinde kullanabilirsiniz.
Python'da Pandalar Kitaplığını İçe Aktarma
Pandas, Excel, CSV ve diğer veri biçimlerini işlemek için kullanabileceğiniz üçüncü taraf bir Python kitaplığıdır.
Örnek bir Excel dosyasıyla çalışmak için pandalar kitaplığını içe aktararak başlayın. Bundan sonra, kullanacaksınız Excel verilerini Python'a okumak için içe aktarma prosedürü.
Kitaplığı İçe Aktarmak için
içe aktarmak pandalar olarak pd
Excel Verilerini Yüklemek için Yeni Bir DataFrame Oluşturun
dosya = "Örnek - Superstore.xls"
df = pd.read_excel (dosya)
df.kafa()
Neresi:
- df içe aktarılan verileri depolayan bir DataFrame nesnesidir.
- pd Pandalar kitaplığı için bir takma addır.
- read_excel Excel dosyasını Python'a okumak için bir yöntemdir.
- dosya Excel dosyasına giden bir yoldur.
- kafa DataFrame'den ilk beş satırı döndüren bir yöntemdir.
Programınız verileri yükledikten sonra, çeşitli şekillerde sıralamak için mevcut birçok DataFrame yöntemini kullanabilirsiniz.
1. DataFrame'de Tek Bir Sütuna Göre Sıralama
Verileriniz çok sayıda satır ve sütuna sahip olacağından, genellikle verileri belirli bir sütuna veya sütunlara göre sıralamak isteyeceksiniz.
Python, verileri varsayılan olarak artan düzende sıralar. Sıralama düzenini değiştirmek istiyorsanız, bunu kodunuzda açıkça belirtmelisiniz.
Tek Sütuna Göre Sırala (Artan Düzen)
df.sort_values (tarafından = "Müşteri Kimliği")
Tek Sütuna Göre Sırala (Azalan Düzende)
Yı kur artan parametre Yanlış sütununuzu azalan düzende sıralamak için.
df.sort_values (tarafından = "Müşteri Kimliği", artan=Yanlış)
Neresi:
- df verileri içeren bir DataFrame nesnesidir.
- sıralama_değerleri veri değerlerine göre sıralamak için bir yöntemdir.
- ile sütun adını tanımlayan bir parametredir.
- artan sıralama düzenini tanımlayan bir parametredir.
2. Bir DataFrame'de Birden Çok Sütunu Sıralama
Gereksinimleriniz gerektiriyorsa, DataFrame'lerinizi aynı anda birden çok sütuna göre sıralayabilirsiniz. Böyle bir senaryoda, bir listede sütun referanslarını tanımlamanız gerekir.
Artan Çoklu Sütunlara Göre Sırala
df.sort_values (tarafından = ["Müşteri Kimliği", "Şehir"])
Birden Çok Sütuna Göre Azalan Sıralama
işlevi kullanın artan = Yanlış Sütunlarınızı azalan düzende sıralamak için. Unutmayın, aynı anda sıralamak için bir listedeki sütunların adlarını belirtmeniz gerekir.
df.sort_values (tarafından = ["Müşteri Kimliği", "Şehir"], artan = Yanlış)
Farklı Sıralama Düzenlerinde Birden Çok Sütuna Göre Sıralama
Sıralamanın temelleri ortadan kalktığında, bir sütunu azalan düzende ve diğerini artan düzende sıralamak istediğinizde ne olur? Bu gereksinimleri dahil etmek için kodunuzu biraz değiştirmeniz gerekir.
Örneğin, sıralamak için Bölge ve Şehir sırasıyla azalan ve artan sırada sütunlar:
df.sort_values (tarafından = ["Bölge", "Şehir"], artan = [Yanlış, Doğru])
Bu kodun açıklaması basittir; DataFrame adını tanımlarsınız ve sıralama_değerleri bir listedeki sütun adlarıyla birlikte işlev görür. Kullanmalısın Boole sıralama düzenini belirtmek için değerler.
İşlevi bu şekilde çağırmak, Python'un önce DataFrame'in Bölge sütununa göre azalan düzende sıralayacağı anlamına gelir. Ardından, aynı Bölgeye sahip satırlar, artan düzende Şehir sütununa göre sıralanır.
3. DataFrame'deki Sütunları Dizine Göre Sıralama
Dizin değişkeni, bir Python Veri Çerçevesi içindeki her satıra atanan varsayılan değerdir. İndeks değerlerini tanımlayabilir veya Python'un kendi başına bir indeks değeri belirlemesine izin verebilirsiniz.
Verileri indeks değerine göre sıralamak için sort_index işlev. Bu işlev, orijinal veri kümesinde yer alan herhangi bir değer yerine dizine göre sıralama yapar.
df.sort_index()
sort_values ile olduğu gibi, bir artan sıralamanın yönünü belirtmek için parametre. Örneğin, bir değer iletin Yanlış verileri azalan düzende sıralamak için:
df.sort_index (artan = Yanlış)
4. Bir DataFrame'deki Sütunları Satırlar Yerine Sıralama
DataFrame'deki satırları sıralamak yerine sütunlarını sıralayabilirsiniz. Bunu, sort_index yöntemini çağırarak ve onu ileterek yapabilirsiniz. eksen değeri olan parametre 1:
df.sort_index (eksen=1)
Bu adım, DataFrame'i sütunlarına göre artan düzende sıralar. DataFrame'in sütunlarını azalan düzende sıralamak için sıralama adımınızda sıralama düzenini belirtebilirsiniz.
df.sort_index (eksen=1, artan = Yanlış)
5. Sıralama Sırasında DataFrame'i Değiştirme
İki sıralama yöntemi, orijinal verilerin bir kopyasını yeni sıralanmış durumunda döndürerek çalışır. Depolama alanından tasarruf etmek veya daha kısa kod yazmak için bunun yerine orijinal DataFrame verilerini değiştirebilirsiniz. Her yöntem bir kabul eder yerinde değiştirilmiş bir kopya döndürmek yerine verileri değiştiren boole parametresi.
df.sort_values (tarafından = ["Müşteri Kimliği", "Şehir"], artan = Yanlış, yerinde = Doğru)
Python'da Verileri Sıralamayı Öğrenmek
Python, Excel'in yerleşik işlevlerinin çoğunu birkaç satır kodla çoğaltır. Sıralama prosedürlerinden verileriniz üzerinde ayrıntılı Pivot tablolar oluşturmaya kadar, adını siz koyun ve Python'da yapabilirsiniz.
Python'da hala yeniyseniz ve ipleri öğreniyorsanız, bu adımlar kodlama becerilerinizi nispeten kolay bir şekilde geliştirecektir.