Python'u en basit görevler için bile kullanıyorsanız, muhtemelen üçüncü taraf kitaplıklarının öneminin farkındasınızdır. Pandas kütüphanesi, DataFrames için mükemmel desteği ile böyle bir kütüphanedir.
Birden çok dosya türünü Python DataFrame'e aktarabilir ve farklı veri kümelerini depolamak için çeşitli sürümler oluşturabilirsiniz. DataFrame'leri kullanarak verilerinizi içe aktardıktan sonra, ayrıntılı analiz yapmak için bunları birleştirebilirsiniz.
Temelleri Ele Almak
Birleştirmeye başlamadan önce, birleştirilecek DataFrames'e sahip olmanız gerekir. Geliştirme amacıyla, deneme yapmak için bazı yapay veriler oluşturabilirsiniz.
Python'da DataFrame'leri oluşturun
İlk adım olarak Pandas kitaplığını Python dosyanıza aktarın. Pandas, Python'da DataFrame'leri işleyen bir üçüncü taraf kitaplığıdır. kullanabilirsiniz içe aktarmak kütüphaneyi kullanma ifadesi aşağıdaki gibidir:
içe aktarmak pandalar olarak pd
Kod referanslarınızı kısaltmak için kitaplık adına bir takma ad atayabilirsiniz.
DataFrame'lere dönüştürebileceğiniz sözlükler oluşturmanız gerekir. En iyi sonuçlar için iki sözlük değişkeni oluşturun—
dict1 ve dict2—belirli bilgi parçalarını saklamak için:dikte1 = {"Kullanıcı kimliği": ["001", "002", "003", "004", "005"],
"FAd": ["John", "brad", "Ron", "Roald", "Chris"],
"LAd": ["harley", "Cohen", "Dahl", "Harrington", "Kerr-Hislop"]}
dict2 = {"Kullanıcı kimliği": ["001", "002", "003", "004"], "Yaş": [15, 28, 34, 24]}
Daha sonra DataFrame'lerinizi birleştirmek için birincil anahtar olarak hareket etmek için her iki sözlük değerinde de ortak bir öğeye sahip olmanız gerektiğini unutmayın.
Sözlüklerinizi DataFrame'lere Dönüştürün
Sözlük değerlerinizi DataFrame'lere dönüştürmek için aşağıdaki yöntemi kullanabilirsiniz:
df1 = pd. Veri Çerçevesi (dikt1)
df2 = pd. Veri Çerçevesi (dikt2)
Bazı IDE'ler, DataFrame işlevine başvurarak ve düğmesine basarak DataFrame içindeki değerleri kontrol etmenizi sağlar. Çalıştır/Yürüt. Çok var Python uyumlu IDE'ler, böylece öğrenmesi en kolay olanı seçip seçebilirsiniz.
DataFrame'lerinizin içeriğinden memnun kaldığınızda birleştirme adımına geçebilirsiniz.
Çerçeveleri Birleştirme İşleviyle Birleştirme
Birleştirme işlevi, iki DataFrame'i birleştirmek için kullanabileceğiniz ilk Python işlevidir. Bu işlev aşağıdaki varsayılan bağımsız değişkenleri alır:
pd.merge (DataFrame1, DataFrame2, nasıl= tipnın-ninbirleştirmek)
Neresi:
- pd Pandalar kitaplığı için bir takma addır.
- birleştirmek DataFrames'ı birleştiren fonksiyondur.
- Veri Çerçevesi1 ve Veri Çerçevesi2 birleştirilecek iki DataFrame'dir.
- nasıl birleştirme türünü tanımlar.
Karmaşık bir veri yapınız olduğunda kullanabileceğiniz bazı ekstra isteğe bağlı argümanlar mevcuttur.
Gerçekleştirilecek birleştirme türünü tanımlamak için nasıl parametresi için farklı değerler kullanabilirsiniz. Bu tür birleştirmeler tanıdık gelecektir. veritabanı tablolarını birleştirmek için kullanılan SQL.
Sol Birleştirme
Sol birleştirme türü, ilk DataFrame'in değerlerini olduğu gibi tutar ve eşleşen değerleri ikinci DataFrame'den çeker.
Sağ Birleştirme
Doğru birleştirme türü, ikinci DataFrame'in değerlerini olduğu gibi tutar ve eşleşen değerleri ilk DataFrame'den çeker.
İç Birleştirme
İç birleştirme türü, her iki DataFrame'den eşleşen değerleri korur ve eşleşmeyen değerleri kaldırır.
Dış Birleştirme
Dış birleştirme türü, eşleşen ve eşleşmeyen tüm değerleri korur ve DataFrame'leri birlikte birleştirir.
Concat İşlevi Nasıl Kullanılır
bu concat function, Python'un diğer bazı birleştirme işlevlerine kıyasla esnek bir seçenektir. concat işleviyle DataFrame'leri dikey ve yatay olarak birleştirebilirsiniz.
Ancak, bu işlevi kullanmanın dezavantajı, varsayılan olarak eşleşmeyen değerleri atmasıdır. Diğer ilgili işlevler gibi, bu işlevin de birkaç argümanı vardır ve bunlardan yalnızca birkaçı başarılı bir birleştirme için gereklidir.
concat (veri çerçeveleri, eksen=0, birleşim='dış'/’iç’)
Neresi:
- concat DataFrame'leri birleştiren işlevdir.
- veri çerçeveleri birleştirilecek bir DataFrame dizisidir.
- eksen 0 yatay, 1 dikey olmak üzere birleştirme yönünü temsil eder.
- katılmak bir dış veya iç birleşim belirtir.
Yukarıdaki iki DataFrame'i kullanarak concat işlevini aşağıdaki gibi deneyebilirsiniz:
# veri çerçevelerini bir liste biçiminde tanımlayın
df_merged_concat = pd.concat([df1, df2])
# Concat işlevinin sonuçlarını yazdır
Yazdır(df_merged_concat)
Yukarıdaki kodda eksen ve birleştirme argümanlarının olmaması, iki veri kümesini birleştirir. Ortaya çıkan çıktı, eşleşme durumundan bağımsız olarak tüm girişleri içerir.
Benzer şekilde, concat işlevinin yönünü ve çıktısını kontrol etmek için ek argümanlar kullanabilirsiniz.
Çıktıyı tüm eşleşen girişlerle kontrol etmek için:
# İki veri çerçevesi arasındaki tüm eşleşen değerleri sütunlarına göre birleştirme
df_merged_concat = pd.concat([df1, df2], axis=1, birleşim = 'iç')
Yazdır(df_merged_concat)
Sonuç, yalnızca iki DataFrame arasındaki tüm eşleşen değerleri içerir.
Python ile DataFrames Birleştirme
DataFrames, esneklikleri ve işlevsellikleri göz önüne alındığında Python'un ayrılmaz bir parçasıdır. Çok yönlü kullanımları göz önüne alındığında, bunları çeşitli görevleri son derece kolaylıkla gerçekleştirmek için kapsamlı bir şekilde kullanabilirsiniz.
Hâlâ Python DataFrame'leri öğreniyorsanız, bazı Excel dosyalarını içe aktarmayı deneyin ve ardından bunları farklı yaklaşımlarla birleştirin.