Python, bir dil olarak, özellikle yapılandırılmış verilerle çalışmak istediğinizde, ölçünün ötesinde değerlidir. İnsanlar Excel dosyalarında çok fazla veri depoladığından, zamandan ve emekten tasarruf etmek için birden çok dosyayı birleştirmek zorunludur.
Python tam olarak bunu yapmanızı sağlar; Ne kadar Excel dosyasını birleştirmek isterseniz isteyin, bunu nispeten kolaylıkla yapabilirsiniz. Kitaplık yelpazesi ve üçüncü taraf kaynakları göz önüne alındığında, teklifinizi yapmak için Python'un çok yönlü araçlarını içe aktarabilir ve kullanabilirsiniz.
Bu kılavuzda, konsolide etmeden önce verileri Python'a aktarmak için Pandas kitaplıklarını kurmanız ve kullanmanız gerekecektir.
Python'da Panda Kütüphanelerini Kurun
Pandalar, Python'a yükleyebileceğiniz üçüncü taraf bir kitaplıktır. Bazı IDE'lerde zaten Panda'lar kuruludur.
kullanıyorsanız IDE sürümü bu Pandalar önceden yüklenmiş olarak gelmiyor, içiniz rahat olsun, onu doğrudan Python'a kurabilirsiniz.
Pandaları nasıl kuracağınız aşağıda açıklanmıştır:
pip yükleme pandaları
Jupyter Notebook kullanıyorsanız, Panda'ları doğrudan PIP komutu. Çoğunlukla, Jupyter'ı Anaconda ile kurduğunuzda, Panda'ların doğrudan kullanım için hazır olma olasılığı yüksektir.
Pandaları arayamıyorsanız, doğrudan yüklemek için yukarıdaki komutu kullanabilirsiniz.
Excel Dosyalarını Python ile Birleştirme
Öncelikle, tüm Excel dosyalarıyla tercih ettiğiniz konumda bir klasör oluşturmanız gerekir. Klasör hazır olduğunda, kitaplıkları içe aktarmak için kodu yazmaya başlayabilirsiniz.
Bu kodda iki değişken kullanacaksınız:
- pandalar: Pandalar kitaplığı, Excel dosyalarını depolamak için veri çerçeveleri sağlar.
- İŞLETİM SİSTEMİ: Kitaplık, makinenizin klasöründeki verileri okumak için faydalıdır
Bu kitaplıkları içe aktarmak için şu komutları kullanın:
Pandaları pd olarak içe aktar
İşletim Sistemini İçe Aktar
- İçe aktarmak: Python'daki kitaplıkları içe aktarmak için kullanılan Python sözdizimi
- pandalar: kütüphanenin adı
- dosya: Kütüphaneye verilen takma ad
- İŞLETİM SİSTEMİ: Sistem klasörüne erişmek için bir kitaplık
Kitaplıkları içe aktardıktan sonra, girdi ve çıktı dosya yolunu depolamak için iki değişken oluşturun. Dosyaların klasörüne erişmek için girdi dosyası yolu gereklidir. Birleştirilmiş dosya buradan dışa aktarılacağı için çıktı dosyası yolu gereklidir.
Python kullanıyorsanız, ters eğik çizgiyi eğik çizgi olarak değiştirdiğinizden emin olun (\ ile /)
input_file_path = "C:/Kullanıcılar/gaurav/OneDrive/Desktop/Excel dosyaları/"
output_file_path = "C:/Kullanıcılar/gaurav/OneDrive/Desktop/"
Ekle / sonunda da yolları tamamlamak için.
Klasörün dosyaları bir listede bulunur. Giriş klasörünün tüm dosya referanslarını depolamak için bir liste oluşturun. listdir işlevinden işletim sistemi kütüphane.
Bir kitaplıkta bulunan işlevlerden emin değilseniz, aşağıdakileri kullanabilirsiniz. yön kitaplık adıyla işlev. Örneğin, listdir işlevinin tam sürümünü kontrol etmek için komutu aşağıdaki gibi kullanabilirsiniz:
yön (OS)
Çıktı, işletim sistemi kitaplığında bulunan tüm ilişkili işlevlerden oluşacaktır. listdir işlevi, bu kitaplıkta bulunan birçok işlevden biridir.
Girdi dosyalarını klasörden depolamak için yeni bir değişken oluşturun.
excel_file_list = os.listdir (input_file_path)
Klasörde saklanan dosyaların adlarını görmek için bu değişkeni yazdırın. Klasörde saklanan tüm dosyalar, yazdırma işlevini kullandığınızda görüntülenir.
yazdır (excel_file_list)
Ardından, her bir Excel dosyasını depolamak için yeni bir veri çerçevesi eklemeniz gerekir. Veri depolamak için bir kap olarak bir veri çerçevesi hayal edin. İşte bir veri çerçevesi oluşturma komutu.
df = pd. Veri çerçevesi()
- df: DataFrame değerini saklamak için değişken
- dosya: için takma ad pandalar kitaplığı
- Veri çerçevesi: Veri çerçevesi eklemek için varsayılan sözdizimi
Giriş klasöründe üç .xlsx Bu örnekteki dosyalar. Dosya adları şunlardır:
Dosya1_excel.xlsx
Dosya2_excel.xlsx
Dosya3_excel.xlsx
Bu klasördeki her dosyayı açmak için bir döngü çalıştırmanız gerekir. Döngü, yukarıda oluşturulan listedeki dosyaların her biri için çalışacaktır.
Bunu şu şekilde yapabilirsiniz:
excel_file_list içindeki excel_files için:
Ardından, kod yalnızca XLSX dosyalarını açacağından dosyaların uzantılarını kontrol etmek gerekir. Bu dosyaları kontrol etmek için bir Eğer ifade.
Kullan ile biter Bu amaçla aşağıdaki gibi işlev görür:
excel_file_list içindeki excel_files için:
excel_files.endswith(".xlsx") ise:
- excel_files: Tüm dosya değerleriyle listeleyin
- Şununla biter: Dosyaların uzantısını kontrol etme işlevi
- (".xlsx"): Bu dize değeri, ne aramak istediğinize bağlı olarak değişebilir
Artık Excel dosyalarını tanımladığınıza göre, dosyaları tek tek okumak ve depolamak için yeni bir veri çerçevesi oluşturabilirsiniz.
excel_file_list içindeki excel_files için:
excel_files.endswith(".xlsx") ise:
df1 = pd.read_excel (input_file_path+excel_files)
- df1: Yeni veri çerçevesi
- dosya: pandalar kitaplığı
- read_excel: Pandalar kitaplığındaki Excel dosyalarını okuma işlevi
- input_file_path: Dosyaların saklandığı klasörün yolu
- excel_files: for döngüsünde kullanılan herhangi bir değişken
Dosyaları eklemeye başlamak için eklemek işlev.
excel_file_list içindeki excel_files için:
excel_files.endswith(".xlsx") ise:
df1 = pd.read_excel (input_file_path+excel_files)
df = df.ekleme (df1)
Son olarak, artık birleştirilmiş veri çerçevesi hazır olduğuna göre, onu çıktı konumuna aktarabilirsiniz. Bu durumda, veri çerçevesini bir XLSX dosyasına aktarıyorsunuz.
df.to_excel (output_file_path+"Consolidated_file.xlsx")
- df: Dışa aktarılacak veri çerçevesi
- to_excel: Verileri dışa aktarmak için kullanılan komut
- çıktı_dosyası_yolu: Çıktıyı depolamak için tanımlanan yol
- Consolidated_file.xlsx: Birleştirilmiş dosyanın adı
Şimdi son koda bakalım:
#Pandas, Excel dosyalarını işlemek için veri çerçevesi olarak kullanılır
pandaları pd olarak içe aktar
işletim sistemini içe aktar# Windows cihazları kullanıyorsanız, eğik çizgiyi “\” yerine “/” olarak değiştirin
input_file_path = "C:/Kullanıcılar/gaurav/OneDrive/Desktop/Excel dosyaları/"
output_file_path = "C:/Kullanıcılar/gaurav/OneDrive/Desktop/"#os kitaplığındaki listdir işlevini kullanarak giriş klasörünün tüm dosya referanslarını depolamak için bir liste oluşturun.
#Bir kitaplığın içeriğini görmek için (listdir işlevi gibi, kitaplık adındaki dir işlevini kullanabilirsiniz).
#İçeriği listelemek için dir (kütüphane_adı) kullanınexcel_file_list = os.listdir (input_file_path)
#listeyi tanımladıktan sonra klasörde saklanan tüm dosyaları yazdırın
excel_file_list#Her dosya açıldığında, birden çok dosyada depolanan verileri birleştirmeye başlamak için ekleme işlevini kullanın
#excel dosyası içe aktarmalarını işlemek için yeni, boş bir veri çerçevesi oluşturun
df = pd. Veri çerçevesi()#Listedeki her dosyada dolaşmak için bir for döngüsü çalıştırın
excel_file_list içindeki excel_files için:
#yalnızca .xlsx son ek dosyalarını kontrol edin
excel_files.endswith(".xlsx") ise:
#yukarıda oluşturulan dosyalar listesinden her Excel dosyasını okumak/açmak için yeni bir veri çerçevesi oluşturun
df1 = pd.read_excel (input_file_path+excel_files)
#her dosyayı orijinal boş veri çerçevesine ekleyin
df = df.ekleme (df1)
#son çıktıyı çıktı yolundaki bir Excel (xlsx) dosyasına aktar
df.to_excel (output_file_path+"Consolidated_file.xlsx")
Birden Çok Excel Çalışma Kitabını Birleştirmek için Python'u Kullanma
Python's Pandas, hem yeni başlayanlar hem de ileri düzey kullanıcılar için mükemmel bir araçtır. Kütüphane, Python'da ustalaşmak isteyen geliştiriciler tarafından yaygın olarak kullanılmaktadır.
Yeni başlayan biri olsanız bile, Pandaların nüanslarını ve kütüphanenin Python'da nasıl kullanıldığını öğrenerek çok faydalanabilirsiniz.
Bu acemi operasyonlarla Pandaları öğrenin.
Sonrakini Oku
- Programlama
- piton
- Microsoft Excel
- E-tablo
Gaurav Siyal, bir dizi dijital pazarlama firması ve yazılım yaşam döngüsü belgeleri için iki yıllık yazma deneyimine sahiptir.
Haber bültenimize abone ol
Teknik ipuçları, incelemeler, ücretsiz e-kitaplar ve özel fırsatlar için bültenimize katılın!
Abone olmak için buraya tıklayın