Veri analizi görevlerini gerçekleştirmek üzere yapay zekanın gücünden ve büyük dil modellerinden yararlanmak için PandasAI Python kitaplığından yararlanın.
Pandas, veri kümelerini ve veri çerçevelerini işlemek için en baskın kitaplıktır. Bu uzun zamandır norm olmuştur. Ancak yapay zekadaki ilerlemeyle birlikte, Pandas'a üretken AI yetenekleri ekleyen PandasAI adlı yeni bir açık kaynaklı kitaplık geliştirildi.
PandasAI, Pandaların yerini almaz. Bunun yerine, üretken AI yeteneklerini verir. Bu sayede PandasAI ile chat yaparak veri analizi yapabilirsiniz. Daha sonra arka planda neler olup bittiğini özetler ve size sorgunuzun çıktısını sağlar.
PandasAI'yi Yükleme
pandalarAI PyPI (Python Paket Dizini) aracılığıyla kullanılabilir. Yeni bir sanal ortam oluşturun yerel bir IDE kullanıyorsanız. Daha sonra pip paket yöneticisini kullanın yüklemek için.
pip yükleme pandasai
Google Colab kullanıyorsanız, aşağıda gösterilene benzer bir bağımlılık çakışması hatasıyla karşılaşabilirsiniz.
IPython sürümünü düşürmeyin. Çalışma zamanınızı yeniden başlatın ve kod bloğunu yeniden çalıştırın. Bu sorunu çözecektir.
Tam kaynak kodu bir GitHub deposu.
Örnek Veri Kümesini Anlamak
PandasAI ile manipüle edeceğiniz örnek veri kümesi, Kaggle'dan California Konut Fiyatları veri kümesidir. Bu veri seti, 1990 California nüfus sayımından konut hakkında bilgi içerir. Bu evler hakkında istatistik sağlayan on sütun vardır. Bu veri kümesi hakkında daha fazla bilgi edinmenize yardımcı olacak veri kartı şu adreste mevcuttur: Kaggle. Aşağıda, veri kümesinin ilk beş satırı bulunmaktadır.
Her sütun, bir evin tek bir istatistiğini temsil eder.
PandasAI'yi Büyük Dil Modeline Bağlamak
PandasAI'yi bir büyük dil modeli (LLM) OpenAI'de olduğu gibi API anahtarına erişmeniz gerekir. Bir tane edinmek için şuraya ilerleyin: OpenAI platformu. Ardından hesabınıza giriş yapın. Seçme API sonraki görünen seçenekler sayfasının altında.
Bundan sonra, profilinize tıklayın ve seçin API anahtarlarını görüntüle seçenek. Bir sonraki tıklamada görünen sayfada Yeni gizli anahtar oluştur düğme. Son olarak, API anahtarınızı adlandırın.
OpenAI, API anahtarınızı oluşturacaktır. PandasAI'yi OpenAI'ye bağlarken ihtiyaç duyacağınız şekilde kopyalayın. Erişimi olan herkes sizin adınıza OpenAI'yi arayabileceğinden, anahtarı gizli tuttuğunuzdan emin olun. OpenAI daha sonra aramalar için hesabınızdan ücret alacaktır.
Artık API anahtarına sahip olduğunuza göre, yeni bir Python betiği oluşturun ve aşağıdaki kodu yapıştırın. Çoğu zaman üzerine inşa edeceğiniz için bu kodu değiştirmenize gerek kalmayacak.
içe aktarmak pandalar gibi pd
itibaren pandasai içe aktarmak pandalarAI# Veri kümenizle veya veri çerçevenizle değiştirin
df = pd.read_csv("/content/housing.csv")# LLM başlat
itibaren pandasai.llm.openai içe aktarmak OpenAI
llm = OpenAI(api_token="API jetonunuz")
pandas_ai = PandasAI(llm)
Yukarıdaki kod hem PandasAI'yi hem de Pandaları içe aktarır. Daha sonra bir veri kümesini okur. Son olarak, OpenAI LLM'yi Başlatır.
Artık verilerinizle konuşmaya hazırsınız.
PandasAI Kullanarak Basit Görevleri Gerçekleştirme
Verilerinizi sorgulamak için veri çerçevenizi ve isteminizi PandasAI sınıfı örneğine iletin. Veri kümenizin ilk beş satırını yazdırarak başlayın.
pandas_ai (df, bilgi istemi="Veri kümesinin ilk beş satırı nedir?")
Yukarıdaki istemin çıktısı aşağıdaki gibidir:
Bu çıktı, daha önce veri kümesine genel bakışınkiyle aynıdır. Bu da PandasAI'nin doğru sonuçlar ürettiğini ve güvenilir olduğunu gösteriyor.
Ardından, veri kümenizde bulunan sütun sayısını kontrol edin.
pandas_ai (df, bilgi istemi='Veri kümesinde kaç sütun var? ')
California Konut veri kümesindeki doğru sütun sayısı olan 10'u döndürür.
Veri setinde eksik değer olup olmadığı kontrol ediliyor.
pandas_ai (df, bilgi istemi="Veri kümesinde herhangi bir eksik değer var mı?")
PandasAI şunu döndürür: toplam_yatak odası sütununda yine doğru olan 207 eksik değer var.
PandasAI kullanarak başarabileceğiniz birçok basit görev var, yukarıdakilerle sınırlı değilsiniz.
PandasAI Kullanarak Karmaşık Sorgular Gerçekleştirme
PandasAI yalnızca basit görevleri desteklemez. Veri kümesi üzerinde karmaşık sorgular gerçekleştirmek için de kullanabilirsiniz. Örneğin konut veri setinde bir site üzerinde bulunan konut sayısını belirlemek istiyorsanız, ada, 100.000 dolardan fazla değere sahip ve 10'dan fazla odaya sahip istemi kullanabilirsiniz altında.
pandas_ai (df, bilgi istemi= "Kaç evin değeri 100000'den büyük"
"Bir adada ve toplam yatak odası sayısı 10'dan fazla mı?")
Doğru çıktı beştir. Bu, PandasAI'nin çıkardığı sonucun aynısıdır.
Bir veri analistinin karmaşık sorguları yazması ve hata ayıklaması biraz zaman alabilir. Yukarıdaki istem, aynı görevi gerçekleştirmek için yalnızca iki satır doğal dil alır. Sadece tam olarak neyi başarmak istediğinizi aklınızda bulundurmanız gerekiyor ve PandasAI gerisini halledecek.
PandasAI Kullanarak Grafik Çizme
Grafikler, herhangi bir veri analizi sürecinin hayati bir parçasıdır. Veri analistlerinin verileri insan dostu bir şekilde görselleştirmesine yardımcı olur. PandasAI ayrıca bir grafik çizim özelliğine sahiptir. Veri çerçevesini ve talimatı iletmeniz yeterlidir.
Veri kümesindeki her sütun için bir histogram oluşturarak başlayın. Bu, değişkenlerin dağılımını görselleştirmenize yardımcı olacaktır.
pandas_ai (df, bilgi istemi= "Veri kümesindeki her sütun için bir histogram çiz")
Çıktı aşağıdaki gibidir:
PandasAI, istemde adlarını iletmek zorunda kalmadan tüm sütunların histogramını çizebildi.
PandasAI, hangi grafiğin kullanılacağını açıkça söylemeden de grafikler çizebilir. Örneğin, konut veri setindeki verilerin korelasyonunu bulmak isteyebilirsiniz. Bunu başarmak için aşağıdaki gibi bir bilgi istemi iletebilirsiniz:
pandas_ai (df, bilgi istemi= "Veri kümesindeki korelasyonu çizin")
PandasAI, aşağıda gösterildiği gibi bir korelasyon matrisi çizer:
Kitaplık bir ısı haritası seçer ve bir korelasyon matrisi çizer.
Çoklu Veri Çerçevelerini PandasAI Örneğine Geçirme
Birden çok veri çerçevesiyle çalışmak zor olabilir. Özellikle veri analizinde yeni olan biri için. PandasAI, tek yapmanız gereken her iki veri çerçevesini de geçmek ve verileri işlemek için bilgi istemlerini kullanmaya başlamak olduğu için bu boşluğu dolduruyor.
Pandaları kullanarak iki veri çerçevesi oluşturun.
çalışan_verisi = {
'Çalışan kimliği': [1, 2, 3, 4, 5],
'İsim': ['John', "Emma", 'Liam', "Olivia", "William"],
'Departman': ['İK', 'Satış', 'BT', 'Pazarlama', "Finans"]
}maaş_verisi = {
'Çalışan kimliği': [1, 2, 3, 4, 5],
'Maaş': [5000, 6000, 4500, 7000, 5500]
}
çalışanlar_df = pd. Veri Çerçevesi (çalışanlar_verileri)
maaş_df = pd. DataFrame (maaş_verileri)
PandasAI'ye her iki veri çerçevesini de kapsayan bir soru sorabilirsiniz. PandasAI örneğine yalnızca her iki veri çerçevesini de iletmeniz gerekir.
pandas_ai([çalışanlar_df, maaşlar_df], "Hangi çalışanın en yüksek maaşı var?")
geri döner olivia ki yine doğru cevaptır.
Veri analizi yapmak hiç bu kadar kolay olmamıştı, PandasAI verilerinizle sohbet etmenizi ve kolaylıkla analiz etmenizi sağlar.
PandasAI'ye Güç Veren Teknolojiyi Anlamak
PandasAI, veri analizi sürecini basitleştirerek veri analistlerine çok zaman kazandırır. Ancak arka planda olup bitenleri soyutlar. PandasAI'nin arka planda nasıl çalıştığına dair bir genel bakışa sahip olabilmeniz için kendinizi üretken AI'ya alıştırmanız gerekir. Bu aynı zamanda üretken AI alanındaki en son yenilikleri takip etmenize yardımcı olacaktır.