Bu büyük dil modeli, siber güvenlik tehditlerini değerlendirmek için karanlık ağda eğitilmiştir. İşte bilmeniz gerekenler.
Büyük dil modellerinin (LLM'ler) popülaritesi hızla artıyor ve yenileri sürekli sahneye giriyor. ChatGPT gibi bu modeller genellikle makaleler, web siteleri, kitaplar ve sosyal medya dahil olmak üzere çeşitli internet kaynakları üzerinde eğitilir.
Benzeri görülmemiş bir hareketle, Güney Koreli araştırmacılardan oluşan bir ekip, yalnızca karanlık ağdan alınan veri kümeleri üzerinde eğitilmiş bir LLM olan DarkBERT'i geliştirdi. Amaçları, mevcut dil modellerinden daha iyi performans gösteren ve tehdit araştırmacılarına, kolluk kuvvetlerine ve siber güvenlik uzmanlarına siber tehditlerle mücadelede yardımcı olan bir yapay zeka aracı oluşturmaktı.
DarkBERT Nedir?
DarkBERT, RoBERTa mimarisine dayanan trafo tabanlı bir kodlayıcı modelidir. LLM, bilgisayar korsanlığı forumlarından, dolandırıcılık web sitelerinden ve yasa dışı faaliyetlerle ilişkili diğer çevrimiçi kaynaklardan alınan veriler dahil olmak üzere milyonlarca karanlık web sayfasında eğitildi.
Dönem "dark web", gizli bir internet bölümünü ifade eder standart web tarayıcıları aracılığıyla erişilemez. Alt bölüm, çalıntı veri, uyuşturucu ve silah ticareti gibi yasa dışı faaliyetlerle ünlü isimsiz web sitelerini ve pazar yerlerini barındırmasıyla ünlüdür.
DarkBERT'i eğitmek için araştırmacılar kazandı karanlık ağa erişim Tor ağı aracılığıyla ve toplanan ham veriler. Veri tekilleştirme, kategori dengeleme ve ön işleme gibi teknikleri kullanarak bu verileri dikkatlice filtrelediler. oluşturmak için yaklaşık 15 gün boyunca RoBERTa'ya beslenen rafine edilmiş bir karanlık web veritabanı oluşturun. DarkBERT.
DarkBERT'in Siber Güvenlik Alanındaki Olası Kullanımları
DarkBERT, siber suçluların dili hakkında dikkate değer bir anlayışa sahiptir ve belirli potansiyel tehditleri tespit etmede mükemmeldir. Karanlık ağı araştırabilir ve veri sızıntıları ve fidye yazılımı gibi siber güvenlik tehditlerini başarılı bir şekilde tanımlayıp işaretleyebilir, bu da onu siber tehditlerle savaşmak için potansiyel olarak yararlı bir araç haline getirir.
DarkBERT'in etkinliğini değerlendirmek için araştırmacılar, onu iki ünlü NLP modeliyle karşılaştırdı: BERT ve RoBERTa, siber güvenlikle ilgili üç önemli kullanım durumunda performanslarını değerlendiriyor, araştırma, Yayınlanan arxiv.org, gösterir.
1. Zararlı Olabilecek Konular İçin Karanlık Web Forumlarını İzleyin
Yaygın olarak yasa dışı bilgi alışverişinde kullanılan karanlık web forumlarını izlemek, potansiyel olarak tehlikeli ileti dizilerini belirlemek için çok önemlidir. Ancak, bunları manuel olarak incelemek zaman alıcı olabilir ve bu da sürecin otomasyonunu güvenlik uzmanları için faydalı hale getirir.
Araştırmacılar, ek açıklama yönergeleri tasarlayarak, bilgisayar korsanlığı forumlarındaki potansiyel olarak zarar verici faaliyetlere odaklandı. gizli verilerin paylaşılması ve kritik kötü amaçlı yazılımların dağıtılması veya güvenlik açıkları.
DarkBERT, kesinlik, hatırlama ve F1 puanı açısından diğer dil modellerinden daha iyi performans gösterdi ve karanlık web'de dikkate değer ileti dizilerini tanımlamak için üstün bir seçim olarak ortaya çıktı.
2. Gizli Bilgileri Barındıran Siteleri Tespit Etme
Bilgisayar korsanları ve fidye yazılımı grupları, fidye taleplerine uymayı reddeden kuruluşlardan çalınan gizli verileri yayınladıkları sızıntı siteleri oluşturmak için karanlık ağı kullanır. Diğer siber suçlular, parolalar ve finansal bilgiler gibi sızdırılmış hassas verileri satma niyetiyle karanlık ağa yükler.
Araştırmacılar yaptıkları çalışmada, kötü şöhretli fidye yazılımı grupları ve kuruluşların özel verilerini yayınlayan fidye yazılımı sızıntı sitelerini analiz etti. DarkBERT, bu tür siteleri tanımlama ve sınıflandırmada diğer dil modellerinden daha iyi performans gösterdi ve dark web'deki yer altı bilgisayar korsanlığı forumlarında kullanılan dili anladığını sergiledi.
DarkBERT, dark web'de uyuşturucu satışı da dahil olmak üzere yasadışı faaliyetlerle ilişkili anahtar kelimeleri doğru bir şekilde belirlemek için BERT-ailesi dil modellerinin doğal bir özelliği olan dolgu-maske işlevinden yararlanır.
Bir ilaç satış sayfasında "MDMA" kelimesi gizlendiğinde, DarkBERT uyuşturucuyla ilgili kelimeler üretirken, diğer modeller genel kelimeleri ve çeşitli meslekler gibi uyuşturucuyla ilgisi olmayan terimleri önerdi.
DarkBERT'in yasa dışı faaliyetlerle ilgili anahtar kelimeleri belirleme yeteneği, ortaya çıkan siber tehditlerin izlenmesi ve ele alınmasında değerli olabilir.
DarkBERT Genel Halk İçin Erişilebilir mi?
DarkBERT şu anda halka açık değil, ancak araştırmacılar onu akademik amaçlarla kullanma taleplerine açık.
Tehdit Tespiti ve Önleme için Yapay Zekanın Gücünden Yararlanın
DarkBERT, dark web verileri konusunda önceden eğitilmiştir ve birden fazla siber güvenlik kullanım durumunda mevcut dil modellerinden daha iyi performans göstererek kendisini dark web araştırmasını ilerletmek için çok önemli bir araç olarak konumlandırır.
Karanlık web eğitimli yapay zeka, sızan web sitelerini belirlemek de dahil olmak üzere çeşitli siber güvenlik görevleri için kullanılma potansiyeline sahiptir. gizli veriler, yasa dışı bilgi paylaşımını tespit etmek için karanlık web forumlarını izleme ve siber ile ilgili anahtar kelimeleri belirleme tehditler.
Ancak, diğer LLM'ler gibi DarkBERT'in de devam eden bir çalışma olduğunu ve performansının sürekli eğitim ve ince ayarlarla iyileştirilebileceğini her zaman hatırlamalısınız.