Terlatih di web gelap, Darkbert AI dapat melawan kejahatan siber.

by Shiva Ganesh

AI bermaksud untuk membantu para ahli keamanan siber dalam mengumpulkan intelijen ancaman siber.

Dalam langkah yang belum pernah terjadi sebelumnya, sekelompok akademisi Korea Selatan menciptakan DarkBERT, sebuah LLM yang dilatih hanya pada informasi dark web. Mereka bertujuan untuk mengembangkan alat kecerdasan buatan yang lebih baik dari model bahasa yang ada dan membantu peneliti ancaman, penegak hukum, dan ahli keamanan siber dalam memerangi ancaman siber.

Apa itu DarKBERT?

DarkBERT adalah model pengkode berbasis transformer yang didasarkan pada arsitektur RoBERTa. LLM dilatih pada jutaan halaman web dark web, termasuk data dari forum peretas, situs penipuan, dan sumber internet kriminal lainnya. Istilah dark web mengacu pada area tersembunyi yang tidak dapat dijangkau di internet menggunakan browser standar. Sektor ini terkenal karena situs web dan pasar anonimnya, yang terkenal karena aktivitas kriminal seperti perdagangan data curian, narkotika, dan senjata api.

Para peneliti menggunakan jaringan Tor untuk memperoleh akses ke dark web dan mengumpulkan data mentah untuk melatih DarkBERT. Mereka menyaring data ini dengan teliti menggunakan teknik seperti deduplikasi, keseimbangan kategori, dan pra-pemrosesan untuk menghasilkan database dark web yang disempurnakan. Kemudian dimasukkan ke Roberta selama sekitar 15 hari untuk menghasilkan DarkBERT.

  • Potensi Penggunaan DarkBERT dalam Keamanan Siber: DarkBERT memiliki pemahaman yang luar biasa tentang bahasa sehari-hari para penjahat siber dan sangat baik dalam mengidentifikasi bahaya-bahaya tertentu. Ia dapat melakukan penelitian dark web dan berhasil menemukan dan menyoroti bahaya keamanan siber seperti pelanggaran data dan ransomware, menjadikannya senjata yang berpotensi berharga dalam pertempuran melawan ancaman siber. Peneliti membandingkan DarkBERT dengan dua model NLP terkenal, BERT dan RoBERTa, menganalisis kinerja mereka di tiga kasus penggunaan terkait keamanan siber yang kritis, menurut penelitian yang diterbitkan di arxiv.org.
  • Periksa Forum Dark Web untuk Topik Berpotensi Berbahaya: Memantau forum dark web, yang banyak digunakan untuk pertukaran informasi ilegal, sangat penting untuk menemukan posting-posting berbahaya. Namun, memeriksanya secara manual dapat memakan waktu, sehingga para spesialis keamanan akan mendapat manfaat dari otomatisasi proses tersebut.
  • Temukan Situs Web yang Menyimpan Informasi Sensitif: Peretas dan kelompok ransomware menggunakan dark web untuk membuat situs bocor untuk mengungkapkan informasi rahasia yang dicuri dari perusahaan yang menolak membayar tebusan. Beberapa penipu hanya memposting materi sensitif yang bocor ke dark web, seperti kata sandi dan informasi bank, dengan maksud menjualnya.
  • Deteksi Kata Kunci Terkait Ancaman di Dark Web: DarkBERT menggunakan fungsi fill-mask, fitur model bahasa keluarga BERT, untuk dapat mendeteksi frasa-frasa yang terkait dengan aktivitas kriminal, seperti transaksi narkoba di dark web. DarkBERT menciptakan kata-kata terkait narkoba ketika “MDMA” disembunyikan di situs penjualan obat-obatan, tetapi model lain menyarankan kata-kata generik dan kata kunci yang tidak terkait dengan narkoba, seperti beberapa profesi. Kemampuan DarkBERT untuk menemukan frasa-frasa yang terkait dengan tindakan ilegal dapat membantu mengidentifikasi dan menyelesaikan risiko siber baru.
  • Penggunaan AI untuk Deteksi dan Pencegahan Ancaman: DarkBERT telah dilatih sebelumnya pada data dark web dan mengungguli model bahasa yang ada di banyak kasus penggunaan keamanan siber, menjadikannya alat penting untuk memperdalam penelitian dark web. Kecerdasan buatan yang dilatih pada dark web dapat digunakan untuk berbagai kegiatan keamanan siber, seperti mengidentifikasi situs web yang menjual data pribadi bocor, memantau forum dark web untuk pertukaran informasi ilegal, dan menemukan kata kunci yang relevan dengan bahaya siber. Namun, ingatlah bahwa DarkBERT, seperti LLM lainnya, masih dalam tahap pengembangan, dan kinerjanya dapat ditingkatkan dengan pelatihan dan penyesuaian yang terus-menerus.

Posted

in

by

Tags:

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *