Penulis adalah honorable Faculty lembaga Pengembangan Perbankan indonesia (lPPi). Artikel ini merupakan pendapat pribadi.
Infobank
MULTIMODAL AI (MAI) adalah jenis artificial intelligence (AI) yang dapat memproses dan mengintegrasikan informasi dari berbagai jenis data (modalitas), seperti teks, gambar, audio, dan video (Cole Stryker, IBM Think 2025). Definisi MAI lainnya menurut McKinsey (2025) adalah jenis kecerdasan buatan yang dapat memahami dan memproses berbagai jenis informasi, seperti teks, gambar, audio, dan video, secara bersamaan.
Berdasarkan definisi tersebut, MAI dapat melakukan tugas yang lebih kompleks dan membuat prediksi yang lebih akurat. MAI dapat menyempurnakan ringkasan dengan menyertakan gambar atau klip audio yang relevan sehingga menghasilkan keluaran yang lebih kaya dan informatif.