Saat Algoritma Membaca Karakter Seseorang: Riset Personality Prediction Berbasis Teks Media Sosial

Yogyakarta – Media sosial bukan hanya tempat berbagi cerita dan opini, tetapi juga cermin kepribadian seseorang. Unggahan teks yang tampak sederhana ternyata menyimpan pola linguistik yang bisa dianalisis untuk memetakan lima dimensi utama kepribadian (Big Five traits): Extraversion, Neuroticism, Agreeableness, Conscientiousness, dan Openness. Pertanyaan besarnya, model komputasi mana yang paling efektif untuk melakukan prediksi kepribadian dari teks ini?

Inilah yang diteliti oleh Anggit Dwi Hartanti, mahasiswa Program Doktor Universitas Amikom Yogyakarta. Penelitian ini secara sistematis membandingkan performa beberapa teknik pemodelan prediktif, mulai dari Linear Regression, Ridge Regression, Random Forest, hingga Neural Network. Data penelitian diambil dari MyPersonality Dataset di platform Kaggle yang berisi ribuan status media sosial yang sudah dilabeli skor kepribadian berdasarkan kerangka Big Five.

Mengapa Penelitian Ini Penting?

Prediksi kepribadian dari teks memiliki banyak manfaat praktis. Di bidang psikologi, teknologi ini bisa digunakan untuk mendukung diagnosis kesehatan mental. Di ranah industri, perusahaan dapat memanfaatkannya untuk rekrutmen berbasis AI atau pemasaran personalisasi. Bahkan di dunia digital, prediksi ini bisa memperkaya interaksi manusia–komputer, misalnya chatbot yang menyesuaikan respons sesuai gaya kepribadian pengguna.

Hasil penelitian ini menunjukkan bahwa pemodelan kepribadian berbasis teks dapat dilakukan secara efektif, namun pemilihan metode sangat menentukan keberhasilan. Model Random Forest terbukti mampu memberikan tingkat akurasi tertinggi dalam memprediksi dimensi kepribadian tertentu, tetapi membutuhkan waktu komputasi yang sangat lama sehingga kurang sesuai untuk penggunaan real-time. Sementara itu, Ridge Regression tampil sebagai pilihan yang lebih seimbang: cukup akurat, stabil, dan efisien dalam hal waktu pelatihan, sehingga lebih praktis untuk aplikasi yang membutuhkan kecepatan dan keterbatasan sumber daya. Temuan ini menggarisbawahi adanya dilema antara akurasi tinggi dan efisiensi komputasi, yang perlu dipertimbangkan dalam implementasi nyata, misalnya pada platform media sosial, sistem rekrutmen digital, atau aplikasi psikologi berbasis AI.

Implikasi Penelitian

Studi yang dilakukan di bawah supervisi tim promotor: Prof. Dr. Ema Utami, Arief Setyanto, Ph.D. dan Prof. Dr. Kusrini, ini juga menyingkap keterbatasan penting. Neural Network, meski secara teori unggul dalam menangkap pola non-linear, justru belum mampu menunjukkan performa optimal, kemungkinan besar karena keterbatasan jumlah data dan pengaturan parameter. Begitu pula Linear Regression, yang hasilnya jauh tertinggal karena tidak mampu menangkap kompleksitas bahasa alami. Artinya, masih ada pekerjaan rumah bagi peneliti ke depan, terutama dalam hal pengembangan arsitektur jaringan saraf yang lebih canggih, pemanfaatan dataset yang lebih besar, atau penerapan model berbasis transformer seperti BERT untuk meningkatkan kualitas prediksi. Dengan demikian, penelitian ini tidak hanya memberi kontribusi praktis untuk aplikasi saat ini, tetapi juga membuka jalan bagi eksplorasi lanjutan agar prediksi kepribadian dari teks bisa semakin akurat, cepat, dan relevan di berbagai bidang.

Menurut Anggit, penelitian ini dapat membuka jalan bagi integrasi AI dalam psikologi dan teknologi digital. “Prediksi kepribadian dari teks bukan untuk menggantikan psikolog, tetapi untuk memberi insight awal yang bisa mendukung pengambilan keputusan di berbagai bidang,” ujarnya.

Translate »