[#TH] Pemrosesan dan Analisis Audio Cerdas Berbasis Digital Signal Processing (DSP)

Peminat topik ini dipersilakan menghubungi promotor serta melakukan pendaftaran melalui halaman pendaftaran, dengan mencantumkan nama promotor. Topik akan tetap tersedia selama informasi ini tayang di website.

Topik Disertasi:

Pemrosesan dan Analisis Audio Cerdas Berbasis Digital Signal Processing (DSP) untuk Peningkatan Kualitas, Sintesis, dan Klasifikasi Audio pada Aplikasi Multimedia


Promotor:

Assoc Prof. Tonny Hidayat, PhD


Latar Belakang dan Motivasi

Perkembangan teknologi multimedia, layanan komunikasi digital, serta kecerdasan buatan telah meningkatkan kebutuhan terhadap pemrosesan audio yang berkualitas tinggi, efisien, dan adaptif. Data audio kini digunakan tidak hanya untuk hiburan (musik, film, game) tetapi juga untuk layanan kritis seperti telemedis (analisis batuk/napas untuk diagnosis penyakit paru), sistem kontrol kendaraan (active noise control), hingga forensik digital (identifikasi pembicara, pemulihan suara rusak).

Namun, kualitas rekaman audio sering menurun akibat derau lingkungan, gema, atau keterbatasan perangkat. Selain itu, sistem klasifikasi dan sintesis audio masih menghadapi tantangan dalam mengenali variasi suara alami, menjaga kejelasan pada bitrate rendah, serta mengolah data secara real-time di perangkat dengan sumber daya terbatas.

Riset ini muncul dari kebutuhan mendesak untuk mengembangkan pendekatan DSP yang lebih cerdas dan adaptif, menggabungkan metode transformasi sinyal, machine learning, serta teknik kompresi modern agar sistem audio menjadi lebih presisi, ringan, dan berkualitas tinggi.


Tujuan Penelitian:

  1. Mengembangkan model peningkatan kualitas audio (noise reduction, echo cancellation, dynamic range control) berbasis DSP dan pembelajaran mesin.
  2. Merancang metode analisis dan transformasi audio (FFT/STFT, spectral analysis, pitch/time manipulation) untuk ekstraksi fitur yang lebih akurat.
  3. Membangun sistem pemodelan dan sintesis suara (TTS, sound synthesis, physical modeling) yang realistis dan efisien.
  4. Merancang algoritma kompresi audio (lossy dan lossless) adaptif untuk mengurangi bitrate tanpa menurunkan persepsi kualitas.
  5. Mengembangkan model klasifikasi audio cerdas untuk pengenalan ucapan, identifikasi pembicara, dan deteksi peristiwa audio dalam berbagai domain aplikasi.

Metodologi Penelitian:

  • Tahap 1 – Kajian Literatur dan Benchmarking
    Menganalisis metode DSP klasik (FFT/STFT, filter digital, coding MP3/AAC) dan pendekatan modern berbasis deep learning (CNN, RNN, Transformer untuk audio).
  • Tahap 2 – Desain Sistem dan Algoritma
    Merancang arsitektur model peningkatan kualitas audio, ekstraksi fitur, dan klasifikasi berbasis hybrid DSP–ML.
  • Tahap 3 – Implementasi dan Pengujian
    Mengembangkan prototipe sistem menggunakan dataset publik (misal: LibriSpeech, MUSAN, ESC-50), diukur dengan metrik PESQ, STOI, SDR (untuk kualitas), akurasi/F1-score (untuk klasifikasi).
  • Tahap 4 – Evaluasi dan Optimasi
    Pengujian pada berbagai lingkungan (komputer, perangkat mobile, sistem tertanam), optimasi komputasi untuk real-time, dan integrasi ke pipeline multimedia/medis/forensik.

Kajian Literatur dan Benchmarking:

  • Algoritma DSP dasar: FFT, STFT, filter IIR/FIR, linear prediction.
  • Metode audio enhancement: Wiener filtering, spectral subtraction, DNN-based denoising.
  • Teknik kompresi: MP3, AAC, OGG, FLAC, serta neural audio codecs (SoundStream, Encodec).
  • Model ML untuk audio: CNN (VGGish), CRNN, WaveNet, Tacotron, HuBERT, Whisper.
  • Sistem pengenalan dan klasifikasi audio: ASR, speaker ID, MIR, event detection (ESC-50, AudioSet).

Kriteria Kandidat:

  • Latar belakang S2 di bidang Informatika, Teknik Elektro, Teknologi Informasi, atau bidang terkait.
  • Memiliki pengetahuan dasar tentang sinyal digital, pemrograman (Python/Matlab/C++), dan machine learning.
  • Tertarik pada penelitian interdisipliner (multimedia, AI, gaming).

Status:

Tersedia

Translate »