BRIN

Dashboard Evaluasi LLM untuk Konsultasi Psikologis

Dashboard terpusat hasil kerja sama dengan BRIN untuk mengevaluasi output LLM pada skenario konsultasi psikologis.

Dashboard Evaluasi LLM untuk Konsultasi Psikologis - Slide 1

Tentang Klien

BRIN
Industri
Penelitian & Pemerintah
Lokasi
Indonesia
Ukuran Perusahaan
Lembaga Riset Nasional
Kasus Penggunaan
Evaluasi & Penjaminan Kualitas LLM

Ringkasan Dampak

Metode Evaluasi
Terpusat
Efisiensi Proses
Meningkat
Konsistensi Penilaian
Lebih Baik

Tantangan Bisnis

Proses evaluasi output LLM sebelumnya dilakukan menggunakan spreadsheet sehingga tidak terstruktur dan sulit ditelusuri.

Evaluator kesulitan melakukan penilaian secara sistematis dari level pesan hingga kualitas keseluruhan percakapan.

Admin tidak memiliki visibilitas menyeluruh terhadap progres evaluasi dan kualitas LLM.

Solusi

Kami mengembangkan dashboard evaluasi LLM yang terpusat dan sistematis.

Evaluator dapat menilai output chat LLM per pesan, memberikan umpan balik, serta menentukan rating kualitas keseluruhan.

Sisi admin dilengkapi fitur manajemen dialog, assignment evaluator, manajemen pengguna, serta ringkasan hasil evaluasi.

Dashboard menyajikan ringkasan kualitas LLM berdasarkan hasil penilaian para evaluator.

Fitur Utama yang Diimplementasikan

  • Evaluasi Output LLM per Pesan
  • Penilaian Kualitas Percakapan
  • Manajemen Evaluator & Dialog
  • Ringkasan dan Insight Evaluasi
  • Workflow Evaluasi Terpusat

Hasil

Proses evaluasi LLM menjadi lebih terstruktur, konsisten, dan mudah diaudit.

Penggunaan spreadsheet berhasil dieliminasi, meningkatkan efisiensi dan akurasi evaluasi.

BRIN memperoleh insight yang jelas mengenai kualitas LLM dalam konteks konsultasi psikologis.

Dampak Kinerja

20
Spreadsheet-Based Evaluation
95
Centralized Evaluation Dashboard