Pengembangan Sistem Document Enhancement Berbasis AI Dan Analisis Kontekstual Untuk Optimasi Retrieval-Augmented Generation (RAG) Melalui Pengayaan Konteks, Ekstraksi Teks Tabel, Dan Peningkatan Akurasi OCR (Studi Kasus: Pt Inspigo Inovasi Indonesia)

Yudanarko, Kimi Dandy (2026) Pengembangan Sistem Document Enhancement Berbasis AI Dan Analisis Kontekstual Untuk Optimasi Retrieval-Augmented Generation (RAG) Melalui Pengayaan Konteks, Ekstraksi Teks Tabel, Dan Peningkatan Akurasi OCR (Studi Kasus: Pt Inspigo Inovasi Indonesia). [Experiment] (Unpublished)

[img] Text (RINGKASAN)
Ringkasan.pdf - Submitted Version
Available under License Creative Commons Attribution Share Alike.

Download (113kB)
[img] Text (BAB 1 PENDAHULUAN)
BAB 1 PENDAHULUAN.pdf - Submitted Version
Available under License Creative Commons Attribution Share Alike.

Download (362kB)
[img] Text (DAFTAR PUSTAKA)
DAFTAR PUSTAKA.pdf - Submitted Version
Available under License Creative Commons Attribution Share Alike.

Download (149kB)
[img] Text (LAPORAN LENGKAP)
INSPIGO_Laporan Magang Kimi Dandy_2026.pdf - Submitted Version
Restricted to Registered users only

Download (3MB) | Request a copy

Abstract

PT Inspigo Inovasi Indonesia (Inspigo) merupakan perusahaan rintisan teknologi edukasi (EdTech) yang berfokus pada pengembangan solusi pembelajaran berbasis kecerdasan buatan bagi klien korporasi. Inspigo mengembangkan produk AI Mentor dan Inspigo AI Roleplay yang memanfaatkan dokumen internal perusahaan sebagai sumber utama pengetahuan untuk mendukung proses onboarding, pelatihan berkelanjutan, dan pengembangan kompetensi karyawan. Pengembangan layanan tersebut menghadapi tantangan utama berupa rendahnya kualitas dokumen internal klien yang umumnya bersifat panjang, tidak terstruktur, dan mengandung informasi tersirat, sehingga menurunkan akurasi, relevansi, dan kekontekstualan jawaban yang dihasilkan sistem AI. Inspigo mengembangkan sistem Document Enhancement AI sebagai solusi untuk meningkatkan kualitas dokumen melalui pengayaan konteks, eksplisitasi informasi tersirat, serta peningkatan akurasi ekstraksi teks dan tabel dari dokumen PDF dengan pendekatan Retrieval-Augmented Generation (RAG). Sistem ini menerapkan pipeline pemrosesan dokumen yang terdiri atas lima tahapan terintegrasi, yaitu ekstraksi, enhancement, persetujuan, sintesis, dan vektorisasi. Tahap ekstraksi mengonversi dokumen PDF ke format Markdown terstruktur menggunakan PyMuPDF, pdfplumber, dan Tesseract OCR. Tahap enhancement memperkaya dokumen secara kontekstual menggunakan model AI generatif melalui LangChain dengan pendekatan structured output. Tahap persetujuan mengendalikan kualitas dan biaya pemrosesan melalui mekanisme dual approval. Tahap sintesis menggabungkan dokumen awal dengan hasil enhancement melalui penyisipan catatan kaki berformat Markdown secara token-aware. Tahap vektorisasi menyiapkan dokumen untuk pencarian semantik dan implementasi RAG melalui pemecahan dokumen menjadi beberapa chunk, konversi ke vektor embedding, serta penyimpanan ke dalam basis data vektor Pinecone beserta metadata pendukung. Implementasi sistem Document Enhancement AI meningkatkan kualitas dokumen klien dan memperkuat kapabilitas AI Mentor dalam menyediakan layanan pembelajaran yang akurat dan kontekstual. Proyek ini menunjukkan integrasi teknologi AI modern, pengendalian kualitas, dan pertimbangan biaya dalam arsitektur sistem yang siap produksi serta mencerminkan sinergi antara kebutuhan industri dan transformasi digital edukasi korporasi.

Item Type: Experiment
Contributors:
ContributionContributorsNIDN/NIDK
Thesis advisorUtomo, Denny TriasNIDN0009107104
Uncontrolled Keywords: Pengayaan Ekstraksi OCR Vector Database Pinecone
Subjects: 410 - Rumpun Ilmu Teknik > 450 - Teknik Elektro dan Informatika > 458 - Teknik Informatika
410 - Rumpun Ilmu Teknik > 450 - Teknik Elektro dan Informatika > 459 - Ilmu Komputer
410 - Rumpun Ilmu Teknik > 450 - Teknik Elektro dan Informatika > 461 - Sistem Informasi
410 - Rumpun Ilmu Teknik > 450 - Teknik Elektro dan Informatika > 463 - Teknik Perangkat Lunak
Divisions: Jurusan Teknologi Informasi > Prodi D4 Teknik Informatika > PKL
Depositing User: Kimi Dandy Yudanarko
Date Deposited: 06 Feb 2026 01:50
Last Modified: 06 Feb 2026 01:51
URI: https://sipora.polije.ac.id/id/eprint/53141

Actions (login required)

View Item View Item