Yudanarko, Kimi Dandy (2026) Pengembangan Sistem Document Enhancement Berbasis AI Dan Analisis Kontekstual Untuk Optimasi Retrieval-Augmented Generation (RAG) Melalui Pengayaan Konteks, Ekstraksi Teks Tabel, Dan Peningkatan Akurasi OCR (Studi Kasus: Pt Inspigo Inovasi Indonesia). [Experiment] (Unpublished)
|
Text (RINGKASAN)
Ringkasan.pdf - Submitted Version Available under License Creative Commons Attribution Share Alike. Download (113kB) |
|
|
Text (BAB 1 PENDAHULUAN)
BAB 1 PENDAHULUAN.pdf - Submitted Version Available under License Creative Commons Attribution Share Alike. Download (362kB) |
|
|
Text (DAFTAR PUSTAKA)
DAFTAR PUSTAKA.pdf - Submitted Version Available under License Creative Commons Attribution Share Alike. Download (149kB) |
|
|
Text (LAPORAN LENGKAP)
INSPIGO_Laporan Magang Kimi Dandy_2026.pdf - Submitted Version Restricted to Registered users only Download (3MB) | Request a copy |
Abstract
PT Inspigo Inovasi Indonesia (Inspigo) merupakan perusahaan rintisan teknologi edukasi (EdTech) yang berfokus pada pengembangan solusi pembelajaran berbasis kecerdasan buatan bagi klien korporasi. Inspigo mengembangkan produk AI Mentor dan Inspigo AI Roleplay yang memanfaatkan dokumen internal perusahaan sebagai sumber utama pengetahuan untuk mendukung proses onboarding, pelatihan berkelanjutan, dan pengembangan kompetensi karyawan. Pengembangan layanan tersebut menghadapi tantangan utama berupa rendahnya kualitas dokumen internal klien yang umumnya bersifat panjang, tidak terstruktur, dan mengandung informasi tersirat, sehingga menurunkan akurasi, relevansi, dan kekontekstualan jawaban yang dihasilkan sistem AI. Inspigo mengembangkan sistem Document Enhancement AI sebagai solusi untuk meningkatkan kualitas dokumen melalui pengayaan konteks, eksplisitasi informasi tersirat, serta peningkatan akurasi ekstraksi teks dan tabel dari dokumen PDF dengan pendekatan Retrieval-Augmented Generation (RAG). Sistem ini menerapkan pipeline pemrosesan dokumen yang terdiri atas lima tahapan terintegrasi, yaitu ekstraksi, enhancement, persetujuan, sintesis, dan vektorisasi. Tahap ekstraksi mengonversi dokumen PDF ke format Markdown terstruktur menggunakan PyMuPDF, pdfplumber, dan Tesseract OCR. Tahap enhancement memperkaya dokumen secara kontekstual menggunakan model AI generatif melalui LangChain dengan pendekatan structured output. Tahap persetujuan mengendalikan kualitas dan biaya pemrosesan melalui mekanisme dual approval. Tahap sintesis menggabungkan dokumen awal dengan hasil enhancement melalui penyisipan catatan kaki berformat Markdown secara token-aware. Tahap vektorisasi menyiapkan dokumen untuk pencarian semantik dan implementasi RAG melalui pemecahan dokumen menjadi beberapa chunk, konversi ke vektor embedding, serta penyimpanan ke dalam basis data vektor Pinecone beserta metadata pendukung. Implementasi sistem Document Enhancement AI meningkatkan kualitas dokumen klien dan memperkuat kapabilitas AI Mentor dalam menyediakan layanan pembelajaran yang akurat dan kontekstual. Proyek ini menunjukkan integrasi teknologi AI modern, pengendalian kualitas, dan pertimbangan biaya dalam arsitektur sistem yang siap produksi serta mencerminkan sinergi antara kebutuhan industri dan transformasi digital edukasi korporasi.
| Item Type: | Experiment | ||||||
|---|---|---|---|---|---|---|---|
| Contributors: |
|
||||||
| Uncontrolled Keywords: | Pengayaan Ekstraksi OCR Vector Database Pinecone | ||||||
| Subjects: | 410 - Rumpun Ilmu Teknik > 450 - Teknik Elektro dan Informatika > 458 - Teknik Informatika 410 - Rumpun Ilmu Teknik > 450 - Teknik Elektro dan Informatika > 459 - Ilmu Komputer 410 - Rumpun Ilmu Teknik > 450 - Teknik Elektro dan Informatika > 461 - Sistem Informasi 410 - Rumpun Ilmu Teknik > 450 - Teknik Elektro dan Informatika > 463 - Teknik Perangkat Lunak |
||||||
| Divisions: | Jurusan Teknologi Informasi > Prodi D4 Teknik Informatika > PKL | ||||||
| Depositing User: | Kimi Dandy Yudanarko | ||||||
| Date Deposited: | 06 Feb 2026 01:50 | ||||||
| Last Modified: | 06 Feb 2026 01:51 | ||||||
| URI: | https://sipora.polije.ac.id/id/eprint/53141 |
Actions (login required)
![]() |
View Item |
