UDiNus Repository

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Zeniarja, Junta and Salam, Abu and Luthfiarta, Ardytha and Handoko, L Budi and Jamhari, Muhammad (2013) Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction. Semantik 2013, 3 (1). pp. 191-197. ISSN 979-26-0266-6

[img]
Preview
PDF - Published Version
Download (585Kb) | Preview

    Abstract

    Proses clustering dokumen memudahkan pengguna menemukan dokumen yang diinginkan. Dalam prosesnya dokumen yang akan dicluster direpresentasikan menggunakan Vector Space Model (VSM). Masalah klasik dalam VSM adalah matrik term-dokumen yang sangat jarang (banyak mengandung angka 0 dalam term-dokumen matrik) dan juga berdimensi tinggi, sehingga dapat mengurangi kinerja clustering dokumen. Oleh karena itu diperlukan suatu metode untuk bisa mengurangi dimensi term-dokumen dan menghilangkan term yang bernilai 0 tersebut sehingga dapat meningkatkan kinerja proses clustering. Dalam penelitian ini diusulkan model peringkas dokumen otomatis dengan penggabungan metode fitur dan latent semantic analysis (LSA) sebagai feature reduction pada proses clustering dokumen. Tujuan dari penelitian ini adalah untuk meningkatkan akurasi dari clustering dokumen dengan pengkombinasian metode pada peringkas dokumen otomatis yang diintegrasikan sebagai feature reduction. Beberapa tahapan clustering dalam penelitian ini, yaitu preprocessing, peringkas dokumen otomatis dengan metode fitur ,LSA dan Kombinasi, pembobotan kata, feature selection, feature transformation dan algoritma clustering. Hasil penelitian menunjukkan tingkat akurasi menggunakan peringkas dokumen otomatis yang diintegrasikan sebagai feature reduction dengan menggabungkan metode fitur dan metode LSA mencapai 93,33 % yang diperoleh pada tingkat peringkas dokumen otomatis LSA Summary + Feature Summary 50% + Feature Selection 20% + LSA dibandingkan dengan feature selection 20 % tanpa menggunakan peringkas dokumen otomatis yang hanya mencapai tingkat akurasi 89,33 %.

    Item Type: Article
    Subjects: T Technology > Teknik Informatika > INF Informatika
    Universitas Dian Nuswantoro > Fakultas Ilmu Komputer > Teknik Informatika > INF Informatika
    Semantik 2013 > INF Informatika
    Divisions: UNSPECIFIED
    Depositing User: PSI PSI UDinus
    Date Deposited: 05 Dec 2013 10:51
    Last Modified: 12 Dec 2013 14:32
    URI: http://eprints.dinus.ac.id/id/eprint/5205

    Actions (login required)

    View Item