Logo

Perancangan dan implementasi automated text integration menggunakan metode TF-IDF dan hierarchical clustering

Taufik, Hendrawan (2007) Perancangan dan implementasi automated text integration menggunakan metode TF-IDF dan hierarchical clustering. Bachelor thesis, Petra Christian University.

Full text not available from this repository.

Abstract

Pada era teknologi informasi, generasi muda dan generasi tua pengguna teknologi menuntut agar semua informasi dapat diperoleh dengan cepat dan tidak membuang banyak waktu. Salah satu cara untuk memperoleh informasi adalah dengan membaca beberapa dokumen yang pada kenyataannya banyak membahas topik yang sama sehingga memerlukan waktu yang cukup lama. Automated Text Integration adalah aplikasi yang berguna untuk menghasilkan integrasi dari beberapa dokumen yang berbeda dengan topik bahasan yang sama. Aplikasi ini memberi kemudahan kepada pembaca yang memerlukan informasi, sehingga tidak perlu lagi membaca kumpulan dokumen satu per satu. Automated Text Integration akan membantu menghasilkan suatu output teks yang tetap memiliki/ mengandung bagian-bagian yang penting dari dokumen asli. Aplikasi dibuat menggunakan Microsoft Visual Basic 6.0 dan Microsoft SQL Server 2000 beserta aplikasi pendukung Microsoft Word. Konsep utama dalam pengembangan aplikasi Automated Text Integration ini adalah menggunakan konsep Data Mining. Untuk mendukung konsep tersebut, maka digunakan metode TF-IDF (Terms Frequency ? Inverse Document Frequency) dan algoritma Cosine Distance. Teknik Data Mining yang digunakan dalam pembuatan aplikasi ini adalah teknik Hierarchical Clustering. Metode TF-IDF berfungsi untuk menghitung bobot nilai dari setiap kalimat. Sedangkan algoritma Cosine Distance berfungsi untuk menghitung similarity (tingkat kesamaan) antar dua buah objects (dokumen yang akan diintegrasi). Dari hasil pengujian dan survei yang dilakukan kepada 100 orang koresponden, sebanyak 80% lebih koresponden menyatakan bahwa Automated Text Integration cocok dalam mengintegrasikan dokumen tugas akhir dari jurusan Teknik Informatika. Berdasarkan hasil survei yang dilakukan, aplikasi juga akan menghasilkan suatu hasil integrasi yang baik bila jenis dokumen yang diintegrasi bertipe eksposisi.

Item Type: Thesis (Bachelor)
Uncontrolled Keywords: automated text integration, data mining, hierarchical clustering, tf-idf, cosine distance
Subjects: UNSPECIFIED
Divisions: UNSPECIFIED
Depositing User: Admin
Date Deposited: 23 Mar 2011 18:48
Last Modified: 28 Mar 2011 21:51
URI: http://repository.petra.ac.id/id/eprint/12786

Actions (login required)

View Item