Data Mining dalam Menganalisis Faktor Alasan Pemilihan Perumahan
Pada jurnal diatas menggunakan Type data mining
algoritma C4.5 yang merupakan perangkat lunak yang bersifat open source, Pada
kedua table diatas menggunakan attribute :
Table 1 : Aksesbilitas, tipologi, Harga, Pembayaran, Keputusan
Tabel 2 : Klasifikasi Penilaian, jumlah kasus, beli, tidak beli,
entropy, Gain
Pada table diatas untuk melihat hasil pengujian
dengan menggunakan tools data mining rapidminer. Pada table diatas diperoleh
dari masing-masing table yaitu 4 dimensi. Proses ini dilanjukan dengan
menjalankan (run) dan dapat kita lihat hasil pohon keputusan yang dibentuk dan
sama dengan hasil perhitungan manual yang telah dilakukan diatas. Dan hasil
yang diperoleh pada table diatas diperoleh keputusan (Jika Harga = Tinggi maka
konsumen = Tidak Beli.) (Jika Harga = Rendah, Aksebilitas =Jauh, maka
konsumen = Tidak Beli.) (Jika Harga = Rendah, Aksesbilitas = Sedang, Maka
Konsumen = Beli) (Jika Harga = Rendah, Aksesbilitas = Dekat, Tipologi=Luas,
Maka Konsumen = Beli) (Jika Harga = Rendah, Aksesbilitas = Dekat, Tipologi =
Sempit, maka Konsumen = Tidak Beli.).Task mining yang digunakan adalah
Classification karena untuk memberikan Tindakan untuk pengelompokan pemilihan
perumahan
Hasil :
Penerapan Data Mining Penerimaan Karyawan Menggunakan Metode Naive Bayes Clasifier
Algoritma Naïve Bayes merupakan sebuah metode
klasifikasi menggunakan metode probabilitas dan statistic yang dikemukakan oleh
ilmuan inggris Thomas Bayers. Pada jurnal diatas menggunakan tipe data mining
Naïve Bayes Classifier dan pada table diatas menggunakan attribute :
Umur, Berat badan, Pendidikan, Tinggi Badan, Status Kesehatan
Pada table diatas diperoleh 5 dimensi. naive
bayes classifier memberikan sistem pendukung keputusan penerimaan karyawan
dengan tingkat akurasi sebesar 80% dengan data uji sebanyak lima data. Analisis
ini bertujuan untuk mengetahui lebih jelas bagaimana cara kerja sistem tersebut
dan masalah yang dihadapi untuk dijadikan landasan usulan. pada sistem yang
lama masih menggunakan lembaran-lembaran berkas atau arsip sedangkan yang diusulkan
dilakukan secara terkomputerisasi sehingga dapat mempermudah penyimpanan,
pencarian, pengubahan serta penghapusan data. Dan pada table diatas menggunakan
tools boostrap, Fast Procedur, Data latih dalam bentuk json, Jquery. Task
mining yang digunakan adalah Classification karena untuk memberikan Tindakan
untuk mengelompokkan data studi kasusnya.
Hasil :
Pengembangan Web Service Algoritma Data Mining
Menggunakan Metode Rest API
Type Data :
Nominal adalah tipe data diskrit yang tidak
mengenal urutan.
Contoh :
- Warna Baju : Hijau , Merah, Kuning, dll
- Suku Bangsa : Jawa, Batak, Ambon, Tionghoa, dll
- Jenis Bunga : Iris Sentosa, Iris Virginica, dll
- Atribut : Pada table di atas, Atribut nya terdiri dari : class, sepal length, sepal
- Type Atribut : Sepal length, sepal width, petal length, petal width adalah Atribut
- Dimensi : Table di atas memiliki dimensi sebanyak 4
Preprocessing :
Teknik pengumpulan data yang digunakan dalam
penelitian ini yaitu studi literatur dan data sekunder berdasarkan penelitian
sebelumnya. Teknik pengumpulan data yang dilakukan untuk menentukan kriteria
dengan menggunakan jurnal dan literatur relevan lainnya. Selain itu dalam
penelitian ini juga membutuhkan data pendukung yang bersumber dari buku,
jurnal, dan literatur lainnya yang relevan dengan penelitian ini.
Teknik analisis data yang digunakan dalam
penelitian ini adalah analisis kuantitatif. kuantitatif merupakan metode
penelitian yang dilandasi pada aliran filsafat positivisme, digunakan untuk
meneliti pada populasi atau sampel tertentu, teknik pengambilan sampel data
dilakukan secara acak dan menggunakan instrumen penelitian, analisis data bersifat
kuantitatif/statistik dengan tujuan untuk menguji hipotesis yang telah
ditetapkan.
Task Mining yang dilakukan :
Taks Mining yang dilakukan adalah Classification (klasifikasi)
Berdasarkan tabel di atas dapat diketahui
persentase untuk Correctly Classified Instance adalah sebesar 86% sementara
persentase untuk Incorrectly Classified Instance adalah sebesar 14%. Di mana
dari 150 data bunga Iris, ada sebanyak 129 data bunga iris berhasil
diklasifikasikan dengan benar dan sebanyak 21 data penggunaan listrik rumah
tangga tidak berhasil diklasifikasikan dengan benar.
Hasil yang diperoleh :
Hasil pengujian dan analisis penelitian tentang
web service data mining ini, dapat diambil kesimpulan bahwa sistem web service
yang dikembangkan dengan metode Rest API menggunakan algoritma Naive Bayes
dalam mengelola data, dimana algoritma Naive Bayes memanfaatkan data latih
untuk menghasilkan probabilitas setiap kriteria untuk class yang berbeda,
sehingga nilai-nilai probabilitas dari kriteria tersebut dapat dioptimalkan
untuk memprediksi data uji berdasarkan proses klasifikasi yang dilakukan oleh
metode Naive Bayes itu sendiri.
Tools yang digunakan :
Aplikasi Client Untuk memastikan Rest API yang
telah dibuat berfungsi dengan baik dan dapat digunakan oleh aplikasi klien,
peneliti membuat sebuah aplikasi klien berbasis web yang terhubung dengan Rest
API yang telah dibuat sebelumnya untuk memproses sebuah dataset.
Implementasi Data Mining Pada Hasil Penjualan
Barang Menggunakan Metode K-Means Clustering
Hasil Interasi Data
- Type data yang digunakan pada data mining pada hasil penjualan barang adalah type data numerik. Karena data yang diambil dari hasil penjualan barang yaitu dari stock awal, terjual barang, dan stock akhir.
- Atribut yang dimiliki pada data yang digambar tersebut adalah stock awal, terjual, stock akhir, C1, C2, dan C3.
- Type atribut yag digunakan adalah numerik karena pada data tersebut yang diambil adalah hasil penjualan barang.
- Dimensi yang ada pada data yang digambar kedua ada 6 dimensi.
- Preprocessing mengambil data sampel penjualan barang dan mengelompokkan kategori barangnya.
- Task data mining yang digunakan adalah segmentation karena ada clustering menggunakan metode unsupervised karena tidak ada satu atributpun yang digunakan untuk memandu proses pembelajaran sehingga data yang dianalisis secara otomatis dengan pengelompokkan data dari data-data yang sudah pernah digunakan.
· Pada gambar diatas adalah hasil dari data penjualan barang yang
menggunakan metode K-Means Clustering dan data akan dikelompokkan sesuai dengan
nama barang dan cluster tersebut.
· Tools yang digunakan adalah Rattle karena sudah ada fitur clustering, opsi pengelompokkan yang tersedia K-Means, Clara, Hierarchical, dan BiCluster.
Implementasi Data Mining Dalam Memprediksi
Transaksi Penjualan Menggunakan Algoritma Apriori (Studi Kasus PT.Arma Anugerah
Abadi Cabang Sei Rampah)
- Type data yang digunakan pada data mining pada table diatas adalah algoritma apriori.
- Atribut
yang dimiliki pada data yang digambar tersebut adalah kode produk, jumlah,
nilai support, dan pada table ke 2 adalah kombinasi, item, jumlah, nilai
support.
- Dimensi
yang ada pada data yang ditabel pertama ada 3 dimensi, dan ditabel kedua
ada 4 dimensi.
- Preprocessing
mengambil data sampel penjualan roti bungkus dan mengelompokkan kategori
roti bungkusnya.
- Task
data mining yang digunakan adalah Asosciation karena ada untuk menganalisa
table transaksi penjualan dan mengidentifikasi produk-produk roti bungkus.
- Tools
yang digunakan adalah affinity analysis atau market basket analysis.
Hasil :
- https://prosiding.konik.id/index.php/konik/article/view/83/76
- https://proceeding.unpkediri.ac.id/index.php/inotek/article/view/121
- https://ejournal.upbatam.ac.id/index.php/prosiding/article/view/3611
- https://www.unisbank.ac.id/ojs/index.php/sendi_u/article/view/8653
- https://www.researchgate.net/publication/338632311_Implementasi_Data_Mining_Dalam_Memprediksi_Transaksi_Penjualan_Menggunakan_Algoritma_Apriori_Studi_Kasus_PTArma_Anugerah_Abadi_Cabang_Sei_Rampah
- Alfahri Rabbi Ramadhan (10119455)
- Daffa Mithwa Adabi (11119536)
- Muhammad Alam Syahputra Z. (13119986)
- Muhammad Fathin (14119065)
- Yoni Nanda Kusuma (16119717)