Mengenai Saya

Nama Saya Alfahri Rabbi Ramadhan TTL Bekasi,22 Desember 2000

Kamis, 10 Maret 2022

5 Artikel Data Mining

Data Mining dalam Menganalisis Faktor Alasan Pemilihan Perumahan


 

Pada jurnal diatas menggunakan Type data mining algoritma C4.5 yang merupakan perangkat lunak yang bersifat open source, Pada kedua table diatas menggunakan attribute :

Table 1 : Aksesbilitas, tipologi, Harga, Pembayaran, Keputusan

Tabel 2 : Klasifikasi Penilaian, jumlah kasus, beli, tidak beli, entropy, Gain

Pada table diatas untuk melihat hasil pengujian dengan menggunakan tools data mining rapidminer. Pada table diatas diperoleh dari masing-masing table yaitu 4 dimensi. Proses ini dilanjukan dengan menjalankan (run) dan dapat kita lihat hasil pohon keputusan yang dibentuk dan sama dengan hasil perhitungan manual yang telah dilakukan diatas. Dan hasil yang diperoleh pada table diatas diperoleh keputusan (Jika Harga = Tinggi maka konsumen = Tidak Beli.)  (Jika Harga = Rendah, Aksebilitas =Jauh, maka konsumen = Tidak Beli.) (Jika Harga = Rendah, Aksesbilitas = Sedang, Maka Konsumen = Beli) (Jika Harga = Rendah, Aksesbilitas = Dekat, Tipologi=Luas, Maka Konsumen = Beli) (Jika Harga = Rendah, Aksesbilitas = Dekat, Tipologi = Sempit, maka Konsumen = Tidak Beli.).Task mining yang digunakan adalah Classification karena untuk memberikan Tindakan untuk pengelompokan pemilihan perumahan

Hasil :


 

Penerapan Data Mining Penerimaan Karyawan Menggunakan Metode Naive Bayes Clasifier

Algoritma Naïve Bayes merupakan sebuah metode klasifikasi menggunakan metode probabilitas dan statistic yang dikemukakan oleh ilmuan inggris Thomas Bayers. Pada jurnal diatas menggunakan tipe data mining Naïve Bayes Classifier dan pada table diatas menggunakan attribute :

Umur, Berat badan, Pendidikan, Tinggi Badan, Status Kesehatan

Pada table diatas diperoleh 5 dimensi. naive bayes classifier memberikan sistem pendukung keputusan penerimaan karyawan dengan tingkat akurasi sebesar 80% dengan data uji sebanyak lima data. Analisis ini bertujuan untuk mengetahui lebih jelas bagaimana cara kerja sistem tersebut dan masalah yang dihadapi untuk dijadikan landasan usulan. pada sistem yang lama masih menggunakan lembaran-lembaran berkas atau arsip sedangkan yang diusulkan dilakukan secara terkomputerisasi sehingga dapat mempermudah penyimpanan, pencarian, pengubahan serta penghapusan data. Dan pada table diatas menggunakan tools boostrap, Fast Procedur, Data latih dalam bentuk json, Jquery. Task mining yang digunakan adalah Classification karena untuk memberikan Tindakan untuk mengelompokkan data studi kasusnya.

Hasil :



Pengembangan Web Service Algoritma Data Mining Menggunakan Metode Rest API

 

Type Data :

Nominal adalah tipe data diskrit yang tidak mengenal urutan.
Contoh :

  • Warna Baju   : Hijau , Merah, Kuning, dll
  • Suku Bangsa : Jawa, Batak, Ambon, Tionghoa, dll
  • Jenis Bunga   : Iris Sentosa, Iris Virginica, dll
  • Atribut           : Pada table di atas, Atribut nya terdiri dari : class, sepal length, sepal 
                                 width, petal length, petal width
  • Type Atribut  : Sepal length, sepal width, petal length, petal width adalah Atribut
                                 Ordinal class adalah Atribut Nominal
  • Dimensi         : Table di atas memiliki dimensi sebanyak 4


Preprocessing :

Teknik pengumpulan data yang digunakan dalam penelitian ini yaitu studi literatur dan data sekunder berdasarkan penelitian sebelumnya. Teknik pengumpulan data yang dilakukan untuk menentukan kriteria dengan menggunakan jurnal dan literatur relevan lainnya. Selain itu dalam penelitian ini juga membutuhkan data pendukung yang bersumber dari buku, jurnal, dan literatur lainnya yang relevan dengan penelitian ini.

 

Teknik analisis data yang digunakan dalam penelitian ini adalah analisis kuantitatif. kuantitatif merupakan metode penelitian yang dilandasi pada aliran filsafat positivisme, digunakan untuk meneliti pada populasi atau sampel tertentu, teknik pengambilan sampel data dilakukan secara acak dan menggunakan instrumen penelitian, analisis data bersifat kuantitatif/statistik dengan tujuan untuk menguji hipotesis yang telah ditetapkan.

 

Task Mining yang dilakukan :


Taks Mining yang dilakukan adalah Classification (klasifikasi)

Berdasarkan tabel di atas dapat diketahui persentase untuk Correctly Classified Instance adalah sebesar 86% sementara persentase untuk Incorrectly Classified Instance adalah sebesar 14%. Di mana dari 150 data bunga Iris, ada sebanyak 129 data bunga iris berhasil diklasifikasikan dengan benar dan sebanyak 21 data penggunaan listrik rumah tangga tidak berhasil diklasifikasikan dengan benar.

 

Hasil yang diperoleh :

Hasil pengujian dan analisis penelitian tentang web service data mining ini, dapat diambil kesimpulan bahwa sistem web service yang dikembangkan dengan metode Rest API menggunakan algoritma Naive Bayes dalam mengelola data, dimana algoritma Naive Bayes memanfaatkan data latih untuk menghasilkan probabilitas setiap kriteria untuk class yang berbeda, sehingga nilai-nilai probabilitas dari kriteria tersebut dapat dioptimalkan untuk memprediksi data uji berdasarkan proses klasifikasi yang dilakukan oleh metode Naive Bayes itu sendiri.

 

Tools yang digunakan :

Aplikasi Client Untuk memastikan Rest API yang telah dibuat berfungsi dengan baik dan dapat digunakan oleh aplikasi klien, peneliti membuat sebuah aplikasi klien berbasis web yang terhubung dengan Rest API yang telah dibuat sebelumnya untuk memproses sebuah dataset.

 

Implementasi Data Mining Pada Hasil Penjualan Barang Menggunakan Metode K-Means Clustering

Hasil Interasi Data


  • Type data yang digunakan pada data mining pada hasil penjualan barang adalah type data numerik. Karena data yang diambil dari hasil penjualan barang yaitu dari stock awal, terjual barang, dan stock akhir.
  • Atribut yang dimiliki pada data yang digambar tersebut adalah stock awal, terjual, stock akhir, C1, C2, dan C3.
  • Type atribut yag digunakan adalah numerik karena pada data tersebut yang diambil adalah hasil penjualan barang.
  • Dimensi yang ada pada data yang digambar kedua ada 6 dimensi.
  • Preprocessing mengambil data sampel penjualan barang dan mengelompokkan kategori barangnya.
  • Task data mining yang digunakan adalah segmentation karena ada clustering menggunakan metode unsupervised karena tidak ada satu atributpun yang digunakan untuk memandu proses pembelajaran sehingga data yang dianalisis secara otomatis dengan pengelompokkan data dari data-data yang sudah pernah digunakan.

 

 

·     Pada gambar diatas adalah hasil dari data penjualan barang yang menggunakan metode K-Means Clustering dan data akan dikelompokkan sesuai dengan nama barang dan cluster tersebut.

·  Tools yang digunakan adalah Rattle karena sudah ada fitur clustering, opsi pengelompokkan yang tersedia K-Means, Clara, Hierarchical, dan BiCluster.

 

Implementasi Data Mining Dalam Memprediksi Transaksi Penjualan Menggunakan Algoritma Apriori (Studi Kasus PT.Arma Anugerah Abadi Cabang Sei Rampah)


  • Type data yang digunakan pada data mining pada table diatas adalah algoritma apriori.
  • Atribut yang dimiliki pada data yang digambar tersebut adalah kode produk, jumlah, nilai support, dan pada table ke 2 adalah kombinasi, item, jumlah, nilai support.
  • Dimensi yang ada pada data yang ditabel pertama ada 3 dimensi, dan ditabel kedua ada 4 dimensi.
  • Preprocessing mengambil data sampel penjualan roti bungkus dan mengelompokkan kategori roti bungkusnya.
  • Task data mining yang digunakan adalah Asosciation karena ada untuk menganalisa table transaksi penjualan dan mengidentifikasi produk-produk roti bungkus.
  • Tools yang digunakan adalah affinity analysis atau market basket analysis.

 

Hasil :


Referensi :