Mengenai Saya
- Alfahri Rabbi Ramadhan
- Nama Saya Alfahri Rabbi Ramadhan TTL Bekasi,22 Desember 2000
Selasa, 12 April 2022
Analisis Data dan Visualisasi Nomer 2 Minggu 7
Analisis Data dan Visualisasi Nomer 1 Minggu 7
Data Tabel Keputusan
- Perhatikan data yang ada pada tabel keputusan “Play Tennis”.
- Buatlah pohon keputusan untuk data tersebut.
Tabel :
Data tabel keputusan untuk “Play Tennis”
1. Langkah pertama, untuk membuat
pohon keputusan adalah mencari entropy dengan menggunakan
rumus :
Dimana:
· S
: adalah himpunan (dataset) kasus
· k
: adalah banyaknya partisi S
· pj :
adalah probabilitas yang di dapat dari Sum(Ya) dibagi Total Kasus.
2. Setelah mendapatkan entropy
maka hitung gain tiap attribute.
Rumus :
Dimana:
·
S : ruang (data) sample yang
digunakan untuk training.
·
A : atribut.
·
|Si| : jumlah sample untuk
nilai V.
·
|S| : jumlah seluruh sample
data.
·
Entropi(Si) : entropy untuk
sample-sample yang memiliki nilai i
Cara membuat Decision Tree:
- Cari nilai gain tertinggi dari setiap atribut yang ada , maka attribute tersebut menjadi root pada iterasi pertama.
- Jika entropi pada nilai attribute tersebut adalah 0 , maka nilai tersebut merupakan leaf. Sedangkan nilai lainnya akan digunakan untuk iterasi selanjutnya..
- Gunakan nilai attribute yang bukan Leaf tersebut sebagai pivot , untuk dicari entropy dan gain pada iterasi selanjutnya.
- Lakukan langkah tersebut sampai nilai entropy pada semua nilai attribute = 1.
Jawab :
Entropi (S) = (-(10/14) x log2 (10/14) + (-(4/10) x log2 (4/10)) = 0.863120569
|
Sum(Yes) |
Sum(No) |
Entropi Total |
||||
|
4 |
10 |
0.863120569 |
Jumat, 08 April 2022
Jaccard
1. Jika diketahui A={1,2,3,4, B ={1,2,4} dan C = {1,2,4,5}, berapakah Jaccard (A,B), Jaccard (B,C) dan Jaccard (A,C)?
Jawab :
Berikut adalah langkah - langkah dari menghitung Jaccard diatas!
Jaccard(A,B)
|
A | = 4
|
B | = 3
|
A ∩ B | = 3
|
A U B | = (|A| + |B| - | A ∩ B |) = 4 + 3 – 3 = 4
Jadi Jaccard(A,B)
= | A ∩ B | / | A U B | = 3/4 = 0.75
Jaccard(B,C)
|
B | = 3
|
C | = 4
|
B ∩ C | = 3
|
B U C | = (|B| + |C| - | B ∩ C |) = 3 + 4 – 3 = 4
Jadi Jaccard(B,C)
= | B ∩ C | / | B U C | = 3/4 = 0.75
Jaccard(A,C)
|
A | = 4
|
C | = 4
|
A ∩ C | = 3
|
A U C | = (|A| + |C| - | A ∩ C |) = 4 + 4 – 3 = 5
Jadi Jaccard(A,C)
= | A ∩ C| / | A U C | = 3/5 = 0.6
2.
Berikutnya untuk kasus query dan document. Misalnya kita punya :
query
: ideas of march
doc
1 : caesar died in march
doc
2 : the long march
Cari Koefisien Jaccard antara query dengan doc1 dan doc2.
Jawab
Jaccard(Q, doc1)
Q
= 3
DOC1
= 4
|
Q ∩ doc1 | = 1
|
Q U doc1 | = 6
|Q
∩ doc1| / | Q U doc1| = 1/6 = 0.17
Jaccard(Q, doc2)
Q
= 3
doc2
= 3
|
Q ∩ doc2 | = 1
|
Q U doc2 | = 5
|
Q ∩ doc2 | / |Q U doc2| = 1/5 = 0.2
3.
Diketahui 3 dokumen :
d1
: "Jack London traveled to Oakland"
d2
: "Jack London traveled to the city of Oakland"
d3
: "Jack traveled from Oakland to London"
Nilai dari Koefisien Jaccard J(d1,d2) dan J(d1,d3) jika dilakukan dengan n-gram analisis dengan n=2 (bigram) adalah :
Jawab
Jaccard(d1,d2)
d1
= 4 (Jack London, London traveled, traveled to, to Oakland)
d2
= 7 (Jack London, London traveled, traveled to, to the, the city, city of, of
Oakland)
| d1 ∩ d2 | = 3
| d1 U d2 | = 8
| d1 ∩ d2 | / | d1 U d2 | = 3/8 = 0.375
Jaccard(d1,d3)
d1
= 4(Jack London, London traveled, traveled to, to Oakland)
d2
= 5(Jack traveled, traveled from, from Oakland, Oakland to, to London
| d1 ∩ d3 | = 0
| d1 U d2 | = 9
| d1 ∩ d2 | / | d1 U d2 | = 0/9 = 0