Monday, February 20, 2017

Tugas Cluster Analysis Menggunakan SPSS


1. Pendahuluan
Data yang diambil ini adalah data harga bahan bakar gas per kWH (Rp/kWh) untuk PLTGU pada Bulan Agustus 2016 yang meliputi 6 buah Gas Turbine (GT) yaitu GT 1.1; GT 1.2; GT 1.3; GT 2.1; GT 2.2; GT 2.3. Data dibawah ini tersaji dari hari ke - 1 sampai hari ke – 30 dan akan dikelompokkan pada hari ke berapa yang memiliki rata – rata kedekatan konsumsi bahan bakar dalam Rp/kWh sehingga bisa digunakan untuk memberi kesimpulan rata – rata hari dimana ke – 6 Gas Turbine memiliki biaya yang hampir sama dan terendah untuk menentukan pola operasi yang tepat agar target penghematan bisa tercapai. Dengan kata lain analisa ini digunakan untuk mennetukan pola operasi yang menghasilkan revenue paling optimal ditinjau dari biaya Rp/kWh - nya.

2. Deskripsi Data
- Tampilan di Data View menggunakan SPSS

                                        
               
-  Tampilan di Variable View

Data diatas adalah harga bahan bakar per kWh (Rp/KwH) dari PLTGU Bulan Agustus 2016 dari hari ke – 1 sampai hari ke – 30 dalam rata – rata yang didapatkan dari tim bahan bakar unit pembangkitan. Sebagai contoh pembacaan pada hari ke – 1 yaitu GT 1.1 sebesar 254.78 yang berarti Gas Turbine Unit 1.1 menghabiskan bahan bakar sebesar Rp 254.78 / kWh untuk menghasilkan daya per jam sebesar 1 kW.
3. Analisis Data
Hasil Output SPSS :
- Descriptive Statistic
 
 
Analisa diatas adalah untuk menstandarisasi data meskipun satuan antar variabel sudah sama namun untuk pembelajaran kami tampilkan. Data yang digunakan terdiri dari 30 observasi yang kemudian dilakukan analisis secara statistika deskriptif. Nilai minimum, maksimum, mean, standar deviation dan variance ditampilkan per variabel data.
Case Processing Summarya
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
30
100,0%
0
0,0%
30
100,0%
a.  Euclidean Distance used
Analisa dari tabel adalah jumlah data sebanyak 30 buah telah diproses tanpa ada data yang hilang. Karena tidak diketahui adanya pembagian kelompok yang khusus (unsupervised) maka digunakan hierarchial clustering.

Berdasarkan nilai yang dihasilkan dari tabel descriptive statistics didapatkan beberapa informasi yang dapat diketahui. Nilai rata-rata harga bahan bakar gas dari ke enam turbin. Nilai rata-rata yang dihasilkan dari keenam turbin memiliki nilai dalam selang 248 hingga 262 dengan nilai yang cukup bervariasi untuk tiap turbinnya. Berdasarkan nilai rata-rata harga bahan bakar dari tiap turbin diketahui nilai rata-ratanya memiliki perbedaan satu sama lain. Nilai rata-rata harga pada Turbin GT_1.2 memiliki nilai paling kecil sehingga dapat dikatakan bahwa Turbin tersebut merupakan turbin yang lebih baik dari yana glain karena membutuhkan biaya untuk bahan bakar yang lebih murah. Sedangkan rata-rata haraga bahan bakar paling mahal terdapat pada turbin GT_2.2 yang mencapai Rp 262/kWh. Harga bahan bakar terendah selama 30 hari berada pada turbin GT_2.1 yang membutuhkan Rp 216.60/kWh.
Untuk mengetahui apakah biaya tiap turbin berbeda dapat menggunakan ANOVA. Berikut merupakan hasil yang didapatkan.

Source         DF     SS   MS     F      P
Jenis_Turbin    5   3942  788  2.51  0.032
Error         174  54580  314
Total         179  58522


Dari hasil diatas dapat diketahui bahwa minimal satu turbin yang memiliki biaya yang berbeda dengan turbin lain. Hal itu dapat diliaht dari nilai p-value yang dihasilkan kurang dari alfa (0,05). Untuk melihat turbin yang berbeda dapat dilihat dalam tabel berikut.

Jenis_Turbin   N    Mean  Grouping
5             30  262.11  A
6             30  257.90  A B
4             30  252.48  A B
1             30  252.46  A B
3             30  250.28  A B
2             30  248.36    B


Dari Tabel diatas dapat dilihat bahwa kelompok yang terbentuk sebanyak dua dimana nilai dari turbin ke 5 (GT_2.2) berbeda dengan turbin ke 2 (GT_1.2). hal tersebut diketahui karena turbin 2 dan 5 masuk kedalam kelompok yang berbeda sehingga dapat dikatakan bahwa nilai rata-rata dari biaya bahan bakar yang mereka butuhkan berbeda satu sama lain.

Dalam kasus ini ingin dilakukan pengelompokkan hari yang memiliki tingkat kemiripan yang sama. Hal tersebut dilihat berdasarkan jarak Euclidian menggunakan metode hierarcial clustering. Clustering digunakan untuk mengelompokkan hari yang memiliki harga bahan bakar dari keenam turbin yang mirip. Jumlah cluster yang digunakan adalah 2,3,4 dimana dibagi dalam kelompok (Tinggi, Rendah), (Tinggi, Sedang, Rendah) dan (Tinggi, Cukup Tinggi, Sedang, Rendah).
Cluster Membership


Case
4 Clusters
3 Clusters
2 Clusters
1:Case 1
1
1
1
2:Case 2
1
1
1
3:Case 3
1
1
1
4:Case 4
1
1
1
5:Case 5
2
2
1
6:Case 6
2
2
1
7:Case 7
2
2
1
8:Case 8
1
1
1
9:Case 9
1
1
1
10:Case 10
1
1
1
11:Case 11
3
3
2
12:Case 12
3
3
2
13:Case 13
3
3
2
14:Case 14
3
3
2
15:Case 15
3
3
2
Case
4 Clusters
3 Clusters
2 Clusters
16:Case 16
4
3
2
17:Case 17
3
3
2
18:Case 18
3
3
2
19:Case 19
3
3
2
20:Case 20
2
2
1
21:Case 21
2
2
1
22:Case 22
1
1
1
23:Case 23
2
2
1
24:Case 24
1
1
1
25:Case 25
1
1
1
26:Case 26
1
1
1
27:Case 27
1
1
1
28:Case 28
2
2
1
29:Case 29
2
2
1
30:Case 30
1
1
1


Tabel diatas merupakan Cluster Membership yang menyatakan hasil pengelompokkannya berdasarkan jarak Euclidian-nya. Nilai yang terdapat dalam kolom merupakan hasil observasi atau hari ke-i tergolong dalam cluster berapa. Contohnya, pada case 1 (hari 1) tergolongkan dalam cluster 1, sedangkan case 5 (hari ke 5) tergolong dalam cluster dua dan seterusnya untuk semua cluster. Agar lebih mudah dalam visualisasi maka dapat dilihat dalam gambar berikut.




Gambar  diatas merupakan dendogram yang menyatakan observasi dalam kelompok-kelompok. Dendogram juga bisa dikatakan bentuk visual dari tabel cluster membership. Untuk mengetahui seberapa besar pengaruh cluster yang terbentuk dapat melihat dari dendogram diatas. Seberapa besar pengaruh cluster dapat digunakan untuk memilih berapa jumlah pembagian cluster yang lebih cocok digunkan. Jadi dari ketiga pilihan jumlah cluster yang digunakan (2 cluster, 3 cluster dan 4 cluster) sebaiknya dipilih cluster yang memiliki jarak ketinggian paling jauh dari cluster tersebut ke cluster sebelumnya. Hal tersebut dapat digunakan garis bantu, garis merah menandakan jarak dari cluster 2 ke cluster 1, garis biru dari cluster 2 ke 3 dan oranye dari cluster 4 ke 3. Dapat dilihat bawha garis merah merupakan garis paling panjang diantara ketiga garis sehingga dapat dikatakan bahwa pembagian cluster 2 adalah yang paling signifikan. Sedangkan setelah pembagian dalam 4 cluster (5 cluster dst) tidak memberikan hasil yang cukup baik dikarenakan ketinggian dari jumlah cluster satu ke jumlah cluster sebelumnya, memiliki jarak yang pendek.


4. Kesimpulan dan Implikasi Kebijakan
Berdasarkan analisa statistik di atas, dapat ditarik kesimpulan bahwa :
  • 30 hari kerja yang telah dianalisa bisa disimpulkan bahwa rata – rata biaya pemakaian sama per kWh dengan asumsi penggolongan beberapa cluster yaitu :
            4 Cluster
  Cluster 1 ada di Hari Ke – 1,2,3,4,8,9,10,22,24,25,26,27,30

  Cluster 2 ada di Hari Ke – 5,6,7,20,21,28,29

  Cluster 3 ada di Hari Ke – 11,12,13,14,15,17,18,19

  Cluster 4 ada di Hari Ke - 16

             3 Cluster
               Cluster 1 ada di Hari Ke – 1,2,3,4,8,9,10,22,24,25,26,27,30
               Cluster 2 ada di Hari Ke – 5,6,7,20,21,23,28,29
               Cluster 3 ada di Hari Ke – 11,12,13,14,15,16,17,18,19

             2 Cluster
               Cluster 1 ada di Hari Ke – 1,2,3,4,5,6,7,8,9,10,20,21,22,23,24,25,26,27,28,29,30

               Cluster 2 ada di Hari Ke – 11,12,13,14,15,16,17,18,19
  • Berdasarkan analisa cluster yang telah dilakukan, didapatkan cluster yang memiliki banyak anggota untuk ketiga penggolongan cluster yaitu Cluster 1 dengan persamaan antara ketiganya di Hari Ke - 1,2,3,4,8,9,10,22,24,25,26,27,30. Dari kelompok tersebut bisa untuk diterapkan di 6 buah Gas Turbine sesuai pola – pola standar operasi yang tepat pada hari – hari tersebut sehingga didapatkan konsumsi bahan bakar yang tepat dan hemat. 
  • Berdasarkan dendogram diketahui bahwa pembagian kluster terbaik hanya sampai 4 kluster. Hal tersebut disebabkan karena jarak antara jumlah kluster 5 ke jumlah kluster 4 dan seterusnya tidak memiliki jarak yang signifikan (jarak yang cukup panjang).

1 comment:

  1. Ingin data artikel pdf,kirim email admin : ye_feriyanto@yahoo.com

    ReplyDelete