Pengambilan Keputusan dengan Metode CHAID (Chi-squared Automatic Interaction Detection)

Share

CHAID (Chi-squared Automatic Interaction Detection)? Apa sih CHAID itu? Bagaimana cara melakukan analisis CHAID? Pembaca budiman, dalam artikel ini akan dibahas tentang CHAID (Chi-squared Automatic Interaction Detection) sebagai salah satu tools yang membantu dalam pengambilan keputusan yang tepat. Juga akan dibahas seputar decision tree, AID (Automatic Interaction Detection), sejarah CHAID (Chi-squared Automatic Interaction Detection), kegunaan CHAID (Chi-squared Automatic Interaction Detection), serta algoritma CHAID (Chi-squared Automatic Interaction Detection).

Dear pembaca, setiap orang tentu menginginkan sebuah pengambilan keputusan yang tepat dan efisien, tak terkecuali sebuah perusahaan. Untuk itu banyak sekali perusahaan yang membutuhkan suatu media seperti Business Intellegence guna membantu dalam pengambilan keputusan yang tepat. Namun, hal tersebut tidak akan berarti tanpa adanya konsep decision tree (pohon keputusan). Decision tree adalah salah satu metode klasifikasi yang paling populer, karena mudah untuk diinterpretasi oleh manusia. Decision tree adalah model prediksi menggunakan struktur pohon atau struktur berhirarki

Anda sedang mencari konsultan jasa olah data SPSS Eviews Lisrel AMOS Stata Murah / analisis data statistik MURAH di jakarta bogor tangerang bekasi (jabodetabek) untuk skripri tesis disertasi ?

Kami merupakan konsultan jasa olah data / pengolahan data statistik dengan software SPSS Eviews pls arcview mapinfo expertchoice Lisrel AMOS Stata statistica Murah / analisis data statistik MURAH di jakarta bogor tangerang bekasi (jabodetabek) untuk skripri tesis disertasi ?

Hubungi Kami :

WA : 08571 5200 869

Konsep dari pohon keputusan adalah mengubah data menjadi decision tree dan aturan-aturan keputusan. Manfaat utama dari penggunaan decision tree adalah kemampuannya untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih simple, sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari permasalahan. (IYKARA, 2018).

Pohon klasifikasi (classification trees) adalah metode yang digunakan untuk membagi data ke dalam kelompok yang homogen dan meneliti struktur lokal pada data yang berukuran kecil maupun yang berukuran besar, bertujuan untuk memperoleh faktor penduga yang paling signifikan. Metode pengklasifikasian ini merupakan metode pengklasifikasian yang serupa dengan analisis diskriminan.

Metode pohon klasifikasi pertama sekali diperkenalkan oleh Kass (1980) adalah metode CHAID. Metode CHAID merupakan bagian dari metode AID. Metode AID digunakan pada peubah respon yang berskala interval dengan memaksimumkan Jumlah Kuadrat Antar Grup (JKAG) pada masing-masing pembelahan data dengan menggunakan statistik-F. Pada AID data secara berturut-turut dibelah dua berdasarkan penduga yang memiliki JKAG terbesar (lihat [6]).

Metode CHAID (Chi-squared Automatic Interaction Detection) pertama kali diperkenalkan pada sebuah artikel yang berjudul“An Exploratory Techniquefor investigating Large Quantities of Categorical Data” oleh Dr. G. V. Kasstahun 1980 pada buku Applied Statistics. Teknik tersebut merupakan teknik yang lebih awal dikenal sebagai Automatic Interaction Detection (AID) (Permana, 2011:24). Metode CHAID secara umum bekerja dengan mempelajari hubungan antara variable dependen dengan beberapa variable independen kemudian mengklasifikasisampel berdasarkan hubungan tersebut. Menurut Gallagher (2000), CHAID merupakan suatu teknik iteratif yang menguji satu persatu variable independen yang digunakan dalam klasifikasi, dan menyusunnya berdasarkan pada tingkat signifikansi statistik chi-square terhadap variable dependennya.

CHAID digunakan untuk membentuk segmentasi yang membagi sebuah sampel menjadi dua atau lebih kelompok yang berbeda berdasarkan sebuah criteria tertentu. Hal ini kemudian diteruskan dengan membagi kelompok-kelompok tersebut menjadi kelompok yang lebih kecil berdasarkan variabel-variabel independen yang lain. Proses tersebut terus berlanjut sampai tidak ditemukan lagi variabel-variabel independen yang signifikan secara statistic (Kunto dan Hasana, 2006). CHAID adalah sebuah metode untuk mengklasifikasikan data kategori di mana tujuan dari prosedurnya adalah untuk membagi rangkaian data menjadi subgrup-subgrup berdasarkan pada variable dependennya (Lehmann dan Eherler, 2001). Hasil dari pengklasifikasian dalam CHAID akan ditampilkan dalam sebuah diagram pohon.

Metode CHAID membagi data menjadi beberapa segmen berdasarkan hubungan variabel dependen dan variabel independennya. Variabel independen dalam metode CHAID akan dibedakan menjadi 3 bentuk yang berbeda yaitu monotonic, bebas dan mengambang (float). Algoritma CHAID digunakan untuk melakukan pemisahan dan penggabungan kategori-kategori dalam variabel yang dipakai dalam analisisnya. Secara garis besar algoritma ini dapat dibagi menjadi tiga tahap, yaitu Penggabungan (merging), Pemisahan (Splitting) dan Penghentian (Stopping). Diagram pohon dimulai dari root node (node akar) melalui tiga tahap tersebut pada setiap node yang terbentuk dan secara berulang (Kunto dan Hasana, 2006).

Metode CHAID digunakan pada peubah respon berskala nominal atau ordinal dengan menggunakan statistik chi-square untuk memaksimumkan signifikasi pada tiap pembagian data. Statistik chi-square adalah aplikasi dari metode nonparametrik yaitu suatu uji hipotesis yang membahas masalah ukuran skala ordinal dan nominal yang tidak berdasarkan pada asumsi-asumsi apapun, sebagaimana dengan metode biasa yang penggunaannya lebih fleksibel. CHAID menggunakan pohon non-biner (non-binary trees) dalam masalah pengklasifikasian sehingga pembelahannya tidak harus pembelahan dua tetapi dapat saja lebih, sampai menghasilkan faktor penduga yang paling signifikan.

Anda sedang mencari konsultan jasa olah data SPSS Eviews Lisrel AMOS Stata Murah / analisis data statistik MURAH di jakarta bogor tangerang bekasi (jabodetabek) untuk skripri tesis disertasi ?

Kami merupakan konsultan jasa olah data / pengolahan data statistik dengan software SPSS Eviews pls arcview mapinfo expertchoice Lisrel AMOS Stata statistica Murah / analisis data statistik MURAH di jakarta bogor tangerang bekasi (jabodetabek) untuk skripri tesis disertasi ?

Hubungi Kami :

WA : 08571 5200 869

Metode CHAID memiliki keunggulan dalam mengeksplorasi data berjumlah besar, yang seluruh peubahnya bertipe kategori. Dengan menggunakan metode CHAID, hasil analisis akan lebih mudah diinterpretasikan dan peneliti akan mengetahui faktor penduga yang paling signifikan diantara faktor penduga lainnya. Metode CHAID merupakan salah satu metode untuk mengklasifikasi data secara jelas dan terstruktur.

Metode CHAID merupakanbagian dari AID yang dirancang untuk menyelidiki struktur keterkaitan antar peubah respon kategori dengan peubah penduga kategori. Metode CHAID digunakan pada peubah respon berskala nominal atau ordinal dengan menggunakan statistik chi- square untuk memaksimumkan signifikansi pada tiap pembagian. Dalam CHAID pembelahan pada diagram pohon tidak harus pembelahan dua. Beberapa modifikasi penting yang relevan dengan metode AID (lihat [6]) yaitu:

(1) Uji signifikasi yang sudah baku;

(2) Pembagiannya tidak harus biner;

(3) Menggunakan penduga tipe baru (peubah float) yang berguna dalam penanganan informasi

yang hilang.

Metode yang dilakukan dalam penelitian ini adalah metode CHAID (Chi-squared Automatic Interaction Detection). Metode CHAID secara umum bekerja dengan mempelajari hubungan antara variable dependen dengan beberapa variable independen kemudian mengklasifikasi sampel berdasarkan hubungan tersebut. Menurut Gallagher (2000) CHAID merupakan suatu teknik iteratif yang menguji satu-persatu variable independen yang digunakan dalam klasifikasi, dan menyusunnya berdasarkan pada tingkat signifikansi statistik chi-square terhadap variable dependennya. Hasil dari pengklasifikasian dalam CHAID akan ditampilkan dalam sebuah diagram pohon. Langkah pada algoritma  CHAID dapat digambarkan sebagai berikut:

  1. Data
  2. Penentuan Variabel Dependen dan variable Independen
  3. Uji signifikansi
  4. Penggabungan variable yang tidak signifikan
  5. Kategori variable yang signifikan, jika hasilnya TIDAK, akan kembali ke langkah ke-3
  6. Koreksi Bonferonni
  7. Ambil variabel yang paling signifikan
  8. Uji signifikansi
  9. Variabel signifikan, jika jawabannya TIDAK, akan kembali ke langkah ke-3
  10. Jika hasilnya YA, maka Stopping
  11. Pengambilan kesimpulan dan selesai.

Langkah pada algoritma CHAID di atas dapat juga digambarkan pada diagram alir berikut ini:

 
Share

Leave a Reply

Your email address will not be published. Required fields are marked *