Regresi Linier / Analisis Regresi


Dalam statistika, regresi linear adalah sebuah pendekatan untuk memodelkan hubungan antara variable terikat Y dan satu atau lebih variable bebas yang disebut X. Salah satu kegunaan dari regresi linear adalah untuk melakukan prediksi berdasarkan data-data yang telah dimiliki sebelumnya. Contoh yang dibahas kali ini adalah menentukan hasil jual tipe sepeda motor baru berdasarkan kelompok data yang sudah ada.
Analisis regresi adalah salah satu analisis yang paling populer dan luas pemakaiannya. Analisis regresi dipakai secara luas untuk melakukan prediksi dan ramalan, dengan penggunaan yang saling melengkapi pada teknik pembelajaran.



Diasumsikan ada 4 tipe motor yang sudah diketahui datanya, yaitu Motor A,B,C,D
Masing-masing tipe motor memiliki kriteria, yaitu harga, jarak tempuh per liter, cc, dan memiliki hasil jual dalam unit
Diasumsikan data dari 4 tipe motor tersebut adalah sebagai berikut:

Motor Harga Jarak tempuh per liter cc unit terjual
Motor A 10.000.000 35 110 20
Motor B 12.000.000 45 125 9
Motor C 11.000.000 40 150 17
Motor D 14.000.000 37.5 125 12

Contoh data awal adalah sebagai berikut:



Selanjutnya ada 4 buah motor lagi, yaitu E,F,G,H, yang baru akan diluncurkan, sehingga tidak diketahui hasil jualnya
Maka tentukan data-data ini nantinya diperkirakan memiliki hasil jual berapa unit
Diasumsikan data awalnya adalah sebagai berikut:

Motor Harga Jarak tempuh per liter cc
Motor E 13.000.000 45 125
Motor G 12.000.000 47 110
Motor F 10.500.000 43 110
Motor H 13.500.000 35 125

Contoh data baru yang akan dihitung adalah sebagai berikut:
Untuk kriteria Nilai Hasil:
Karena belum diketahui nilai hasilnya, maka semua inputan data adalah -1


Langkah-langkah penggunaan algoritma ini adalah

1. Tentukan matriks desain
Matriks desain adalah matriks data dengan penambahan kolom pertama yang bernilai 1 pada setiap barisnya
Penambahan kolom ini disebut kolom dummy, digunakan untuk menghitung koefisien beta 0 / intercept

2. Hitung koefisien Beta untuk masing-masing kolom kriteria
koefisien beta yang dihitung adalah sejumlah kriteria + 1
koefisien beta pada indeks ke 0 adalah konstanta atau disebut juga intercept, sedangkan pada indeks sisanya merupakan koefisien beta untuk untuk masing-masing kolom
Penjelasan tentang fungsi tersebut akan dibahas pada perhitungan dibawah (poin 2a dan 2b)

2a. Tentukan matriks X dan matriks Y untuk digunakan dalam perhitungan koefisien Beta
Matriks X adalah semua data pada semua kolom kriteria selain kriteria hasil
Matriks Y adalah semua data pada kolom kriteria hasil saja
Langkah ini tidak wajib, hanya untuk memepermudah penjelasan rumus pada poin 2b.

2b. Hitung Koefisien Beta dengan rumus
B = inv(Xt * X) * Xt * y
B adalah nilai koefisien beta yang akan dicari
X adalah semua data pada semua kolom kriteria selain kriteria hasil
Y adalah semua data pada kolom kriteria hasil saja
Xt adalah transpos matriks dari matriks X
inv adalah invers matriks dari matriks input

2b1. Gunakan fungsi ini untuk menghitung transpos matriks

2b2. Gunakan fungsi ini untuk menghitung perkalian matriks

2b3. Gunakan fungsi ini untuk menghitung invers matriks

* Gunakan fungsi ini untuk menghitung dekomposisi matriks
Metode yang digunakan untuk mendekomposisi matriks adalah metode Dolittle

3. Hitung nilai R-squared atau disebut juga koefisien determinasi
Koefisien ini tidak berhubungan dengan perhitungan data secara langsung, hanya untuk membuktikan seberapa cocok nilai koefisien beta terhadap data awal
Semakin mendekati angka 1.00, berarti prediksi yang dilakukan akan semakin baik
Penjelasan tentang fungsi tersebut akan dibahas pada perhitungan dibawah (poin 3a sampai dengan 3c)

3a. Hitung rata-rata dari kriteria hasil, dalam kasus ini adalah unit terjual

3b. Lakukan perulangan pada masing-masing data
Hitung sigma1, yaitu sigma kuadrat selisih hasil data dan hasil perhitungan
Kemudian hitung sigma2, yaitu sigma kuadrat selisih hasil data dengan rata-rata dari kriteria hasil

3c. Hitung nilai R-squared dengan rumus 1 – (sigma1 / sigma2)

4. Lakukan perhitungan dari masing-masing data awal menggunakan matriks koefisien beta yang sudah ditemukan
Kemudian catat tingkat kecocokan perhitungan data dengan hasil awal pada data, untuk membandingkan apakah nilai R-squared sudah cocok pada contoh data

5. Untuk masing-masing data baru, hitung perkiraan hasil unit terjual menggunakan koefisien beta yang sudah ditentukan


Hasil akhir adalah: (klik untuk perbesar gambar)

cmd46


Contoh modul / source code dalam bahasa VB (Visual Basic) dapat didownload disini:



Jika membutuhkan jasa kami dalam pembuatan program, keterangan selanjutnya dapat dilihat di Fasilitas dan Harga
Jika ada yang kurang paham dengan langkah-langkah algoritma diatas, silahkan berikan komentar Anda.
Selamat mencoba.

Tinggalkan sebuah komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *