Skip to content Skip to sidebar Skip to footer

Pengertian Model Regresi dan Korelasi

Situs Ekonomi - Persamaan garis regresi merupakan suatu model yang menghubungkan antara dua variabel atau lebih, yaitu variabel tak bebas (dependent variable) dengan variabel bebas (independent variable). Sedangkan yang dimaksud dengan garis regresi (regression line) adalah suatu garis yang ditarik di antara titik-titik (scatter diagram) dengan sedemikian rupa, sehingga dapat digunakan untuk menaksir besarnya variabel yang satu berdasarkan besar variabel yang lain (Supangat, 2007: 325).

Lain daripada itu, garis regresi juga dapat digunakan untuk mengetahui macam-macam korelasinya (positif atau negatif). Apabila dua variabel x dan y mempunyai hubungan atau korelasi, maka perubahan nilai variabel diartikan sebagai variabel yang satu mempengaruhi variabel lainnya.

Hubungan antarvariabel tersebut biasanya dinyatakan dalam suatu model matematis (fungsi), misal: y = f(x), di mana y adalah variabel tak bebas atau juga bisa dikatakan sebagai variabel yang dipengaruhi (indikator) dan x merupakan variabel bebas atau variabel yang mempengaruhi. Sebagai ilustrasi, misalkan y = 12 + 0,2x, model tersebut dapat diartikan bahwa nilai y akan bertambah sebesar 0,2 unit satuan untuk setiap x berubah sebesar 1 unit satuan, misal untuk x = 0, maka nilai y = 12 dan jika x = 5 berarti nilai y berubah menjadi: y = 12 + 0,2 (5) = 14,5 dan seterusnya.

Analisis regresi dan korelasi digunakan untuk mempelajari hubungan antara dua variabel atau lebih, dengan maksud bahwa dari hubungan tersebut dapat memperkirakan besarnya dampak kuantitatif yang terjadi dari perubahan suatu kejadian terhadap kejadian lainnya. Untuk menetapkan nilai-nilai intercept dan koefisien regresi, kita dapat menggunakan metode OLS (ordinary least square).

Metode OLS atau sering juga dikatakan sebagai metode kuadrat terkecil (least square) pada dasarnya merupakan anggapan-anggapan tertentu. Anggapan-anggpaan yang disematkan pada metode kuadrat terkecil dimaksudkan sebagai pembentukan model normal hesse, yang digunakan untuk menentukan perhitungan besaran intercept dan koefisiensi regresi sampel atau besaran a dan b pada model regresi linier y = a + bx. Begitu pun tentunya pada model-model regresi lainnya, seperti pada model linier multiple, model kuadratis, model semi, model eksponensial dan lainnya (Supangat, 2007: 326).

Metode least square selain untuk menentukan nilai-nilai intercept dan koefisien regresi, juga berguna untuk membuat pendugaan interval serta menguji hipotesis regresi populasi. Berikut ini akan diutarakan beberapa anggapan penting mengenai metode kuadrat terkecil, di antaranya:

Nilai rata-rata dari tingkat kesalahan (error) atau nilai ekspektasi (expected value) dari setiap nilai x sama dengan nol. Anggapan tersebut dinyatakan seperti pada gambar di bawah ini yang mana untuk setiap x, misalkan x1, x2 dan x3 terdapat beberapa nilai y.


Nilai y yang dimaksud dapat kita amati pada bagian bawah dan atas dari garis regresi, akan tetapi nilai rata-rata dari y berada di titik tengah, yaitu tepat pada garis regresi tersebut. Karena kurva bersifat simetris, maka nilai di bawah garis regresi sama dengan nilai di atas regresi, sehingga nilai harapan dari Ei untuk setiap x dari x1 sampai xi sama dengan nol.

Nilai error dari Ei dan Ej dikatakan sebagai covarian yang saling independent (tidak berhubungan), dan oleh karena itu antara Ei dan Ej tidak ada hubungan, maka dapat diartikan bahwa nilai cov (Ei,Ej) = 0, di mana i ≠ j. Berdasarkan uraian di atas, dalam setiap nilai xi akan didapati tingkat kesalahan sebesar Ei demikian pun halnya dengan nilai xj akan didapati tingkat kesalahan sebesar Ej.

Varians (σ2) dari error bernilai: Var (Ei/Ej) = E (ei – ej)= σ2. Coba perhatikan kembali pada gambar di atas, di sana kita dapat melihat bahwa nilai ei (yang dilambungkan dengan tanda titik) untuk setiap x yaitu x1, x2 dan x3 tersebar secara tetap sebesar nilai variansnya. Sementara itu, nilai E tersebar di bawah kurva normal sejauh 1 standar deviasi di bawah garis regresi dan 1 standar deviasi di atas garis regresinya.

Variabel bebas x tidak berhubungan dengan besarnya nilai E (error), untuk kenyataan ini dituliskan sebagai covarians atau Cov (Ei,xi) = 0. Dengan demikian, model regresinya ditulis: ŷ = a + bxi + ei, terlihat dari model tersebut bahwa nilai xi dan Ei secara nyata tidak saling mempengaruhi, namun demikian kedua variabel tersebut mempengaruhi variabel y.

Seandainya antara variabel xi dan variabel Ei saling mempengaruhi, maka pengaruh masing-masing variabel tersebut tidak akan dapat dipisahkan. Secara luas, model regresi di atas dapat kita artikan  bahwa faktor yang mempengaruhi y selain x adalah faktor e, maka dari itu variansi dari Ei dan xi saling terpisah atau tidak berhubungan (tidak berkorelasi).

Anggapan-anggapan di atas sangat penting artinya dalam melakukan analisis regresi. Kita dapat mengatakannya demikian karena apabila anggapan-anggapan tersebut dapat dipenuhi, maka nilai-nilai penduga yaitu a dan b (untuk model regresi linier sederhana), nilai-nilai a0, a1, a2 (untuk model regresi linier multiple ŷ = a0 + a1x2 + a2x+ ε) ataupun nilai-nilai intercept dan koefisien regresi pada model lainnya akan mempunyai sifat-sifat seperti berikut: Tidak bias, memiliki variansi yang minimum, hasil perhitungan (pendugaan) dapat representatif terhadap parameter populasinya walaupun jumlah sampelnya diperbesar, memiliki nilai intercept dan koefisien regresi yang berdistribusi normal dengan nilai rata-rata harapan dari pendugaan sampel E(a) = A dan variansi (a) = σ_a^2. Dan nilai rata-rata harapan dari pendugaan sampel E(b) = B dan variansi (b) = σ_b^2.

Secara umum, metode least square (kuadrat terkecil) ditulis dalam bentuk persamaan normal hesse, yaitu:
Untuk model regresi linier sederhana ŷ = a +bx + e
Persamaan normal hesse-nya:

Persamaan Normal Hesse
Rizki Gusnandar
Rizki Gusnandar Kelemahan terbesar kita adalah bersandar pada kepasrahan. Jalan yang paling jelas menuju kesuksesan adalah selalu mencoba, setidaknya satu kali lagi - Thomas A. Edison.