Regresi Linear Dua Variabel Vs. Banyak Variabel
Situs Ekonomi - Biasanya yang sering kita temui dalam beberapa penjelasan, baik dari buku atau yang lainnya, adalah model regresi sederhana, atau model regresi dua variabel, di mana variabel tak bebas merupakan fungsi dari hanya satu variabel penjelas (variabel bebas). Ini dilakukan sekedar untuk memperkenalkan gagasan pokok tentang analisis regresi.
Tetapi, konsep regresi dapat dengan mudah diperluas menjadi kasus di mana variabel tak bebas merupakan fungsi dari beberapa variabel penjelas. Sebagai contoh, jika pengeluaran untuk membeli kendaraan elektrik merupakan fungsi dari tingkat pendapatan (X2), biaya tahunan kendaraan saat ini (X3), tingkat pendidikan (X4), maka kita dapat menuliskan fungsi yang diperluas tersebut ke dalam persamaan (1.1), di mana:
E (Y) = B1 + B2X2i + B3X3i + B4 X4i (1.1)
[Catatan: E(Y) = E(Y|X2i, X3i, X4i).]
Persamaan (1.1) merupakan salah satu contoh dari regresi linear berganda, yakni regresi di mana lebih dari satu variabel penjelas, atau variabel bebas, digunakan untuk menjelaskan perilaku variabel tak bebas. Model tersebut menyatakan bahwa nilai rata-rata dari pengeluaran untuk membeli kendaraan elektrik merupakan fungsi linear dari tingkat pendapatan, biaya tahunan kendaraan saat ini, dan tingkat pendidikan.
Fungsi pengeluaran masyarakat (dalam hal ini, FRP stokhastiknya) dapat diekspresikan sebagai
Yi = B1 + B2X2i + B3X3i + B4X4i + ui = E (Y) + ui (1.2)
yang menunjukkan bahwa permintaan masyarakat atas kendaraan elektrik akan berbeda dari rata-rata kelompok sebesar faktor u, yang merupakan faktor kesalahan stokhastik. Sebagaimana yang telah ditegaskan oleh Gujarati (2006: 125), bahwasanya dalam suatu regresi berganda pun kita memasukkan faktor kesalahan karena kita tidak dapat mempertimbangkan semua faktor yang mungkin mempengaruhi variabel tak bebas.
Perhatikanlah bahwa baik persamaan (1.1) maupun (1.2) berbentuk linear dari sisi parameter dan karenanya disebut dengan model regresi linear. Variabel-variabel penjelas itu sendiri tidak perlu dimasukkan ke dalam model secara linear, meskipun dalam contoh ini memang demikian keadaannya.