BAB VI - BAB VI regresi

 0  0  30  2018-11-08 15:48:28 Report infringing document

BAB VI ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

6.0. Tujuan Pembelajaran: Mahasiswa Mampu:

  1. Menghitung dan menginterpretasikan korelasi sederhana antara dua variabel

  2. Mengetahui hubungan dua variabel yang tidak linier

  3. Menentukan korelasi dan mengujinya

  4. Menghitung dan menginterpretasikan persamaan regresi linier sederhana

  5. Mengetahui asumsi yang digunakan dalam analisa regresi

  6. Menentukan Model Regresi yang Layak

  7. Menghitung dan Menginterpretasikan Interval Keyakinan untuk Koefisien Regresi

  8. Mengetahui bahwa analisis regresi dapat digunakan sebagai alat prediksi

  9. Mengetahui bagaimana menerapkan kasus nyata yang berhubungan dengan analisis regresi secara benar

6.1. Scatter Plot

  Sebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel, harus dilihat apakah variabel-variabel tersebut mempunyai hubungan linier atau tidak dengan menggunakan scatter plot seperti yang dibawah ini:

  Grafik 1.Scatter Plot (Diagram Pencar)

  Scatter Plot Tidak Ada Hub.linier Hubungan Linier Positif Tidak ada Hubungan Hubungan Linier Negatif

  © 2010 Hermita Dyah Puspita BAB11-

  Dalam scatter plot diatas ada empat kriteria,yaitu: Bila titik-titik menggerombol mengikuti sebuah garis lurus dengan kemiringan positif, maka kedua variabel dinyatakan memiliki hubungan linier positif Bila titik-titik menggerombol mengikuti sebuah garis lurus dengan kemiringan negatif, maka kedua variabel dinyatakan memiliki hubungan linier negatif

  Bila titik-titik menggerombol tidak mengikuti garis lurus, maka kedua variabel dinyatakan tidak memiliki hubungan yang linier Bila titik-titik memencar atau membentuk suatu garis lurus mengikuti sebuah pola yang acak atau tidak ada pola, maka kedua variabel dinyatakan tidak memilki hubungan.

6.2. Analisis Korelasi

  Analisis korelasi digunakan untuk mengukur kekuatan hubungan linier antara dua variabel. Koefisien korelasi populasi ρ (rho) adalah ukuran kekuatan hubungan linier antara dua variabel dalam populasi sedangkan koefisien korelasi sampel r adalah estimasi dari ρ dan digunakan untuk mengukur kekuatan hubungan linier dalam sampel observasi. Untuk selanjutnya r disebut Koefisien Korelasi Pearson Product Momernt.

6.2.1. Korelasi Pearson (Product Moment)

  Korelasi pearson sering juga disebut sebagai korelasi produk-momen atau korelasi saja. Korelasi pearson termasuk ke dalam statistika parametrik. Besarnya koefisien menggambarkan seberapa erat hubungan linear antara dua variabel, bukan hubungan sebab akibat. Variabel yang terlibat dua-duanya bertipe numerik (interval atau rasio), dan menyebar normal jika ingin pengujian terhadapnya sah. Berikut ini pedoman menentukan kuat tidaknya korelasi antara dua variabel menurut Walpole :

  Tabel 1.

  Interval Koefisien Tingkat Hubungan 0.00 – 0.199 Sangat rendah 0.20 – 0.399 Rendah 0.40 – 0.599 Cukup 0.60 – 0.799 Kuat

  0.80 – 1.000 Sangat Kuat Menurut Sarwono (2006) Batas-batas nilai koefisien korelasi diinterpretasikan sebagai berikut:

  Tabel 2.

  Interval Hubungan Tingkat Hubungan Tidak ada korelasi antara dua variabel

  >0 – 0,25 Korelasi sangat lemah >0,25 – 0,5 Korelasi cukup >0,5 – 0,75 Korelasi kuat >0,75 – 0,99 Korelasi sangat kuat

  1 Korelasi sempurna Hasil dari analisis korelasi menunjukkan kekuatan atau kelemahan dari suatu hubungan.Nilai koefisien korelasi ini akan berada pada kisaran -1 sampai dengan

  • 1. Koefisien korelasi minus menunjukkan hubungan yang terbalik, dimana pengaruh yang terjadi adalah pengaruh negatif. Dalam pengaruh yang negatif ini kenaikan suatu variabel akan menyebabkan penurunan suatu variabel yang lain, sedangkan penurunan suatu variabel akan menyebabkan kenaikan variabel yang lain. Koefisien korelasi positif menunjukkan hubungan yang searah dari dua variabel, dimana kenaikan suatu variabel akan menyebabkan kenaikan variabel yang lain dan sebaliknya penurunan suatu variabel akan menyebabkan penurunan variabel yang lain.

  Koefisien korelasi sebesar nol menunjukkan tidak adanya hubungan antara dua variabel, dengan kata lain kenaikan atau penurunan suatu variabel tidak mempengaruhi variabel yang lain, jadi berapapun perubahan harga pada suatu variabel tidak akan mempengaruhi variabel yang lain karena nilainya yang tetap. Terdapat bermacam-macam analisis korelasi yang dapat digunakan untuk mengukur hubungan asosiatif dari suatu variabel. Korelasi yang akan digunakan tergantung pada jenis data yang akan dianalisis. Korelasi berdasarkan tingkatan data dapat dilihat pada tabel berikut ini:

  Tabel.3 Korelasi Berdasarkan Tingkatan Data Teknik Korelasi yang

  Tipe / Tingkat Data Digunakan

  Nominal Koefisien Kontingensi Spearman Rank

  Ordinal Kendal Tau Pearson / Produk Momen

  Interval dan rasio Korelasi Ganda Korelasi Parsial.

  Koefisien korelasi pearson diformulasikan sebagai berikut:

  ( x−¯x)( y−¯y)

  ∑ r=

  2

  2 [ ( ][ ( ] x−¯x) y−¯y )

  ∑ ∑ √

  Atau:

  

n xyx y

∑ ∑ ∑

r=

  2

  

2

  2

  2 n( x x) n( y y)

  [ )−( ][ )−( ] √ ∑ ∑ ∑ ∑

  S S xx xy

  Atau: r =b =

  S S yyS xx yy

  √

  dimana: r = Koefisien Korelasi Sampel n = Ukuran Sampel x = Nilai dari Variabel Independen y = Nilai Variabel dependen

  Dari persaamaan korelasi yang terakhir tersebut dapat dilihat adanya hubungan antara b dan r. r digunakan untuk mengukur hubungan linier antara x dan y, sedangkan b mengukur perubahan dalam y akibat perubahan setiap unit x. Dalam kasus dimanai r = 0,3 dan r = 0,6 hanya berarti bahwa terdapat korelasi

  1

  

2

  positif dimana r

  2 lebih kuat daripada r 1 . Adalah salah jika menyimpulkan bahwa r

  2

  mengindikasikan hubungan linier dua kali lebih baik dibandingkan dengan r 1 .

  6.2.2.Koefisien Determinansi

  Koefisien determinansi adalah salah satu alat analisis yang dapat digunakan untuk mengetahui lebih jauh hubungan antar variabel. Koefisien determinansi

  2

  disimbolkan dalam R yang menyatakan proporsi variansi keseluruhan dalam nilai variabel dependen yang dapat diterangkan oleh hubungan linier dengan variabel independen atau menunjukkan proporsi total variasi dalam nilai variabel dependen yang dapat dijelaskan oleh hubungan linier dengan nilai variabel

  2

  independen. Nilai koefisien determinansi ini berkisar :0 ≤ R ≤ 1

  2

  2 R juga dapat digunakan untuk mempertimbangkan sebuah model regresi. Jika R

  suatu model besar belum tentu model tersebut adalah model yang baik, tetapi jika MSE model kecil maka model teresbut adalah model regresi yang terbaik. Koefisien determinasi biasanya dinyatakan dengan persen. Sedangkan

  2

  penafsirannya jika 0.994 sehingga R = 0.989 atau 98.9% adalah pengaruh variabel bebas terhadap perubahan variabel terikat adalah 98,9%, sedangkan sisanya sebesar 1,1% dipengaruhi oleh variabel lain selain variabel bebas X. Koefisien determinasi banyak digunakan dalam penjelasan tambahan untuk hasil perhitungan koefisien regresi.

  6.2.3. Korelasi Ganda

  Korelasi ganda adalah korelasi yang menunjukkan arah dan kuatnya hubungan antara dua atau lebih variabel terikat secara bersama-sama dengan variabel yang lain (variabel bebas). Contohnya: hubungan antara kesejahteraan pegawai, hubungan dengan pemimpin, dan pengawasan dengan efektivitas kerja. Korelasi berganda merupakan korelasi dari beberapa variabel bebas secara

  X X , ,...,

  X

  1 2 k

  serentak dengan variabel terikat. Misalkan ada k variabel bebas, dan satu variabel terikat Y dalam suatu persamaan regresi linear maka besarnya korelasi bergandanya adalah :

  a x y +a x y ++ a x y 1 ∑

  1 2 ∑ 2 kk r

  =

  y, x ,… , x 1 n

  2 y

  ∑

  dengan

  X Y

  1 ∑ ∑ x y=

  X Y

  1

  1 ∑ ∑ n

  X Ykx y=

  X Y k k

  ∑ ∑ n

2 Y

  ( )

  2 2 ∑ y = Y

  ∑ ∑ n

6.2.4. Korelasi Parsial

  Korelasi parsial adalah korelasi yang menunjukkan arah dan kuatnya hubungan atau pengaruh antara dua variabel atau lebih (variabel bebas dan terikat) setelah satu variabel yang diduga dapat mempengaruhi hubungan variabel tersebut dikendalikan untuk dibuat tetap keberadaannya. Persamaan korelasi antara x dengan y, bila variabel x dikendalikan atau korelasi

  1

  1

  antara x

  1 dengan y bila x 2 tetap yaitu :

  ( r y x ×r )

  2 x x ¿¿ 1 2 r = r − ¿ y, x , x y x 1 2 1

  2

  2

  1−r 1−r ( )

  ( x x ) y x 1 2 2

  Dimana :

  y, x , x

  r 1 2 = korelasi antara x

  1 dengan x 2 secara bersama-sama dengan variabel y y x

  r 1 = korelasi product moment antara x

  1 dengan y y x

  r 2 = korelasi product moment antara x dengan y

  

2

x x

  r 1 2 = korelasi product moment antara x dengan x

  1

  2

6.3. Uji Hipotesis Korelasi

  Pengujian hipotesis korelasi bertujuan untuk mengetahui apakah terdapat hubungan antara dua variabel tertentu.

   Perumusan hipotesis untuk korelasi adalah sebagai berikut: H : Tidak ada hubungan linier yang signifikan antara dua variabel H : Ada hubungan linier yang signifikan antara dua variabel

1 Atau H : ρ = 0

  H

  1 : ρ ≠ 0

   Statistik uji: Statistik uji menggunakan uji-T, yakni dengan menggunakan rumus sebagai berikut:

  b SSRrn−2 t = = hitung t =

  S S hitung atau

  2

  1−r

  √ S xx t dimana df =n−2

  = α

  tabel (

  t

  2 ;df )

   Kriteria uji Tolak H jika t > t atau t < -t

  hitung tabel hitung tabel

   Kesimpulan

  Sementara untuk menguji hipotesis koefisien korelasi dengan menggunakan

  ¿

  koefisien korelasi taksiran (ρ , dapat digunakan hipotesis sebagai berikut: : ρ=ρ ≠ 0 dimana ρ

   H : ρ≠ ρ

1 H

   Statistik uji: 1− ρ

  ( 1+r ) ( ) √ n−3 z = ln hitung

  2 ( 1−r ) 1+ρ

  ( ) [ ]

z

  = α

  tabel z

  =

  tabel α

  z (uji satu sisi) atau z (uji dua sisi)

  

2

   Kriteria uji: Tolak H jika z > z atau z < -z

  hitung tabel hitung tabel

   Kesimpulan

6.4.Analisis Regresi

  Dalam kehidupan sehari-hari, seringkali dijumpai kasus yang berhubungan dengan dua variabel atau lebih. Hubungan tersebut dapat berupa hubungan kausal atau hubungan fungsional. Hubungan kausal misalnya : hubungan antara panas dengan tingkat muai panjang, sedangkan hubungan fungsional contohnya: hubungan antara kepemimpinan dengan tingkat kepuasan kerja pegawai. Secara umum terdapat dua macam hubungan antara dua variabel atau lebih, yaitu : Keeratan hubungan dapat diketahui dengan analisis korelasi (bukan hubungan sebab- akibat) Bentuk hubungan dapat diketahui dengan analisis regresi

6.4.1. Sejarah Regresi

  Sejarah Regresi dimulai ketika Sir Francis Galton (1822-1911) yang membandingkan tinggi badan anak laki-laki dengan tinggi badan ayahnya. Galton menunjukkan bahwa tinggi anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur (regressed) mendekati nilai populasi. Dengan kata lain, anak laki- laki dari ayah yang badannya sangat tinggi, cenderung lebih pendek dari ayahnya. Sedangkan anak laki-laki dari ayah yang badannya sangat pendek cenderung lebih tinggi dari ayahnya. Sekarang istilah regresi diterapkan pada semua peramalan.

6.4.2. Definisi Regresi

  Regresi merupakan salah satu metoda dalam analisis statistika yang digunakan untuk menganalisis dan memodelkan secara matematis hubungan diantara dua variabel atau lebih. Pada analisis regresi ini dikenal adanya variabel dependen (variabel tak bebas/variabel tergantung/Unknown Variable/Response Variable) dan variabel independen (variabel bebas/ Explanatory Variable/Regressor Variable/Predictor Variabls/). Regresi dipakai untuk mengukur besarnya pengaruh perubahan pada variabel dependen yang diakibatkan perubahan pada variabel independen. Menurut Gujarati (2006) analisis regresi merupakan suatu kajian terhadap hubungan satu variabel yang disebut sebagai variabel yang diterangkan (the explained variabel) dengan satu atau dua variabel yang menerangkan (the explanatory). Variabel pertama disebut juga sebagai variabel tergantung dan variabel kedua disebut juga sebagai variabel bebas. Jika variabel bebas lebih dari satu, maka analisis regresi disebut regresi linear berganda. Disebut berganda karena pengaruh beberapa variabel bebas akan dikenakan kepada variabel tergantung. Saat ini, analisis regresi banyak digunakan untuk menelaah hubungan dua variabel atau lebih dan menentukan pola hubungan yang modelnya belum diketahui, sehingga regresi secara aplikatif lebih bersifat eksploratif.

6.4.3. Asumsi

  Penggunaan regresi linear sederhana didasarkan pada asumsi diantaranya sbb:  Error (ε) independen secara statistik  Distribusi probabilitas dari Error berdistribusi Normal

   Distribusi probabilitas dari Error(*) mempunyai variansi yang konstan  Ada hubungan linier antara kedua variabel Catatan (*):

   Residual adalah selisih antara nilai duga (predicted value) dengan nilai pengamatan sebenarnya apabila data yang digunakan adalah data sampel.  Error adalah selisih antara nilai duga (predicted value) dengan nilai pengamatan yang sebenarnya apabila data yang digunakan adalah data populasi.  Persamaan keduanya : merupakan selisih antara nilai duga (predicted value) dengan pengamatan sebenarnya.  Perbedaan keduanya: residual dari data sampel, error dari data populasi.

6.4.5. Analisis Regresi Linier Sederhana

  Regresi linier sederhana ini bertujuan untuk mempelajari hubungan antara dua variabel yaitu satu variabel bebas/variabel independen (X) dan variabel terikat/variabel dependen (Y). Bentuk umum dari pesamaan regresi linier sederhana dari populasi adalah:

  

y=α+βx+ε

  Persamaan garis regresi sampel memberikan estimasi garis regresi populasi sebagai berikut:

  ^ y = a+bx i

  Keterangan :

  y

  ^ i = nilai estimasi dari variabel bebas. Ŷ juga merupakan variabel terikat (dependen

  variable)

  a = konstanta yang merupan nilai estimasi ^y jika nilai x=0 (intercept) b = koefisien regresi/gradient garis regresi (slope) x = variabel bebas (independent variable)

6.4.5.1. Metode Kuadarat Terkecil (Least-Squares Method)

  Metode untuk menaksir α dan β sehingga jumlah kuadrat dari deviasi simpangan antara observassi-observasin dan garis regresi menjadi minimum:

  n

2 SSE=L= e

  = ¿ ¿ ¿ ¿

  i ∑ ∑ i=1 i=1

  Dimana ε adalah nilai sisaan/galat/error yang merupakan penyimpangan model regresi dari nilai yang sebenaranya.

  Gambar VI.2 Grafik Regresi Linier dengan Nilai ε Dengan cara mendeferensialkan persamaan di atas terhadap α dan kemudian terhadap β, kemudian menyamakan hasil pendeferensilan itu dengan nol, maka:

  n ∂ L Y ab (x x

  ( − −´ ))= ¿

  i i ¿ ∑

  ∂ a =−2 i=1

  n ∂L

  Dari persamaan di atas, maka diperoleh persamaan:

  ( Yab(x −´ x ))( x −´ x)=0 ¿ i i i

  ¿ ∑

  S xy

  ( ∂b=−2 x−¯x)( y−¯y )

  ∑

  atau b= atau

  i=1 S b= xx

  2 ( x−¯x)

  ∑ n xyx y

  ∑ ∑ ∑

  atau b= 2 2

  n x

  ∑ x ( )

  ∑ Dari persamaan di atas disubstitusi, maka diperoleh persamaan untuk menentukan nilai

  n n y x i i

  ∑ ∑

  a: a =

  i=1 i=1 n b n

  atau: a = ´y – b´x Dimana:

  ´y = rata – rata y

  i

  ´x = rata – rata x

  i

6.4.5.2. Partisi dari Varians Total

2 Estimasi parameter σ menghasilkan variansi yang disebabkan karena kesalahan model

  dan variansi yang disebabkan karena kesalahan eksperimen. Dekomposisi varians dapat dijabarkan sebagai berikut: SST = SSR + SSE Keterangan:

  yy

  SST = Sum of Square Total / Jumlah Kuadrat Total =S SSR = Sum of Square Regression / Jumlah Kuadrat Regresi = bS xy

  − ¿ SSE = Sum of Square Eror / Jumlah Kuadrat Eror = S yy bS xy

  2

2 Dimana : S = x − n ´x

  xx i

  2

  2 y n ´y

  S = −

  yyi

  S = x yn ´x ´y

  xy i i

  2

6.4.5.3. Estimasi dari σ

  Sum of Square Error (SSE) merupakan variansi yang menggambarkan penyimpangan dari nilai–nilai observasi di sekitar garis regresi sampel. Nilai SSE (S e ) atau yang biasa

  2

  disebut MSE (Mean Squared Error) adalah estimasi dari σ dan diestimasi dengan persamaan berikut:

2 S − b S

  

SSE

( y −^y ) yy xy

  ∑

  S e = S = =

  n−2 = n−2 n−2

  √ √

  √

  Standar Error Koefisien Regresi Jika diambil sampel x dan y dari populasi, maka masing–masing sampel tersebut memiliki gradien/slope (b) sendiri. Gradien sampel tersebut akan bervariasi disekitar nilai koefisien regresi tersebut. Maka perlu diketahui variasi koefisien regresi tersebut dengan persamaan berikut:

  s s s ε ε s = = = b

  2

  2 Sxx

  

(

x−¯x)

  ( x) ∑

  √

  2 ∑ x

  ∑ n

6.4.5.3. Standar Error untuk ´y bila nilai x diketahui

  Jika nilai x dimasukkan berulang–ulang pada persamaan regresi, maka nilai rata–rata yang diperoleh tidak akan sama, yang artinya nilai ´y bervariasi. Sehingga nilai standar error ´y dapat ditentukan dengan persamaan berikut (bila x diketahui):

  2

  −´ (x x )

  1 S ´ y = S

  e n + S

  ( xx ) ( )

  √

6.4.6.Uji Parsial Parameter Regresi Digunakan untuk menguji apakah parameter β berarti pada model secara parsial.

  Tahapan uji yang dilakukan:

  • Hipotesis:

  H : β = 0 H : β ≠ 0

  1

  • Statistik Uji:

  bβ bβ t= = S b s /√S xx

  • Pengambilan Keputusan:

  Tolak H jika t > t pada selang kepercayaan α

  hitung a/2(df= n-2)

  • Kesimpulan

6.4.7. Uji Intersep Model Regresi

  Tahapan uji yang dilakukan:

  • Hipotesis:

  H : α = 0

  H

  1 : α ≠ 0

  • Statistik Uji:

  aα t= x i

  ∑ s n S xx

  √

  • Pengambilan Keputusan Tolak H jika t > t pada selang kepercayaan α

  hitung a/2(db= n-2)

  • Kesimpulan

6.4.8. Selang Kepercayaan

  Selang Kepercayaan untuk α:

2 S x

  i

  √ a±t

  α/2 nS

  √ xx

  Selang Kepercayaan untuk β:

  b±t s α/2 b

6.4.9.Prediksi

  Estimasi selang keyakinan untuk Rata-rata y, diberikan pada saat x p

  2 ( x

−¯x )

  1 p ^ y±t s

  α /2 ε

  2 n +

  ( x−¯x)

  ∑ √

  Estimasi selang keyakinan untuk Nilai individual y diberikan pada saat x

  p

  2

( x

−¯x )

  1 p ^ y±t s 1+

  α /2 ε

  2 n +

  

(

x−¯x)

  ∑ √

6.5. Pemilihan Model Regresi

  Penentuan model regresi linier sederhana ditekankan pada konsep linieritasnya dengan asumsi awal bahwa hubungan tersebut linier diparamater regresinya. Pemilihan variabel independen yang kurang tepat dapat menimbulkan bias dalam estimasinya. Tahapan uji yang dilakukan:

  • Hipotesis H : β = 0 H : β ≠ 0

  1

  • Tentukan daerah kritis dengan Level of Significance (α) yang biasa digunakan adalah 0,01 atau 0,05

  Tabel VI.1 Analysis of Variance Sumber Variansi SS df MS F

  hitung

  1 MSR = SSR/1 MSR/s

  2 Regresi SSR

  2 Error SSE n – 2 S = SSE/n-2

  Total SST n – 1

  • Pengambilan Keputusan Tolak H jika F > F pada selang kepercayaan (level of significance) α

  hitung tabel(1 , n-2)

  • Kesimpulan

6.5.1 Pendekatan Analisis Varians (Anova)

  Untuk menguji kelayakan dari suatu model regresi digunakan pendekatan analisis varians.Analisis varians adaah suatu prosedur membagi variansi total variabel dependen menjadi dua komponen, yaitu: variansi model sistematik dan variansi error.

6.6. Analisis Residual

  Analisis residual dapat dilakukan dengan:

  a. Pengujian Unequal variances: Varians pada setiap nilai x harus identik, yaitudengan melakukan plot ^e dengan ^y, apabila terdapat pola-pola tertentu berarti varians tidak

  i identik sehingga perlu distabilkan dengan transformasi.

  b. Pengujian Non normal error,yaitu dengan:  Stem and leaf  Histogram  Dot diagram  Plot normal (Normal Probability Plot)

  c. Jika terdapat extreme skewness (kemiringan yang ekstrim) pada data, maka tidak berdistribusi normal.

  d. Pengujian Correlated Error (independent), yaitu dengan melihat plot ^e i dengan time order (i). Jika ada pola tertentu, maka terjadilah dependent residual dimana penyebabnya dapat karena kesalahan eksperimen atau kesalahan dalam pembentukan model atau karena variabel prediktor yang diabaikan.

  e. Pengecekan Ouliers residual yaitu dengan cara plot residual dalam batas pengujian ±3σ ( plot ^e i dengan ^y).Apabila residual terletak di luar batas 3σ atau nilainya lebih besar dari 3σ, maka ada indikasi outlier.

6.7. Pengujian Linieritas Regresi:untuk data dengan observasi berulang

  Pada beberapa percobaan untuk mendapatkan hasil yang akurat seringkali dilakukan pengulangan observasi untuk setiap nilai x, sehingga perlu dilakukan pengujian apakah model yang dihasilkan sudah memenuhi atau tidak. Untuk menggambarkan kondisi tersebut diatas dilakukan pengujian kecocokan model dengan pendekatan Lack Of Fit.

6.7.1. Pengujian Lack Of Fit

   Sum of squared error terdiri atas dua komponen, yaitu variasi random yang

  muncul antar nilai y untuk setiap nilai x (pure experimental error) dan komponen yang dikenal dengan istilah Lack Of Fit (LoF), untuk mengukur ketepatan model. Prosedur Pengujian:  Hipotesis H : Tidak ada LoF H

  1 : Ada LoF Model Linier tidak sesuai

   Tentukan daerah kritis dengan Level of Significance (α) yang biasa digunakan adalah 0,01 atau 0,05  Hitung Pure Error sum of square (SSpe)

  k n SS = ¿ ¿ ¿ ¿ dengan df = n – k pe

  ∑ ∑ i=1 i=1

  Tabel VI.2 Analysis of Variance Sumber Variansi SS df MS F

  hitung

  1 MSR = SSR/1 MSR/s i

  2 Regres SSR

  2 Error: SSE n – S = SSE(/n-2)

  2 Lof SSE - SSpe k - 2 (SSE – SSpe ¿ /( k−2) Pure error n - k S = SSpe /(n-k)

  2 SSESSpe SSpe

  2 S ( k−2)

  Total SST n  Pengambilan Keputusan Tolak H jika F hitung > F tabel(k-2 , n-k) pada selang kepercayaan (level of significance) α  Kesimpulan Contoh 1 nilai 9 mahasiswa dari suatu kelas pada ujian tengah semester (x) dan pada ujian akhir semester (y) sebagai berikut : n

  1

  2

  3

  4

  5

  6

  7

  8

  9 x

  77

  50

  71

  72

  81

  94

  96

  99

  67

  i

  y

  82

  66

  78

  34

  47

  85

  99

  99

  68

  i a. Tentukan persamaan garis regresi linear.

  b. Tentukan nilai ujian akhir seorang murid yang mendapat nilai 85 pada ujian tengah semester. Jawab : persamaan regresi linear n

  1

  2

  3

  4

  5

  6

  7

  8 9 Σ x i

  77

  50

  71

  72

  81

  94

  96

  99 67 707 y

  82

  66

  78

  34

  47

  85

  99

  99 68 658

  i

  x y 631 330 5538 2448 3807 7990 9504 9801 4556 53258

  i i

  4

  2

  x 592 250 5041 5184 6561 8836 9216 9801 4489 57557

  i

  9

  (

  9 ) ( 53.258 ) ( 707 ) 658) − (

  Sehingga b =

  2 = 0,777142

  9 57.557 −( 707)

  ( ) ( )

  dan

  ( )

  0,777142 ( 707) a = 658− = 12,06232 9 jadi, persamaan regresi linear adalah

  ^

  y = 12,06232 + 0,777142x

  x = 85 ^y = 12,06232 + (0,777142)(85) = 78,11936 Contoh 2 Lakukan uji regresi dengan pendekatan ANOVA pada : x 3,4 2,8 2,5 3,7 3,2 3,1 2,9

  3 2,2 2,4 2,7 y 25

  20

  18

  25

  21

  22

  30

  22

  10

  20

  17 Jawab : Σx = 31,9 Σy = 230 Σ x y = 675,5

  i i 2 =

  2

  Σ x 94,49 Σ y = 4866

  i i

  ´ ´

  x = 2,9 y = 20,9091

  b = 0,777142 a = 12,06232

  2

2 Sxx = Σ x i – n(´x) = 1,98

  Sxy = Σ x y – n(´x ´y)= 8,4997

  i i

  2

  2 Syy = Σ y – n( ´y) = 56,9049 i

2 SSR = b Sxx = 36,4894

  SSE = Syy – SSR = 20,4155  Hipotesis H : β = 0 H : β ≠ 0

  1

  α = 0.05  Tabel Anaysis of Variance KomponenRe SS df MS F

  hitung

  gresi Regresi 36,4 1 36,49 16,08

  9

  22

  32

  34 2010

  31

  37 2009

  32

  35 2008

  31

  38 2007

  36

  30 2006

  2005

  2

  Tahu n Jumlah Biaya Promosi x) Jumlah Penjualan (y)

   Kesimpulan:Model Regresi linier sesuai Contoh 3 Berikut adalah data jumlah biaya promosi (x) dan jumlah penjualan (y) pada perusahaan ABC.

  = 5,12 Karena Fhitung > Ftabel maka Ho ditolak

  (0.05;1,9)

  10  Pengambilan Keputusan F tabel = F

  9

  4

  2 9 2,27 Total 56,9

  6 Error 20,4

  7

  38 Tentukanlah apakah terdapat hubungan antara biaya promosi dengan penjualan menggunakan uji korelasi Spearman Rank dan tingkat kesalahan 1%! Jawab:

  Tahun Jumlah Biaya Promos i (x)

  t hitung

  38

  4.5 5.5 -1

  1 ∑

  2

  r s

  = 1− 6 (2) 6(6

  2

  − 1)

  = 1−

  12 210 =1−0 , 057=0 , 943 Uji Hipotesis: H : Tidak ada hubungan yang signifikan antara variabel biaya promosi dengan variabel penjualan H

  1

  : Ada hubungan yang signifikan antara variabel biaya promosi dengan variabel penjualan.

  Statistika uji:

  =

  0.25 2010

  rn−2

  1−r

  2

  =

  (

  0 , 943

  ) √

  6−2 1− ( 0 , 943 )

  2

  = 1 , 886 0 , 11075=17 , 03

  t tabel

  = t

  ( 0 , 01 2 ; 4 )

  32

  0.5

  Jumlah Penjuala n (y)

  5.5

  Range x Range y

  d i

  = R ( x ) − R( y ) d

  i

  2

  2005

  22

  30

  1

  1 2006

  36

  38

  6

  0.5

  2

  0.25 2007

  31

  35

  2.5 3 -0.5

  0.25 2008

  32

  37

  4.5

  4

  0.5

  0.25 2009

  31

  34

  2.5

  = 4 , 604 Kriteria uji: Karena t hitung > t tabel maka tolak H Kesimpulan: Karena tolak H maka terima H

  1 yakni ada hubungan yang signifikan antara

  57

  46

  47

  96

  89 105 125 107

  97 134 106

  99

  98 117 100

  45

  32

  50

  59

  66

  48

  55

  45

  47

  59

  47

  49 a. Gambar diagram pencarnya.

  b. Tentukn regresi linear Y atas X lalu gambarkan.

  c. Jelaskan arti koefisien arah yang didapat.

  d. Berapa rata-rata prestasi anak dapat diharapkan jika IQ nya 120? e. Tentukan interval kepercayaan 95% untuk rata-rata prestasi anak dengan IQ=120.

  Jelaskan artinya!

  67

  59

  variabel biaya promosi dengan variabel penjualan LATIHAN SOAL:

  40

  1. Data berikut menyatakan IQ=X untuk kelompok anak berumur tertentu dan hasil ujian prestasi pengetahuan umum (Y).

  Xi Yi Xi Yi Yi Yi 114 110 113 137 116 132

  90 121 107 120 125

  92

  29

  41

  48

  73

  55

  80

  75

  49

  43

  64

  53

  31 130 142 137 140 125 134 106 121 111 126

  95 105

  71

  68

  69

  66

  39

  78

  f. Tentukan interval kepercayaan 95% untuk seorang anak dengan IQ=120. Jelaskan artinya! g. Tentukan interval kepercayaan 95% untuk perubahan rata-rata prestasi jika IQ berubah dengan satu unit.

  h. Perlukah diambil model berbentuk lain? i. Asumsi apakah yang harus diambil untuk menyelesaikan pertanyaan-pertanyaan diatas?

  2. Dari tabel berikut ini:

  o

  X (

  C) Y (gram)

  8

  6

  8

  15

  12

  10

  14

  30

  25

  21

  24

  45

  31

  33

  28

  60

  44

  39

  42

  75

  48

  51

  44 Carilah persamaan garis regresi Gambarkan garis tersebut pada diagram pencar

  o

  Taksirlah banyaknya senyawa yang larut dalam 100 g air pada 50 C.

  3. Lakukan uji model regresi pada soal no.1.

  4. Berikut adalah data banyaknya modal (dalam juta rupiah) dan keuntungan yang diperoleh (dalam juta rupiah) yang dihasilkan dalam waktu 10 bulan.

  Modal (x) 189 204 192 214 218 178 189 167 180 194 Keuntungan

  10

  15

  13

  17

  19

  14

  13

  11

  13

  15 (y)

  a. Hitunglah koefisien korelasi Pearson dan determinasi berdasarkan data di atas dan ujiah! b. Tentukan apakah pernyataan bahwa koefisien korelasi antara jumlah karyawan dan keuntungan tidak lebih dari 0,7 adalah benar! Gunakan tingkat kesalahan 5%!

  5. Hitunglah koefisien korelasi kondisi temperatur (x) dan kepuasan pekerja (y) serta apakah ada hubungan yang signifikan antara keduanya dengan menggunakan teknik korelasi pearson! n

  12

  9

  12

  16

  10

  9

  17

  11

  10

  16

  12

  10

  17

  13

  12

  18

  14

  12

  12

  15

  12

  19

  8

  Kondisi temperatur (x)

  17

  KepuasanKerja (y)

  1

  8

  20

  2

  12

  20

  3

  10

  4

  18

  7

  18

  5

  8

  19

  6

  7

  20

  7

  12

  17

  6. Dibawah ini diberikan data yang secara acak diambil dari populasi normal bervariabel dua (X dan Y).

  3

  18

  11

  56

  75 137 163

  84 149 140 137 170 109

  17

  6

  8

  5

  6

  16

  14

  5

  15

  16 153

  73

  95

  26

  24

  50

  96

  13

  18

  X Y

  12

  X Y

  X Y

  15

  13

  10

  11

  16

  12

  9

  4

  12

  8 108 106

  99 110 135

  97

  74

  98 20.

  69

  8

  11

  17

  20

  35 132 141

  I.1.1 Regresi Linier Berganda

  Analisis regresi linier berganda digunakan untuk menganalisis hubungan antara variabel bebas (x) dan variabel terikat (y). Namun pada regresi linier berganda ini, variabel bebas (x) yang digunakan lebih dari dari satu. Bentuk persamaan umum untuk model regresi linier berganda:

  x b x … …+b x + +

  ^

  y= a + b

  1

  1

  2 2 n n

  Keterangan: ^

  y = nilai dari variabel terikat

  a = konstata nilai estimasi ^y jika nilai x=0 (intercept)

  b i

  = koefisien regresi gradient garis regresi (slope)

  x n

  = variabel bebas

  I.1.1.1 Metode Kuadarat Terkecil (Least-Squares Method) x , x ; y ;i=1, 2, … , n

  Untuk setiap pengamatan { ( 1i 2i i ) ¿ } akan memenuhi persamaan:

  x b x … …+b x e + + +

  ^

  1

  1

  2 2 n n i y= a + b

  Dengan menggunakan metode kuadrat terkecil, maka diperoleh persamaan:

  e xb x… …b x i = ^y- a - b

  1

  1

  2 2 n n

  1

2 Dengan syarat meminimasikan nilai a, b , dan b penurunannya, maka diperoleh persamaan:

  n n y = an + b x + b x

  1 i 1 1 i 2 i

  ∑ ∑ ∑ i=1 i=1 n n n n

  2 x y = a x + b x + b x x

  1 i i 1 i 1 i 1 2 i 1 i 2 ∑ ∑ ∑ ∑ i=1 i=1 i=1 i=1 n n n n

  2 x y = a x + b x + b x x

  2 i i 2 i 2 i 2 1 i 1 2 i ∑ ∑ ∑ ∑ i=1 i=1 i=1 i=1

  Asumsi yang digunakan dalam analisis regresi linier berganda antara lain:

  2

  a. Setiap nilai error berdistribusi normal dengan rata–rata 0 dan dan varians σ

  b. Bersifat homoskedastisitas c. Kovarian error = 0, tidak terjadi autokorelasi

  d. Tidak terdapat multikolinieritas, artinya tidak terdapat hubungan linier yang sempurna diantara variabel–variabel bebas.

  31

  o C.

  c. Taksirlah banyaknya senyawa yang larut dalam 100 g air pada 50

  b. Gambarkan garis tersebut pada diagram pencar

  a. Carilah persamaan garis regresi

  44

  51

  48

  75

  42

  39

  44

  60

  28

  33

  45

  Latihan soal

  8

  1. Dari tabel berikut ini:

  X (

  o

  C) Y (gram)

  8

  6

  15

  24

  12

  10

  14

  30

  25

  21

  2. Lakukan uji model regresi pada soal no.1.

Informasi dokumen
Dokumen baru
Aktifitas terbaru
Penulis
123dok avatar

Berpartisipasi : 2016-09-17

Dokumen yang terkait

BAB VI - BAB VI regresi

Gratis

Feedback