ARTIKEL STATISTIKA
BAB 9. ANALISIS REGRESI & ANALISIS
KORELASI
A. KORELASI
1. PENGERTIAN KORELASI
Korelasi merupakan teknik
analisis yang termasuk dalam salah satu teknik pengukuran asosiasi / hubungan
(measures of association). Pengukuran asosiasi merupakan istilah umum yang
mengacu pada sekelompok teknik dalam statistik bivariat yang digunakan untuk
mengukur kekuatan hubungan antara dua variabel. Diantara sekian banyak
teknik-teknik pengukuran asosiasi, terdapat dua teknik korelasi yang sangat
populer sampai sekarang, yaitu Korelasi Pearson Product Moment dan Korelasi
Rank Spearman. Selain kedua teknik tersebut, terdapat pula teknik-teknik
korelasi lain, seperti Kendal, Chi-Square, Phi Coefficient, Goodman-Kruskal, Somer,
dan Wilson.
Pengukuran asosiasi mengenakan
nilai numerik untuk mengetahui tingkatan asosiasi atau kekuatan hubungan antara
variabel. Dua variabel dikatakan berasosiasi jika perilaku variabel yang satu
mempengaruhi variabel yang lain. Jika tidak terjadi pengaruh, maka kedua
variabel tersebut disebut independen.
Korelasi bermanfaat untuk
mengukur kekuatan hubungan antara dua variabel (kadang lebih dari dua variabel)
dengan skala-skala tertentu, misalnya Pearson data harus berskala interval atau
rasio; Spearman dan Kendal menggunakan skala ordinal; Chi Square menggunakan
data nominal. Kuat lemah hubungan diukur diantara jarak (range) 0 sampai dengan
1. Korelasi mempunyai kemungkinan pengujian hipotesis dua arah (two tailed).
Korelasi searah jika nilai koefesien korelasi diketemukan positif; sebaliknya
jika nilai koefesien korelasi negatif, korelasi disebut tidak searah. Yang
dimaksud dengan koefesien korelasi ialah suatu pengukuran statistik kovariasi
atau asosiasi antara dua variabel. Jika koefesien korelasi diketemukan tidak
sama dengan nol (0), maka terdapat ketergantungan antara dua variabel tersebut.
Jika koefesien korelasi diketemukan +1. maka hubungan tersebut disebut sebagai
korelasi sempurna atau hubungan linear sempurna dengan kemiringan (slope) positif.
Jika koefesien korelasi
diketemukan -1. maka hubungan tersebut disebut sebagai korelasi sempurna atau
hubungan linear sempurna dengan kemiringan (slope) negatif. Dalam korelasi
sempurna tidak diperlukan lagi pengujian hipotesis, karena kedua variabel
mempunyai hubungan linear yang sempurna. Artinya variabel X mempengaruhi
variabel Y secara sempurna. Jika korelasi sama dengan nol (0), maka tidak
terdapat hubungan antara kedua variabel tersebut. Dalam korelasi sebenarnya
tidak dikenal istilah variabel bebas dan variabel tergantung. Biasanya dalam
penghitungan digunakan simbol X untuk variabel pertama dan Y untuk variabel
kedua. Dalam contoh hubungan antara variabel remunerasi dengan kepuasan kerja,
maka variabel remunerasi merupakan variabel X dan kepuasan kerja merupakan
variabel Y.
2. KEGUNAAN
Pengukuran asosiasi berguna untuk
mengukur kekuatan (strength) hubungan antar dua variabel atau lebih. Contoh:
mengukur hubungan antara variabel:
-Motivasi kerja dengan produktivitas
-Kualitas layanan dengan kepuasan pelanggan
-Tingkat inflasi dengan IHSG
Pengukuran ini hubungan antara
dua variabel untuk masing-masing kasus akan menghasilkan keputusan,
diantaranya:
-Hubungan kedua variabel tidak ada
-Hubungan kedua variabel lemah
-Hubungan kedua variabel cukup kuat
-Hubungan kedua variabel kuat
-Hubungan kedua variabel sangat kuat
Penentuan tersebut didasarkan
pada kriteria yang menyebutkan jika hubungan mendekati 1, maka hubungan semakin
kuat; sebaliknya jika hubungan mendekati 0, maka hubungan semakin lemah.
3. ANALISIS KORELASI
3.1 Analisis Korelasi Parsial
Analisis korelasi parsial
(Partial Correlation) digunakan untuk mengetahui hubungan antara dua variabel
dimana variabel lainnya yang dianggap berpengaruh dikendalikan atau dibuat
tetap (sebagai variabel kontrol). Nilai korelasi (r) berkisar antar 1 sampai
-1, nilai semakin mendekati 1 atau -1 berarti hubungan antara dua variabel
semakin kuat, dan sebaliknya. Nilai positif menunjukkan hubungan searah (X naik
maka Y naik) dan nilai negatif menunjukkan hubungan terbalik (X naik maka Y
turun). Data yang digunakan biasanya berskala interval atau rasio. Menurut
Sugiyono (2007) pedoman untuk memberikan interpretasi koefisien korelasi
sebagai berikut:
0,00 – 0,199 = sangat rendah
0,20 – 0,399 = rendah
0,40 – 0,599 = sedang
0,60 – 0,799 = kuat
0,80 – 1,000 = sangat kuat
Contoh kasus:
Kita mengambil contoh pada
kasus korelasi sederhana di atas dengan menambahkan satu variabel kontrol.
Seorang mahasiswa bernama Andi melakukan penelitian dengan menggunakan alat
ukur skala. Andi ingin meneliti tentang hubungan antara kecerdasan dengan
prestasi belajar jika terdapat faktor tingkat stress pada siswa yang diduga
mempengaruhi akan dikendalikan. Dengan ini Andi membuat 2 variabel yaitu
kecerdasan dan prestasi belajar dan 1 variabel kontrol yaitu tingkat stress.
Tiap-tiap variabel dibuat beberapa butir pertanyaan dengan menggunakan skala
Likert, yaitu angka 1=sangat tidak setuju, 2=tidak setuju, 3=setuju, dan
4=sangat setuju. Setelah membagikan skala kepada 12 responden didapatlah skor
total item-item yaitu sebagai berikut:
Tabel Tabulasi Data (data fiktif)
Subjek Kecerdasan Prestasi Belajar Tingkat Stress
1 33 58 25
2 32 52 28
3 21 48 32
4 34 49 27
5 34 52 27
6 35 57 25
7 32 55 30
8 21 50 31
9 21 48 34
10 35 54 28
11 36 56 24
12 21 47 29
3.2 Analisis Korelasi Product Moment
Digunakan untuk menentukan
besarnya koefisien korelasi jika data yang digunakan berskala interval atau
rasio. Rumus yang digunakan:
Contoh
kasus:
Seorang mahasiswa melakukan survei untuk meneliti
apakah ada korelasi antara pendapatan mingguan dan besarnya tabungan mingguan
di P’Qerto.
Untuk menjawab permasalahan tersebut diambil sampel sebanyak 10 kepala
keluarga.
Cara melakukan perhitungan manual uji korelasi di atas adalah sebagai berikut:
Asumsi uji
korelasi
Sebelum diimplementasi, uji korelasi harus
memenuhi serangkaian asumsi, yaitu:
1. Normalitas, artinya sebaran variabel-variabel
yang hendak dikorelasikan harus berdistribusi normal.
2. Linieritas, artinya hubungan antara dua
variabel harus linier, misalnya ditunjukkan lewat straight-line.
3. Ordinal, artinya variabel harus diukur dengan
minimal skala ordinal.
4. Homoskedastisitas, artinya variabilitas skor
di variabel Y harus tetap konstan di semua nilai variabel X.
Kriteria Penerimaan Hipotesis
H0 : tidak terdapat korelasi positif antara
tabungan dengan pendapatan
Ha : terdapat korelasi positif antara tabungan
dengan pendapatan
H0 diterima jika r hitung ≤ r tabel ( , n-2) atau
t hitung ≤ ttabel ( , n-2)
Ha diterima jika r hitung > r tabel ( , n-2)
atau t hitung > ttabel ( , n-2)
Sampel: 10 kepala keluarga
Data yang dikumpulkan:
Tabungan 2 4 6 6 8 8 9 8 9 10
pendapatan 10 20 50 55 60 65 75 70 81 85
Analisis data:
N Xi Yi Xi^2 Yi^2 XY
1 2 10 4 100 20
2 4 20 16 400 80
3 6 50 36 2500 300
4 6 55 36 3025 330
5 8 60 64 3600 480
6 8 65 64 4225 520
7 9 75 81 5625 675
8 8 70 64 4900 560
9 9 81 81 6561 729
10 10 85 100 7225 850
jumlah 70 571 546 38161 4544
Pengujian hipotesis:
Dengan kriteria r hitung: r hitung (0,981) > r
tabel (0,707)
Dengan kriteria t hitung:
t hitung (14,233) > t tabel (1,86)
kesimpulan:
karena r hitung > dari r tabel maka Ha diterima, karena t hitung > t
tabel maka Ha diterima
“terdapat korelasi positif antara pendapatan dengan tabungan mingguan di
P’Qerto”
Pemikiran utama korelasi product momen adalah
seperti ini:
1. Jika kenaikan kuantitas dari suatu variabel
diikuti dengan kenaikan kuantitas dari variabel lain, maka dapat kita katakan
kedua variabel ini memiliki korelasi yang positif. Jika kenaikan kuantitas dari
suatu variabel sama besar atau mendekati besarnya kenaikan kuantitas dari suatu
variabel lain dalam satuan SD, maka korelasi kedua variabel akan mendekati.
2. Jika kenaikan kuantitas dari suatu variabel
diikuti dengan penurunan kuantitas dari variabel lain,maka dapat kita katakan
kedua variabel ini memiliki korelasi yang negatif. Jika kenaikan kuantitas dari
suatu variabel sama besar atau mendekati besarnya penurunan kuantitas dari
variabel lain dalam satuan SD,maka korelasi kedua variabel akan mendekati -1.
3. Jika kenaikan kuantitas dari suatu variabel
diikuti oleh kenaikan dan penurunan kuantitas secara random dari variabel lain
atau jika kenaikan suatu variabel tidak diikuti oleh kenaikan atau penurunan
kuantitas variabel lain (nilai dari variabel lain stabil), maka dapat dikatakan
kedua variabel itu tidak berkorelasi atau memiliki korelasi yang mendekati nol.
Dari pemikiran ini kemudian lahirlah Rumus
Korelasi Product Momen Pearson seperti yang sering kita lihat di buku. Ada
beberapa rumus yang dapat diacu. Semuanya akan memberikan hasil r yang sama,
hanya saja dengan melihatnya kita akan dapat melihat pemaknaan yang
berbeda-beda.
Ada beberapa hal yang dapat kita pelajari dari
rumus ini :
Rumus pertama :
Jika setiap subjek yang memiliki nilai X lebih
rendah dari meannya, memiliki nilai Y yang juga lebih rendah dari meannya,
nilai r akan menjadi positif. Begitu juga jika setiap subjek yang memiliki
nilai X lebih tinggi dari meannya, memiliki nilai Y yang lebih tinggi dari
meannya. Jika setiap subjek yang memiliki nilai X yang lebih tinggi dari
meannya, memiliki nilai Y yang lebih rendah dari meannya maka nilai r akan
menjadi negatif. Begitu juga jika tiap subjek yang memiliki nilai X lebih
rendah dari meannya memiliki nilai Y yang lebih tinggi dari meannya. Jika tiap
nilai X yang lebih tinggi dari meannya terkadang diikuti oleh nilai Y yang
lebih tinggi terkadang lebih rendah dari meannya maka nilai r akan cenderung
mendekati 0 (nol).
Rumus kedua:
Dari rumus kedua ini dapat kita simpulkan bahwa
nilai korelasi sebenarnya nilai kovarian dari dua variabel x dan y yang
distandardkan dengan menggunakan standard deviasi x dan standard deviasi y
sebagai denominatornya. Nilai kovarian sangat dipengaruhi oleh satuan skala
yang digunakan oleh kedua variabel. Misalnya kita menghitung kovarian dari
tinggi badan dengan panjang rambut , pengen tahu apakah tinggi badan
berkorelasi dengan panjang rambut. Kita menghitung tinggi badan dan panjang
rambut dalam satuan meter. Kemudian kita hitung kovariannya. Setelah itu kita
menggunakan data yang sama, hanya mengubah satuannya menjadi centimeter, lalu
menghitung kovariannya. Nah kovarian dari hasil perhitungan kedua akan terlihat
lebih besar daripada yang pertama. Lebih besar? Ya karena dengan menggunakan
satuan centimeter, 1.4 meter akan menjadi 140 centimeter. Jika kita hitung
kovariannya, perhitungan pertama akan menghitung dalam skala satuan (1.4, 1.5,
dst) sementara perhitungan kedua akan menghitung dalam skala ratusan. Oleh
karena itu perlu distandardkan agar data yang sama akan menghasilkan angka yang
sama meskipun diubah skalanya.
Rumus ketiga:
Zx dan Zy itu berbicara mengenai nilai X dan Y dalam satuan SD. Jika nilai X
ada di bawah mean dari X maka nilai Zx akan negatif, jika nilai X ada di atas
meannya maka nilai Zx akan positif. Begitu juga dengan Y. Seperti pada rumus
pertama, jika Zx dan Zy sepakat (keduanya positif atau negatif) maka nilai r
akan positif. Jika Zx dan Zy berlawanan (jika yang satu positif yang lain
negatif) maka nilai r akan negatif. Nah misalnya ada seratus subjek memiliki
nilai X dan Y. Lalu kita hitung satu-satu nilai Z dari X dan Y untuk tiap
subjek. Tentu saja ada beberapa yang sangat sepakat yang lain agak sepakat yang
beberapa berlawanan. Kemudian nilai-nilai Z ini dijumlahkan sehingga jika yang
sepakat lebih banyak akan menghasilkan angka positif. Kalo yang berlawanan
lebih banyak akan menghasilkan angka negatif. Kemudian hasil penjumlahan ini
dicari rata-ratanya. Jadi bisa dibilang nilai r itu akan menggambarkan
rata-rata keadaan X dan Y dari semua subjek dalam kelompok.
A.
REGRESI
1. PENGERTIAN
Analisis regresi dalam
statistika adalah salah satu metode untuk menentukan hubungan sebab-akibat
antara satu variabel dengan variabel(-variabel) yang lain. Variabel “penyebab”
disebut dengan bermacam-macam istilah: variabel penjelas, variabel
eksplanatorik, variabel independen, atau secara bebas, variabel X (karena
seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel
terkena akibat dikenal sebagai variabel yang dipengaruhi, variabel dependen,
variabel terikat, atau variabel Y. Kedua variabel ini dapat merupakan variabel
acak (random), namun variabel yang dipengaruhi harus selalu variabel acak. Analisis
regresi adalah salah satu analisis yang paling populer dan luas pemakaiannya.
Hampir semua bidang ilmu yang memerlukan analisis sebab-akibat boleh dipastikan
mengenal analisis ini.
2. KEGUNAAN
Tujuan menggunakan analisis regresi ialah:
-Membuat estimasi rata-rata dan nilai variabel
tergantung dengan didasarkan pada nilai variabel bebas.
-Menguji hipotesis karakteristik dependensi
-Untuk meramalkan nilai rata-rata variabel bebas
dengan didasarkan pada nilai variabel bebas diluar jangkaun sample.
3. ANALISIS REGRESI
3.1
Analisis Regresi Berganda
Regresi berganda seringkali digunakan
untuk mengatasi permasalahan analisis regresi yang melibatkan hubungan dari dua
atau lebih variabel bebas. Pada awalnya regresi berganda dikembangkan oleh ahli
ekonometri untuk membantu meramalkan akibat dari aktivitas-aktivitas ekonomi
pada berbagai segmen ekonomi. Misalnya laporan tentang peramalan masa depan
perekonomian di jurnal-jurnal ekonomi (Business Week, Wal Street Journal, dll),
yang didasarkan pada model-model ekonometrik dengan analisis berganda sebagai
alatnya. Persamaan regresi linear berganda sebagai berikut:
Y’ = a+b1X1+b2X2+….+ bnXn
Keterangan:
Y’ : variabel dependen (nilai yag diprediksikan)
X1 dan X2 : variabel independen
a : konstanta
b : koefisien regresi(nilai
peningkatan/penurunan)
contoh
kasus:
Seorang peneliti ingin mengetahui pengaruh dari
tinggi badan terhadap berat badan. Untuk kebutuhan penelitian tersebut diambil
sampel secara acak sebanyak 10 orang untuk diteliti. Hasil pengumpulan data
diketahui data sebagai berikut :
Berdasarkan data tersebut di atas :
Hitunglah nilai a dan b untuk persamaan regersi linier sederhana. Jika
hipotesis penelitian menyatakan bahwa “tinggi badan seseorang berpengaruh
terhadap berat badan seseorang”, ujilah hipotesis tersebut dengan menggunakan
Uji T dan Uji F (tingkat keyakinan sebesar 95%). Hitunglah nilai r dan
koefisien determinasi. Bagaimana kesimpulannya !
Jawab :
Hipotesis penelitian : Tinggi Badan berpengaruh terhadap Berat Badan Seseorang
(karena hanya dikatakan berpengaruh maka menggunakan uji dua arah).
Jika Y : Berat Badan Seseorang dan X : Tinggi Badan Seseorang, maka untuk
mendapatkan nilai a dan b untuk persamaan regersi linier sederhana :
Berdasarkan hasil pengolahan data tersebut di
atas maka dapat dibuat persamaan regresi linier sederhana : Y = – 73,72041 +
0,819657 X
Untuk
menguji hipotesis secara parsial digunakan Uji T, yaitu :
Hipotesis Statistik adalah Ho : b = 0 dan Ha : b ≠ 0 (disebut uji dua arah)
Nilai T hitung adalah : b/Sb =
0,819657/0,05525673 = 14,833613932638 = 14,834
Nilai T tabel dengan df : 10 – 2 = 8 dan ½ α =
2,5% (uji dua arah) sebesar ± 2,306
Karena nilai T hitung lebih besar dari pada T tabel atau 14,834 > 2,306 maka
Ho ditolak, Ha diterima dan hipotesis penelitian yang menyatakan bahwa Tinggi
Badan berpengaruh terhadap Berat Badan Seseorang adalah dapat diterima (dapat
dikatakan signifikan secara statistik).
Sedangkan untuk menguji secara serempak digunakan Uji F, yaitu diperoleh F
hitung = 31.874,98 dan Untuk nilai F tabel dengan df : k – 1 ; n – k = 1 ; 8
dan α : 5% sebesar 5,32. Karena nilai F hitung lebih besar dari F tabel atau
31.874,98 > 5,32 maka Ho ditolak, Ha diterima dan hipotesis penelitian yang
menyatakan bahwa Tinggi Badan berpengaruh terhadap Berat Badan Seseorang adalah
dapat diterima.
3.3 Analisis Regresi Sederhana
Regresi
Linier Sederhana Regresi linier sederhana bertujuan mempelajari hubungan linier
antara dua variabel. Dua variabel ini dibedakan menjadi variabel bebas (X) dan
variabel tak bebas (Y). Variabel bebas adalah variabel yang bisa dikontrol
sedangkan variabel tak bebas adalah variabel yang mencerminkan respon dari
variabel bebas.
Statistik
regresi dapat didapatkan dengan berbagai cara, diantaranya ialah dengan
menggunakan metode tangan bebas dan metode kuadrat terkecil. Dengan menggunakan
metode kuadrat terkecil maka nilai a dan b dapat langsung dicari menggunakan
rumus di bawah ini:
Contoh:
Diketahui peubah nilai skor tes masuk (X) dengan nilai ekonomi (Y) sebagai
berikut:
Mahasiswa Skor tes (X) Nilai ekonomi (Y)
1 65 65
2 50 74
3 55 76
4 65 90
5 55 85
6 70 87
7 65 94
8 70 98
9 55 81
10 70 91
11 50 76
12 55 74
Berdasarkan data diatas tentukan hubungan
matematis antara skor tes masuk dengan nilai ekonomi.
Jawaban:
Sehingga persamaan regresinya ialah:
Y= 30,056 + 0,897 X
SUMBER :
http://fariidaelf.wordpress.com/materi-kuliah/korelasi-regresi/