MEDIA STATISTIKA 13 (1) 2020: 92-103: p-ISSN 1979 - 3693 e-ISSN 2477 - 0647
MEDIA STATISTIKA 13 (1) 2020: 92-103: p-ISSN 1979 - 3693 e-ISSN 2477 - 0647
MEDIA STATISTIKA 13 (1) 2020: 92-103: p-ISSN 1979 - 3693 e-ISSN 2477 - 0647
e-mail: nur-c@fst.unair.ac.id
DOI: 10.14710/medstat.13.1.92-103
1. PENDAHULUAN
Estimasi selang kepercayaan merupakan salah satu bagian dari inferensi statistik
yang sangat penting karena dengan estimasi selang kepercayaan tersebut dapat diketahui
apakah nilai suatu parameter signifikan atau tidak terutama parameter dalam suatu model
regresi. Dalam model regresi yang melibatkan lebih dari satu variabel prediktor ada tiga
pendekatan yang dapat digunakan yaitu model regresi parametrik, regresi nonparametrik
dan regresi semiparametrik. Apabila dalam analisis regresi fungsi regresi pola datanya
2. TINJAUAN PUSTAKA
2.1 Model Regresi Semiparametrik Multirespon
Diberikan data berpasangan y
(k )
i , xi , ti , i 1, 2,, n ; k 1, 2,..., r yang mengikuti
model regresi semiparametrik (Chamidah, et al. 2018):
y i Xi f (t i ) i (1)
Xi 1, xi
(1)
, xi(2) ,..., xi( r ) adalah variabel prediktor sebagai komponen parametrik dan
f ti f1 ti f 2 ti f r ti adalah fungsi regresi yang diestimasi dengan pendekatan
T
(r)
, i 1, 2,..., n (2)
1
j ji
j 1 d 1
Untuk n observasi persamaan (2) dapat dinyatakan dalam bentuk matriks berikut ini
y C , ~ N 0, W (3)
C x t
y (1) C (1) 0
0 (1)
y (2) ( 2) (2)
y C
0 C 0 0
(R)
(R) (R)
y 0 0 C
0 1 2 p 1 2 q
(r ) (r ) (r ) (r ) (r ) (r ) (r) (r)
Vektor error (1) , (2) ,..., ( R) antar respon saling berkorelasi sehingga untuk mengestimasi
parameter digunakan metode Weighted Least Square (WLS) dengan pembobot adalah
invers dari matriks variansi-kovariansi error W 1 . Struktur matriks variansi-kovariansi
error ditunjukkan sebagai berikut:
E (1) (1)T E (1) (2)T
E (1) ( R)T
W11 W12 W1R
E (2) (1)T E (2) (2)T
E (2) ( R)T W W
E 21 22 W2 R
E T W
WR1 WR 2 WRR
E
( R ) (1)T
E ( R ) (2)T E
( R ) ( R )T
Berdasarkan metode WLS diperoleh estimasi untuk parameter
ˆ (CT W 1C )1CT W 1 y (4)
Jika tingkat signifikansi sebesar maka selang kepercayaan (1- )100% untuk parameter
ˆ pada persamaan (3) adalah sebagai berikut:
P ˆv Z (C TW 1C )vv
1
v ˆv Z (C TW 1C )vv
1
1
2 2
3. METODE PENELITIAN
3.1. Data dan Sumber Data
Sumber data yang digunakan adalah data UNBK SMKN pada jurusan Teknik
Komputer Jaringan (TKJ) di Provinsi Nusa Tenggara Barat pada tahun 2017. Variabel
yang digunakan terdiri dari 4 variabel respon yaitu nilai UNBK Matematika (y1), nilai
UNBK Bahasa Indonesia (y2), nilai UNBK Bahasa Inggris (y3), dan nilai UNBK
Kompetensi (y4). Variabel prediktor yaitu Jenis Kelamin (x1) dan Nilai Rapor (x2) sebagai
komponen parametrik, Lama Pendidikan Orang Tua (t1) dan Nilai USBN (t2) sebagai
komponen nonparametrik.
3.2 Langkah-langkah Penelitian
Langkah-langkah estimasi selang kepercayaan parameter model regresi
semiparametrik multirespon dan multiprediktor pada komponen nonparametriknya yang
diterapkan pada data UNBK Provinsi Nusa Tenggara Barat dilakukan sebagai berikut:
1. melakukan analisis deskriptif pada tiap variabel respon dan variabel prediktor.
2. membuat scatter plot antara variabel respon dengan variabel prediktor untuk
mengetahui perilaku data.
3. menguji signifikansi korelasi antar respon menggunakan korelasi Pearson.
4. membuat script program R antara lain untuk penentuan titik knot optimal berdasarkan
metode GCV, mengestimasi titik dan selang kepercayaan parameter model sesuai
dengan teori yang telah dihasilkan.
5. menerapkan hasil dari langkah (4) untuk mengestimasi nilai UNBK SMKN di Provinsi
Nusa Tenggara Barat dengan pendekatan model regresi semiparametrik multirespon
berdasarkan estimator truncated spline.
34
67,5
65,0
32
31 62,5 62,1997
30,5726
30,3548 61,2703
30
60,0
29
57,5
28
27 55,0
26
LAKI-LAKI PEREMPUAN
LAKI-LAKI PEREMPUAN
Gambar 1a Boxplot antara Nilai UNBK Gambar 1b Boxplot antara Nilai UNBK
Matematika Berdasarkan Jenis Kelamin Bahasa Indonesia Berdasarkan Jenis Kelamin
Boxplot nilai UNBK Bahasa Inggris Boxplot nilai UNBK Kompetensi Keahlian
42 68
36 64 64,0198 63,8936
34,6765 34,7803
62
33
60
30
58
LAKI-LAKI PEREMPUAN LAKI-LAKI PEREMPUAN
Gambar 1c Boxplot antara Nilai UNBK Gambar 1d Boxplot antara Nilai UNBK
Bahasa Inggris berdasarkan Jenis Kelamin Kompetensi Keahlian berdasarkan Jenis
Kelamin
Identifikasi variabel prediktor nilai rapor yang diwakili oleh rapor Matematika
digambarkan dalam scatter plot Gambar 2.
50
45
matematika
nilai UNBK
40
35
30
25
20
66 68 70 72 74 76 78
nilai rapor matematika
Gambar 2 Scatter Plot antara Nilai UNBK Matematika dengan Nilai Rapor Matematika
Berdasarkan scatter plot pada Gambar 2 terlihat bahwa variabel nilai rapor
merupakan variabel yang membentuk pola tertentu yaitu liner sehingga variabel nilai ini
merupakan komponen parametrik dalam model regresi semiparametrik multirespon
truncated spline. Identifikasi variabel prediktor lama pendidikan orang tua terhadap nilai
UNBK pada mata pelajaran Matematika digambarkan dalam scatter plot Gambar 3.
Variabel lama pendidikan orang tua pada Gambar 3 terhadap nilai UNBK
Matematika terlihat tidak membentuk pola tertentu, sehingga variabel lama pendidikan
orang tua merupakan komponen nonparametrik pada model regresi semiparametik
multirespon truncated spline. Identifikasi variabel prediktor nilai USBK terhadap nilai
UNBK pada mata pelajaran Matematika digambarkan dalam scatter plot Gambar 4.
Berdasarkan pada Gambar 4 bahwa hubungan antara nilai USBK dengan UNBK
Matematika terlihat tidak membentuk pola tertentu, sehingga variabel USBK merupakan
komponen nonparametrik pada model regresi semiparametik multirespon truncated spline.
35
matematika
nilai UNBK
34
33
32
31
30
- 5 10 15 20
lama pendidikan orang tua
Gambar 3. Scatter Plot antara Nilai UNBK Matematika dengan Lama
Pendidikan Orang Tua.
36
nilai UNBK matematika
34
32
30
28
26
24
66 68 70 72 74 76 78
nilai USBK matematika
Gambar 4. Scatter Plot antara Nilai UNBK dengan Nilai USBK Matematika
Berdasarkan Tabel 2 diperoleh nilai p-value semuanya 0,000 < 0.05 sehingga
disimpulkan bahwa terdapat korelasi yang signifikan antar variabel respon. Selanjutnya
untuk mendapatkan estimasi model terbaik ditentukan titik knot optimal berdasarkan
metode GCV. Dari hasil analisis diperoleh nilai GCV minimum sebesar 2,720 dan nilai
MSE sebesar 2,843 dengan titik knot optimal seperti pada Tabel 3. Berdasarkan Tabel 3
pada nilai UNBK Matematika terdapat 3 titik knot optimal pada nilai 10; 71 dan 74. Nilai
UNBK Bahasa Indonesia terdapat 4 titik knot optimal pada nilai 7; 11,66; 80,66 dan 85,33.
Nilai UNBK Bahasa Inggris terdapat 4 titik knot optimal pada nilai 7; 11,6; 81,33 dan
87,66. Nilai UNBK Kompetensi Keahlian terdapat 3 titik knot optimal pada nilai 7; 11,66
dan 82,5.
y (2) 0.026(2) 0.185(2) x1(2) 0.423(2) x2(2) 0.029(2) t1(2) 0.117(2) (t1(2) 7(2) )
0.136(2) (t1(2) 11.66(2) ) +0.311(2) t2(2) 0.081(2) (t2(2) 80.66(2) )
0.250(2) (t2(2) 85.33(2) ) + (2)
y (3) 0.032(3) 0.323(3) x1(3) 0.304(3) x2(3) 0.097(3) t1(3) 0.189(3) (t1(3) 7(3) )
0.182(3) (t1(3) 10.66(3) ) +0.098(3) t2(3) 0.689(3) (t2(3) 81.33(3) )
1.503(3) (t2(3) 87.66(3) ) + (3)
y (4) 2.084(4) 0.002(4) x1(4) 0.287(4) x2(4) 0.038(4) t1(4) 0.001(4) (t1(4) 7(4) )
0.056(4) (t1(4) 11.66(4) ) +0.480(4) t2(4) 0.961(4) (t2(4) 82.50(4) ) + (4)
Berdasarkan estimasi titik pada model terbaik, selanjutnya diestimasi selang
kepercayaan parameter model semiparametrik untuk mengetahui variabel prediktor yang
diduga mempengaruhi nilai UNBK berpengaruh secara signifikan atau tidak. Hasil estimasi
titik dan estimasi selang kepercayaan parameter model regresi semiparametrik multirespon
truncated spline secara lengkap ditunjukan pada Tabel 4.
Berdasarkan hasil selang kepercayaan 95% parameter model pada Tabel 4, variabel
prediktor yang tidak berpengaruh signifikan terhadap nilai UNBK adalah jenis kelamin dan
lama pendidikan orang tua karena selang kepercayaan parameternya diperoleh rentang dari
nilai negatif sampai nilai positif yg memuat nilai nol, sedangkan yang berpengaruh
signifikan positif adalah nilai rapor dan nilai ujian sekolah (USBK) yang memiliki rentang
dengan batas bawah sampai batas atas bernilai positif. Setiap peningkatan nilai rapor satu
satuan akan meningkatkan nilai UNBK Bahasa Indonesia, Bahasa Inggris dan Kompetensi
keahlian masing- masing sebesar 0,423; 0,304 dan 0,287, namun hanya pada nilai UNBK
mata pelajaran Matematika saja nilai rapor berpengaruh negatif yaitu sebesar -0,084.
Pengaruh nilai ujian sekolah (USBK) secara umum semuanya berpengaruh positif, yaitu
semakin tinggi nilai USBK semakin tinggi nilai UNBK-nya.
Tabel 4 Estimasi Selang Kepercayaan 95% Parameter Model
Estimator Batas Batas
Parameter Var (ˆ) Z-value Sig.
( ˆ ) bawah Atas
0 (1) -0,097 0,104 -0,934 -0,301 0,107 Tidak Signifikan
1
(1)
0,192 0,246 0,779 -0,292 0,676 Tidak Signifikan
Untuk melihat kesesuaian model, selanjutnya dilakukan uji asumsi error model yaitu:
a. Pengujian Normal Multivariat Error
Asumsi yang harus dipenuhi dalam model regresi semiparametrik multirespon adalah
dari error berdistribusi normal multivariat. Pengujian dilakukan dengan hipotesis:
Hipotesis H0 : data berdistribusi normal multivariat
H1 : data tidak berdistribusi normal multivariat
e 2 1 e
2 1( 2 )
HZ 2 2
m i 1 j 1 i 1
i 1, 2,3,..., p; j 1, 2,3,..., m
Kriteria Berdasarkan Svantesson dan Wallace (2010) nilai statistik uji HZ >
p-value maka H0 diterima yaitu data berdistribusi normal
multivariat. Package MVTests di OSS-R dan function mvn
digunakan untuk memperoleh nilai p-value=0,9130649 > 0,05, maka
dapat disimpulkan error berdistribusi normal multivariat.
b. Uji Mean dari Error
Setelah uji normalitas multivariat terpenuhi selanjutnya adalah asumsi mean dari
error yaitu nol dengan hipotesis sebagai berikut:
Hipotesis H 0 : ( r ) 0 r 1, 2,3, 4
H1 : ( r ) 0 r 1, 2,3, 4
Statistik uji 𝑋̅−𝜇0
𝑡=
𝑠/√𝑛
Kriteria H0 ditolak jika nilai p-value < 0,05. Berdasarkan hasil pengujian
mean error untuk masing-masing respon diperoleh nilai p-value
masing-masing sebesar 0,9844; 0,9796; 0,9872 dan 0,9832. Dengan
nilai p-value yang semuanya > 0,05 maka keputusan H0 diterima
sehingga diperoleh kesimpulan bahwa asumsi mean error sama
dengan nol terpenuhi.
5. KESIMPULAN
Berdasarkan hasil estimasi selang kepercayaan 95% parameter model regresi
semiparametrik multirespon berdasarkan estimator truncated spline pada nilai UNBK di
Provinsi NTB diperoleh rentang dari nilai negatif sampai nilai positif yang memuat nilai
yang memuat nol sehingga disimpulkan bahwa jenis kelamin dan lama pendidikan orang
tua tidak berpengaruh signifikan terhadap nilai UNBK. Hal ini berarti bahwa baik murid
laki-laki maupun murid perempuan mempunyai kesempatan yang sama untuk memperoleh
nilai UNBK untuk semua mata pelajaran dan tidak terpengaruh dengan lama pendidikan
orang tuanya. Secara umum variabel nilai rapor dan nilai ujian sekolah berada pada rentang
batas bawah dan batas atas positif sehingga disimpulkan semakin besar nilai rapor dan
ujian sekolah semakin besar pula nilai UNBK yang bersesuaian dengan mata pelajarannya.
Hal ini berarti kalau seorang murid bagus dalam pembelajaran sehari-hari yang tercermin
dalam nilai rapor dan nilai ujian sekolah maka nilai UNBK-nya juga akan bagus.
DAFTAR PUSTAKA
Arikunto, S. 2001. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi. Aksara
Budiantara, I. N. 2009. Spline dalam Regresi Nonparametrik dan Semiparametrik, sebuah
Pemodelan Statistika Masa Kini dan Masa Mendatang. Pidato Pengukuhan Untuk
Jabatan Guru Besar dalam Bidang Ilmu: Matematika Statistika dan Probabilitas,
Jurusan Statistika FMIPA ITS, Surabaya
Chamidah, N. dan Rifada, M. 2016. Local Linier Estimator In Bi-Reaponse
Semiparametric Regression Model For Estimating Median Growth Charts of