Feedback

Kovariat Dari Fungsional Prinsipal Komponen Analisis Untuk Data Longitudinal

Informasi dokumen
KOVARIAT DARI FUNGSIONAL PRINSIPAL KOMPONEN ANALISIS UNTUK DATA LONGITUDINAL TESIS Oleh AGUSMAN 097021053/MT FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2011 Universitas Sumatera Utara KOVARIAT DARI FUNGSIONAL PRINSIPAL KOMPONEN ANALISIS UNTUK DATA LONGITUDINAL TESIS Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Magister Sains dalam Program Studi Magister Matematika pada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara Oleh AGUSMAN 097021053/MT FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2011 Universitas Sumatera Utara Judul Tesis : KOVARIAT DARI FUNGSIONAL PRINSIPAL KOMPONEN ANALISIS UNTUK DATA LONGITUDINAL Nama Mahasiswa : Agusman Nomor Pokok : 097021053 Program Studi : Matematika Menyetujui, Komisi Pembimbing (Dr. Sutarman, M.Sc) Ketua (Prof. Dr. Herman Mawengkang) Anggota Ketua Program Studi, Dekan (Prof. Dr. Herman Mawengkang) (Dr. Sutarman, M.Sc) Tanggal lulus: 15 Juni 2011 Universitas Sumatera Utara Telah diuji pada Tanggal 15 Juni 2011 PANITIA PENGUJI TESIS Ketua : Dr. Sutarman, M.Sc Anggota : 1. Prof. Dr. Herman Mawengkang 2. Prof. Dr. Tulus, M.Si 3. Drs. Open Darnius, M.Sc Universitas Sumatera Utara ABSTRAK Analisa komponen utama multivariat klasik diperluas untuk data fungsional dan disebut dengan istilah fungsional prinsipal komponen analisis (FPCA). Sebagian besar pendekatan FPCA yang ada tidak mengakomodir informasi kovariat, dan tujuan dari tulisan ini adalah untuk mengembangkan dua metode yang mengakomodir informasi tersebut. Dengan pendekatan ini, baik fungsi mean maupun fungsi kovariansi tergantung pada kovariat Z dan skala waktu t sementara dengan pendekatan kedua hanya fungsi mean yang tergantung pada kovariat Z. Kedua pendekatan baru mengakomodir kesalahan pengukuran tambahan dan data fungsional sampelnya diambil pada kisi waktu yang teratur dan juga data longitudinal yang jarang diambil sampelnya pada kisi waktu yang tidak teratur. Pendekatan pertama untuk menyesuaikan sepenuhnya baik fungsi mean maupun fungsi kovariansi beradaptasi lebih besar terhadap data tetapi lebih intensif perhitungan daripada pendekatan untuk menyesuaikan efek kovariat hanya pada fungsi mean. Di kembangkan teori asymptot umum untuk kedua pendekatan dan dibandingkan kinerja keduanya secara numerik melalui studi simulasi dan suatu kumpulan data. Kata kunci : Estimasi, Seleksi Bandwidth dan jumlah eigen fungsi, Hasil-hasil asimtot i Universitas Sumatera Utara ABSTRACT Classical multivariate principal component analysis has been extended to functional data and termed functional principal componentanalysis (FPCA). Most existing FPCA approaches do not accommodate covariate information, and it is the goal of this paper to develop two methods that do. In the ?rst approach, both the mean and covariance functions depend on the covariate Z and time scale t while in the second approach only the mean function depends on the covariate Z .Both new approaches accommodate additional measurement errors and functional data sampled at regular time grids as well as sparse longitudinal data sampled at irregular time grids. The first approach to fully adjust both the mean and covariance functions adapts more to the data but is computationally more intensive than the approach to adjust the covariate effects on the mean function only. We develop general asymptotic theory for both approaches and compare their performance numerically through simulation studies and a data set. Keywords : Estimation, Bandwidth selection and number of eigenfunctions, Asymtotic results ii Universitas Sumatera Utara KATA PENGANTAR Puji syukur penulis ucapkan kepada Sang Maha Pencipta,Allah SWT yang telah memberikan begitu banyak nikmat sehingga tesis ini dapat terselesaikan dengan baik. Dalam menyelesaikan pendidikan di Sekolah Pasca Sarjana USU ini penulis banyak mendapat dukungan dari berbagai pihak, maka pada kesempatan ini penulis mengucapakan terimakasih dan penghargaan yang sebesar-besarnya kepada: Dr. Sutarman, MSc, selaku Dekan F.MIPA dan selaku Dosen Pembimbing I yang telah memberikan bimbingan dan petunjuk sehingga tesis ini dapat terselesaikan dengan baik. Prof. Dr. Herman Mawengkang, selaku Ketua Program Studi Magister Matematika FMIPA USU dan selaku Dosen Pembimbing II yang banyak memberikan banyak bimbingan dan motivasi kepada penulis sehingga pendidikan ini dapat terselesaikan dengan baik. Seluruh Dosen pada Program Studi Magister Matematika FMIPA USU, yang telah memberikan ilmu pengetahuan kepada penulis selama perkuliahan hingga selesai. Drs. Lukman Hakim, MPd, selaku Kepala Sekolah SMA Swasta Al-Ulum Medan yang telah memberikan kesempatan kepada penulis untuk mengikuti Program Studi Magister Matematika di Program Studi Magister Matematika FMIPA USU ini. Dr. Hasratudin, MPd, selaku Bapak angkat saya dan selaku Dosen MIPA Unimed Medan yang telah memberikan dukungan dan motivasi kepada penulis untuk mengikuti Program Studi Magister Matematika di FMIPA USU ini. Secara khusus penulis menyampaikan terima kasih yang tak terhingga kepada Ayahanda tercinta yaitu Jakiman dan Ibunda tercinta Sanis yang doa-doanya selalu menyertai penulis. Kepada Papa Dr. Irwan Fahri Rangkuti,SpKK yang selalu menjadi motivator penulis dan selalu membantu moril dan materil yang tak terhingga selama perkuliahan dan sampai tesis ini dapat terselesaikan. iii Universitas Sumatera Utara Kepada semua pihak yang telah turut membantu baik langsung maupun tidak langsung yang penulis dapatkan selama ini. Semoga tesis ini bermanfaat bagi pembaca dan pihak-pihak yang membutuhkannya. Medan, 15 Juni 2011 Penulis, Agusman iv Universitas Sumatera Utara RIWAYAT HIDUP Agusman dilahirkan di Tanjung Morawa Kabupaten Deli Serdang pada tanggal 17 Oktober 1982 dan merupakan anak ke sembilan dari sembilan bersaudara dari ayah Jakiman dan Ibu Sanis. Menamatkan Sekolah Dasar di SD Negeri No. 106179 Desa Limau Manis Kecamatan Tanjung Morawa Kabupaten Deli Serdang pada tahun 1994, Sekolah Lanjutan Tingkat Pertama pada SLTP Negeri 2 Tanjung Morawa Deli Serdang pada tahun 1997, Sekolah menengah Umum pada SMU Swasta Dwitunggal Tanjung Morawa Deli Serdang pada tahun 2000. Pada tahun 2000 memasuki Perguruan Tinggi pada Universitas Muslim Nusantara ( UMN ) Al Washliyah Medan dan memperoleh gelar Sarjana Pendidikan pada tahun 2006. Pada tahun 2009 mengikuti Program Studi Magister Matematika di Sekolah Pascasarjana Universitas Sumatera Utara. v Universitas Sumatera Utara DAFTAR ISI Halaman ABSTRAK i ABSTRACT ii KATA PENGANTAR iii RIWAYAT HIDUP v DAFTAR ISI vi DAFTAR TABEL viii DAFTAR GAMBAR ix BAB 1 PENDAHULUAN 1 1.1 Latar Belakang 1 1.2 Rumusan Masalah 2 1.3 Tujuan Penelitian 2 1.4 Manfaat Penelitian 2 1.5 Metodologi 3 BAB 2 BEBERAPA KAJIAN TENTANG FUNGSIONAL PRINSIPAL KOMPONEN ANALISIS 4 BAB 3 PENGERTIAN TEORITIS FPCA 7 3.1 Estimasi 9 3.1.1 fFPCA 10 3.1.2 mFPCA 13 3.1.3 Seleksi Bandwidth dan Jumlah Eigenfungsi 14 vi Universitas Sumatera Utara 3.2 Hasil-hasil Asymtot untuk Fungsi Mean dan Fungsi Kovarian 15 BAB 4 PENERAPAN KOVARIAT PADA FUNGSIONAL PRINSIPAL KOMPONEN ANALISIS 19 4.1 Aplikasi Data 23 BAB 5 KESIMPULAN DAN SARAN 27 5.1 Kesimpulan 27 5.2 Saran 27 DAFTAR PUSTAKA 28 vii Universitas Sumatera Utara DAFTAR TABEL Nomor Judul Halaman 4.1 Hasil Simulasi fFPCA 21 4.2 Rata-rata MISE dan MSFE dalam 100simulasi berjalan untuk tiga 22 4.3 MSFEs dari mFPCA, fFPCA, uFPCA dan rFPCA berdasarkan data 24 viii Universitas Sumatera Utara DAFTAR GAMBAR Nomor Judul Halaman 4.1 Dua eigenfunctions kovariansi dan estimasi dengan. mFPCA 21 4.2 Dari dua eigenfunctions pertama diperkirakan melalui fFPCA pada lima nilai yang berbeda dari covarite tersebut 22 4.3 Estimasi rata-rata permukaan untuk data jarang dan lengkap 25 4.4 Estimasi kovarians permukaan mFPCA untuk jarang dan 26 ix Universitas Sumatera Utara ABSTRAK Analisa komponen utama multivariat klasik diperluas untuk data fungsional dan disebut dengan istilah fungsional prinsipal komponen analisis (FPCA). Sebagian besar pendekatan FPCA yang ada tidak mengakomodir informasi kovariat, dan tujuan dari tulisan ini adalah untuk mengembangkan dua metode yang mengakomodir informasi tersebut. Dengan pendekatan ini, baik fungsi mean maupun fungsi kovariansi tergantung pada kovariat Z dan skala waktu t sementara dengan pendekatan kedua hanya fungsi mean yang tergantung pada kovariat Z. Kedua pendekatan baru mengakomodir kesalahan pengukuran tambahan dan data fungsional sampelnya diambil pada kisi waktu yang teratur dan juga data longitudinal yang jarang diambil sampelnya pada kisi waktu yang tidak teratur. Pendekatan pertama untuk menyesuaikan sepenuhnya baik fungsi mean maupun fungsi kovariansi beradaptasi lebih besar terhadap data tetapi lebih intensif perhitungan daripada pendekatan untuk menyesuaikan efek kovariat hanya pada fungsi mean. Di kembangkan teori asymptot umum untuk kedua pendekatan dan dibandingkan kinerja keduanya secara numerik melalui studi simulasi dan suatu kumpulan data. Kata kunci : Estimasi, Seleksi Bandwidth dan jumlah eigen fungsi, Hasil-hasil asimtot i Universitas Sumatera Utara ABSTRACT Classical multivariate principal component analysis has been extended to functional data and termed functional principal componentanalysis (FPCA). Most existing FPCA approaches do not accommodate covariate information, and it is the goal of this paper to develop two methods that do. In the ?rst approach, both the mean and covariance functions depend on the covariate Z and time scale t while in the second approach only the mean function depends on the covariate Z .Both new approaches accommodate additional measurement errors and functional data sampled at regular time grids as well as sparse longitudinal data sampled at irregular time grids. The first approach to fully adjust both the mean and covariance functions adapts more to the data but is computationally more intensive than the approach to adjust the covariate effects on the mean function only. We develop general asymptotic theory for both approaches and compare their performance numerically through simulation studies and a data set. Keywords : Estimation, Bandwidth selection and number of eigenfunctions, Asymtotic results ii Universitas Sumatera Utara BAB 1 PENDAHULUAN 1.1 Latar Belakang Dalam beberapa penelitian tentang Fungsional Prinsipal Component Analisis (FPCA) tidak banyak yang melibatkan informasi kovariat. Kovariat yang digunakan dalam FPCA dengan asumsi bahwa fungsi keseluruhan dari fungsi acak bisa diamati tanpa kesalahan, kovariat digunakan untuk memprediksi status dari satu atau lebih variabel terikatnya. Ada dua cara untuk memperluas pendekatan FPCA untuk mengakomodir informasi kovariat. Kedua pendekatan terdiri dari dua bagian: bagian sistematik yang bersesuaian dengan fungsi mean (mFPCA) dan bagian stokastik yang terdiri dari komponen-komponen acak yang mencerminkan struktur kovariansi data longitudinal (fFPCA). Fungsional prinsipal komponen analisis (FPCA) merupakan alat pengurangan dimensi standar untuk data multivariat dan diperluas untuk data fungsional yang diberikan dalam bentuk kurva acak. Karena data fungsional pada hakekatnya berdimensi tak hingga, pengurangan dimensi penting untuk menganalisa data demikian. Selain Ferraty dan Vieu (2006) dan Wu dan Zhang (2006), rangkaian tulisan Ramsay dan Silverman (2002, 2005) memberikan kajian khusus tentang metodologi dan aplikasi ”Analisa Data Fungsional” (FDA). Kneip dan Utikal (2001) menggunakan metode FDA untuk menilai variabilitas kepadatan bagi kumpulan-kumpulan data dari populasi yang berbeda-beda. Apabila data fungsional diamati pada beberapa titik waktu, misalnya hanya beberapa titik waktu per subjek, maka data demikian ini disebut data longitudinal kartena timbul dari kajian longitudinal. Rice (2004) dan Hall et al. (2006) membahas persamaan dan perbedaan intrinsik antara FDA dan analisa data longitudinal. Data longitudinal seringkali jarang (sparse) dengan sedikit pengukuran persubjek dan gangguan dengan kesalahan pengukuran (atau fluktuasi acak). Akan tetapi, kesulitan ini bisa diatasi dalam sebagian besar situasi, karenanya tetap 1 Universitas Sumatera Utara 2 dimungkinkan melaksanakan FPCA. [lihat; Shi et al (1996), Yao et al (2005), Paul dan Peng (2009), serta Peng dan Paul (2009)]. Mengingat pentingnya metode ini maka penulis ingin meneliti dan menjabarkannya pada ” Kovariat Dari Fungsional Prinsipal Komponen Analisis Untuk Data Longitudinal ”. 1.2 Rumusan Masalah Asumsi kunci yang diajukan para peneliti dalam menyelesaikan FPCA adalah bahwa trajektori data fungsional lengkap teramati atau tercatat padat terhadap waktu, Asumsi demikian ini jarang terpenuhi dalam kajian data longitudinal oleh karena itu masalahnya adalah bagaimana mengikutsertakan informasi kovariat dalam FPCA untuk data longitudinal jarang. 1.3 Tujuan Penelitian Tujuan dari penelitian ini adalah untuk Memadukan informasi kovariat yang berlaku pada data fungsional dan data longitudinal dengan mengembangkan dua pendekatan yang mengakomodir informasi tersebut yaitu pendekatan fFPCA dan mFPCA. 1.4 Manfaat Penelitian Manfaat dalam Penelitian ini adalah 1. Sebagai bahan informasi bagi peneliti dalam menyesuaikan efek kovariat untuk data longitudinal. 2. Untuk menambah wawasan dan literatur dalam berbagai bidang, dalam bidang matematika secara umum, bidang Tekhnik, dan kesehatan. 3. Sebagai bahan pertimbangan dan masukan bagi peneliti yang berkaitan. Universitas Sumatera Utara 3 1.5 Metodologi Adapun langkah-langkah yang dilakukan pada penelitian ini adalah: 1. Mengestimasi fungsi mean dan fungsi kovarian. 2. Memilih jumlah eigen fungsi. 3. Menentukan asymtot untuk fungsi mean dan fungsi kovarian. 4. Menyesuaikan efek kovariat dengan pendekatan FPCA. Universitas Sumatera Utara BAB 2 BEBERAPA KAJIAN TENTANG FUNGSIONAL PRINSIPAL KOMPONEN ANALISIS Banyak penelitian ilmiah menghasilkan data longitudinal dengan pengukuran ulang dijumlah titik waktu, dan data peristiwa yang mempertimbangkan perubahan dari waktu ke peristiwa, yaitu, ” kegagalan ” atau ” bertahan hidup ”, serta informasi kovariat tambahan.Sebuah contoh adalah bahwa uji klinis HIV, di mana biomarker seperti jumlah limfosit CD4 diukur sesekali waktu dan untuk pengembangan menjadi AIDS atau kematian juga dicatat, dengan kemungkinan awal DO atau kegagalan. Hal ini penting dan diperlukan untuk menyelidiki pola perubahan CD4, dan untuk menandai hubungan antara CD4 dan waktu untuk pengembangan atau kematian (Pawitan dan Self (1993), Tsiatis et al. (1995), Wulfsohn dan Tsiatis (1997). Dalam prakteknya proses longitudinal yang tersembunyi sering tidak teramati karena kesalahan pengukuran dan tidak tersedia pada saat diperlukan, terutama bila terjadi kegagalan. Diketahui bahwa sebagian kemungkinan pendekatan konvensional yang digunakan untuk model Cox tidak dapat menghindari kesimpulan yang memihak dari proses tersembunyi longitudinal, seperti nilai terakhir dilakukan ke depan metode (Prentice (1982)), teknik pemulusan (Raboud et al. (1993)), atau pendekatan ” dua tahap ” (Bycott dan Taylor (1998), Tsiatis et al. (1995)). Ini disebut perhitungan longitudinal dan proses secara bersamaan, yaitu, ” yang disebut ” pemodelan bersama. Pendekatan standar pemodelan bersama adalah karakterisasi proses longitudinal dengan model efek parametric acak yang berfokus pada kelancaran perkembangan yang ditentukan oleh sejumlah kecil efek acak dan yang telah digunakan untuk menggambarkan lintasan CD4 (Tsiatis et al. (1995), Wulfsohn dan Tsiatis (1997), Bycott dan Taylor (1998), Dafni dan Tsiatis (1998)) Selain perbaikan penyimpangan, pemodelan bersama juga berpotensi meningkatkan efisiensi estimasi parameter karena inferensi simultan pada kedua model longitudinal dan model survival, lihat Faucett dan Thomas (1996); Slasor dan Laird (2003), Hsieh et al. (2006) untuk diskusi lebih lanjut tentang masalah ini. 4 Universitas Sumatera Utara 5 Meskipun model parametrik yang disebutkan di atas menemukan fitur-fitur dalam data yang sudah tergabung secara apriori dalam model, model ini mungkin tidak cukup jika program waktu tidak didefinisikan dengan baik dan tidak masuk ke dalam bagian yang terbentuk sebelumnya dari fungsi. Dalam situasi analisis melalui metode nonparametric. Telah ada peningkatan kepentingan analisis nonparametrik data yang berupa sampel untuk kurva atau lintasan, yaitu, ” analisis data fungsional”, lihat Ramsay dan Silverman (1997) untuk ringkasan. Fungsional Analisis komponen utama (FPCA) mencoba untuk menemukan modus dominan variasi sekitar fungsi secara keseluruhan, dan dengan demikian merupakan kunci dalam teknik analisis data fungsional (Berkey dan Kent (1983); Besse dan Ramsay (1986), Castro et al. (1986), Rice dan Silverman (1991); Silverman (1996), James et al. (2000), Yao et al. (2003, 2005); Yao dan Lee (2006). Sebaliknya, model berkaitan erat yang diajukan oleh Rice dan Wu (2000) tidak memperhatikan dimensi pengurangan dan mungkin tidak berlaku jika data jarang, lihat James et al. (2000) untuk perbandingan dari dua pendekatan. Hal ini membuat perbedaan antara yang diusulkan model dan yang dalam Brown et al. (2005 ) eksplisit. Keuntungan lain dari model gabungan dengan FPCs adalah efisiensi perhitungan dicapai dengan pengurangan dimensi menggunakan FPCs dengan matriks kovarians diagonal, sementara model bersama dalam Brown et al. (2005) dengan B-splines biasanya berisi koefisien yang lebih acak dengan kovarian matriks terstruktur. Interpretasi yang tepat dari eigenfunctions orthogonal dan nilai FPC sering menyediakan lebih wawasan dari model B-spline. Wang dan Taylor (2001) mendirikan sebuah proses stokastik Integrated Ornstein Uhlenbeck (IOU) untuk model yang tidak ditentukan arah lintasan longitudinal dalam konteks model bersama, dalam semangat yang sama dengan lintasan splines. Secara khusus, atau bersifat variabel. Dari nilainya, dikenal dua golongan data kuantitatif ialah data dengan variabel diskrit atau data diskrit dan data dengan variabel kontinu atau singkatnya data kontinu. Hasil menghitung atau membilang merupakan data diskrit sedangkan hasil pengukuran merupakan data kontinu. Data yang dikategorikan menurut lukisan kualitas objek yang dipelajari merupakan data kualitatif. Data longitudinal merupakan data yang berbentuk pengukuran yang berulang (repated measurement) pada unit eksperimen yang sama dalam periode waktu tertentu. Adapun karakteristik data longitudinal adalah individu (subjek, unit sampel) diamati dalam suatu periode waktu tertentu lebih dari satu kali atau pengukuran berulang pada suatu individu (subjek, unit sampel). Untuk tujuan eksploratori data longitudinal, sebaiknya tampilkan data mentah sebanyak mungkin bukan hanya meringkas, kemudian identifikasilah baik pada pola cros-sectional maupun longitudinal dan identifikasi individu atau observasi yang tidak biasa (outliers). Hal ini akan mempermudah dalam melihat dengan lebih jelas seperti apa keberadaan data yang sedang dihadapi dan dapat menggunakan metode yang tepat dalam penganalisisannya. Sehingga hasilnya dapat diperoleh dengan tepat dan sesuai dengan apa yang diharapkan. Sangat baik menggunakan notasi tertentu untuk menggambarkan data dan pokok persoalan yang penting. Data-data yang telah dianalisis polanya kemudian dapat diselesaikan secara matematis. Dengan pengukuran berulang, observasi data yang cukup rumit dalam beberapa observasi dari hasil yang diambil pada tiap unit eksperimen bersama-sama sehingga hubungan yang rumit pada akhirnya memungkinkan untuk diringkas. Notasi-notasi yang sering digunakan dalam data longitudinal adalah i untuk menyatakan individu (i = 1,2, N), observasi yang dilakukan pada individu i dilambangkan dengan k (k = 1,2, n), total observasi i, waktu observasi aktual adalah tik. Variabel respon untuk variabel Universitas Sumatera Utara randomnya dinotasikan dengan Yik, Yi = (Yi1,.Yin), Y = (Y1, ,Ym) dan untuk respon observasi dinotasikan dengan yik,y = ( yi1, yin), y = (y1, ,ym). variabel penjelas dinotasikan dengan xik = (xik1, ,xikp)t, vektor berukuran p x 1 dan Xi = (xi1, ,xin), matriks berukuran ni x p. Anggap Yik = hasil pengukuran (observasi) ke-k pada unit eksperimen (individu) ke-i. Untuk meringkas waktu terjadinya dapat dinotasikan tik sebagai suatu waktu dimana pengukuran ke-k unit eksperimen i telah terjadi. Jika pengukuran berulang dilakukan pada unit eksperimen yang sama, maka untuk unit eksperimen i jika dilakukan 5 kali pengukuran dapat diperoleh respon observasi dari unit eksperimen tersebut seperti yang dinotasikan dalam bentuk vektor berikut : Hal penting yang dapat dilihat dalam hal ini adalah bahwa memungkinkan untuk menggambarkan hasil untuk subjek i secara keseluruhan sebagai vektor, dengan demikian dapat dilihat seluruh hasil observasinya dengan tepat dan efisien. Dapat dilihat juga bahwa tiap subjek dapat memiliki vektor respon tersendiri. Hal ini penting untuk dapat memikirkan bahwa data tidak hanya sebagai respon individu untuk satu subjek, tetapi dapat digabungkan respon subjek yang saling berhubungan dalam seluruh vektor respon. Ini juga menunjukkan bahwa akan sangat baik menggunakan notasi matriks untuk meringkaskan data longitudinal. 2.3. Matriks 2.3.1. Pengertian dan Jenis-Jenis Matriks Matriks dinotasikan dengan huruf kapital. Defenisi matriks itu sendiri adalah kumpulan elemen-elemen atau susunan bilangan real yang disusun menurut baris dan Universitas Sumatera Utara kolom sehingga berbentuk empat persegi panjang, dimana panjangnya dan lebarnya ditunjukkan oleh banyaknya kolom-kolom dan baris-baris, dan dibatasi oleh tanda [ ], ( ). Apabila suatu matriks A yang merupakan susunan bilangan real yang terdiri dari m baris dan n kolom, maka matriks A secara umum dapat ditulis sebagai berikut : atau disingkat dengan (aij), i = 1, 2, , m dan j = 1, 2, , n Contoh : Suatu matriks A yang terdiri dari m baris = 2 dan n kolom =3, dimana : a11 = 4, a12 = 2, a13 = 5 a21 = 3, a22 = 1, a23 = 3 Sehingga matriks A dapat ditulis sebagai berikut : A2x3 = Beberapa jenis-jenis matriks adalah sebagai berikut : 1. Matriks bujur sangkar (square matrix) Matriks bujur sangkar adalah suatu matriks dimana banyaknya m baris sama dengan banyaknya n kolom atau m = n, dan nilai dari m atau n menunjukkan ordo dari matriks tersebut. Universitas Sumatera Utara Dapat ditulis A= 2. Matriks Segitiga Atas dan Segitiga Bawah Suatu matriks A yang mempunyai elemen aij = 0 untuk i > j disebut matriks segitiga atas dan bila aij = 0 untuk i < j disebut matriks segitiga bawah, jadi : Matriks Segitiga Atas Matriks Segitiga Bawah 3. Matriks diagonal, Skalar, dan Satuan Matriks diagonal adalah suatu matriks dimana semua elemen-elemen di luar diagonal utama mempunyai nilai 0 dan paling sedikit satu elemen pada diagonal utama 0. Jadi jika matriks A = (aij) dimana i = j =1, 2, , n sehingga D = (dij), i = j = 1, 2, , n Dij = 0, untuk i . Maka matriks A disebut matriks diagonal dan biasanya diberi symbol D, dimana n menunjukkan ordo dari matriks tersebut, sehingga secara umum matriks diagonal dapat dituliskan sebagai berikut : Universitas Sumatera Utara Matriks D merupakan suatu matriks diagonal, selain itu matriks identitas juga merupakan suatu matriks diagonal. Bila pada matriks diagonal D terdapat aii = k (k adalah skalar untuk i = 1, 2, , n), maka disebut matriks skalar dan jika k = 1 disebut matriks satuan yang disingkat dengan In atau I saja, jadi Matriks Skalar Matriks Satuan 4. Matriks simetris Matriks simetris adalah suatu matriks bujur sangkar dimana banyaknya m baris sama dengan banyaknya n kolom atau m = n menunjukkan ordo dari matriks tersebut. Apabila matriks A = (aij), i = 1, 2, , n dan dimana aij = aji untuk semua nilai i dan j, maka matriks A disebut matriks simetris (symmetry matrix). Contoh : Suatu matriks simetris dari matriks A berordo 3, dengan aij = aji a12 = a21 = 2 a13 = a31 = 3 a23 = a32 = 4 Universitas Sumatera Utara maka : A3x3 = 5. Transpose matriks Transpose suatu matriks A(mxn) adalah suatu matriks yang mana elemen-elemen nya diperoleh dari elemen-elemen matriks A(mxn) dengan syarat bahwa baris-baris dan kolom-kolom matriks menjadi kolom-kolom dan baris-baris dari matriks yang baru, dengan kata lain baris ke-i dari matriks A(mxn) menjadi kolom ke-i dari matriks baru. Biasanya transpose matriks A(mxn) dinotasikan dengan At atau . Misalkan : Suatu transpose matriks dari matriks A berordo 3, A3x3 = Sehingga At = = Contoh : Suatu transpose matriks dari matriks A berordo 3, A3x3 = Sehingga At = = Universitas Sumatera Utara 2.3.2. Operasi dan Sifat Matriks a. Operasi penjumlahan dan Pengurangan matriks Beberapa bentuk matriks dapat dijumlahkan dan dikurangkan, bila matriks tersebut memiliki ordo yang sama. Pada operasi penjumlahan dan pengurangan suatu matriks, operasi dilakukan dengan menjumlahkan atau mengurangkan elemen-elemen pada entri yang bersesuaian. 1. Penjumlahan Matriks Dalam penjumlahan matriks elemen-elemen pada entri yang bersesuaian atau elemen yang seletak dijumlahkan Misalkan : A= , B= maka, A + B 2. Pengurangan Matriks Begitu pula pada pengurangan matriks, operasi pengurangan dilakukan pada elemenelemen yang seletak atau pada entri yang bersesuaian Misalkan : A= , B= maka, A B Universitas Sumatera Utara b. Operasi Perkalian matriks Apabila Amxn = (aij) yaitu matriks dengan m baris dan n kolom, Bnxp = (bij) matriks dengan n baris dan p kolom, maka perkalian matriks AxB = Cmxp, yaitu matriks dengan m baris dan n kolom, dimana elemen C pada baris ke-i dan kolom ke-j diperoleh dengan rumusan : Cij = ai1bi1 + + ainbnj Atau Cij = Misalkan : , dengan : i = 1, 2, , m j = 1, 2, , p A= ,B= A2x3xB3x3 = C2x3 C= C11 = (elemen-elemen baris pertama A) dikali (elemen-elemen kolom pertama B) kemudian dijumlahkan dan seterusnya. C11 = a11b11 + a21b21 + a13b13 = C12 = a11b12 + a12b22 + a13b32 = C13 = a11b13 + a12b23 + a13b31 = C21 = a21b11 + a22b21 + a23b31 = C22 = a21b12 + a22b22 + a23b32 = C23 = a21b13 + a22b23 + a23b33 = Sehingga : C= Universitas Sumatera Utara c. Sifat Matriks 1. Determinan Matriks Untuk setiap matriks persegi terdapat suatu bilangan tertentu yang disebut determinan. Pengertian determinan matriks adalah jumlah semua hasil perkalian elementer yang bertanda dari A dan dinyatakan dengan det (A). Yang dimaksud dengan perkalian elementer yang bertanda dari matriks A adalah sebuah hasil perkalian elementer pada suatu kolom dengan +1 atau -1. Untuk lebih jelasnya diuraikan sebagai berikut : Jika matriks , maka det (A) = |A| = 2. Adjoin Matriks Adjoin matriks A adalah transpose dari kofaktor-kofaktor matriks tersebut. Dilambangkan dengan Adj A = (kij)t. , maka Adj A = 3. Invers Matriks bahwa terdapat multikolinieritas. Universitas Sumatera Utara 53 3.3.3 Analisis Dengan Regresi Komponen Utama Setelah dideteksi bahwa data gas mileage pada tabel (3.1) mengalami masalah multikolinieritas pada variabel bebasnya maka data tersebut akan dianalisis menggunakan analisis regresi komponen utama. Karena skala pengukuran dari setiap variabel yang diamati tidak sama, maka variabel tersebut ditransformasikan ke dalam variabel baku Z (persamaan 2.40). Kemudian akan dianalisis dengan analisis Komponen utama yang ditentukan berdasarkan pada matriks korelasi. Correlation Matrix Z1 Correlation Z1 Z2 Z3 Z4 Z5 Z6 1.000 Z2 .944 1.000 Z3 .872 .862 1.000 Z4 .914 .945 .905 1.000 Z5 -.243 -.219 -.321 -.060 1.000 Z6 .826 .750 .710 .632 -.460 1.000 (lampiran B) Untuk menegetahui variabel komponen utama berdasarkan matriks korelasi, terlebih dahulu dihitung nilai eigen dan vektor eigen yang bersesuaian, dengan menggunakan persamaan (2.5) dan (2.46) maka diperoleh nilai eigen, serta proporsi total variansinya seperti pada tabel berikut. Universitas Sumatera Utara 54 Tabel 3.5 Nilai Eigen, Proporsi Total Variansi dan Proporsi Variansi Kumulatif Komponen Nilai eigen Proporsi total Proporsi variansi variansi (%) kumulatif (%) 1 4.452 74.194 74.194 2 1.049 17.490 91.683 3 0.313 5.212 96.896 4 0.127 2.113 99.008 5 0.044 0.740 99.748 6 0.015 0.252 100 (perhitungan pada lampiran C) Berdasarkan kriteria pemilihan komponen utama maka komponen yang terpilih adalah komponen utama pertama dan kedua karena memiliki nilai eigen lebih besar dari 1 serta proporsi keragaman oleh kedua komponen utama tersebut telah mampu menjelaskan 91.683 % keragaman dari variabel asal. Setelah nilai eigen diketahui maka dengan menggunakan persamaan (2.6) dapat dihitung nilai vektor eigen yang bersesuaian dengan nilai eigen, dimana vektor eigen merupakan koefisien komponen utama. Hasil perhitungan diperoleh seperti pada tabel berikut. Tabel 3.6 Koefisien Komponen Utama (Vektor Eigen) Variabel Komponen Utama 0.219 0.086 0.216 0.137 0.210 0.030 0.208 0.306 -0.078 0.873 0.191 -0.265 (perhitungan pada lampiran C) Universitas Sumatera Utara 55 Berdasarkan persamaan (3.2) maka persamaan komponen utama adalah : (3.9) Untuk meregresikan komponen utama dengan variabel bebas, maka dihitung skor komponen dari setiap pengamatan. Untuk komponen utama yang diturunkan dari matriks korelasi , berdasarkan persamaan (2.42) maka didapatkan skor komponen utama dari unit pengamatan ke-i seperti pada tabel berikut : Tabel 3.7 Skor Faktor Komponen Utama No Skor Faktor_ Skor Faktor_ Y 1 1.70228 0.60753 16.9 2 1.54272 0.09749 15.5 3 1.03797 0.18401 19.2 4 1.66528 -0.71909 18.5 5 -1.24829 0.48353 30.0 6 -0.70264 -0.65481 27.5 7 -0.82532 -0.48318 27.2 8 -1.04513 -0.68118 30.9 9 -0.52515 0.55179 20.3 10 0.07596 -0.58698 17.0 11 -0.58464 0.36170 21.6 12 0.10044 0.87574 16.2 13 0.02682 0.93247 20.6 14 -0.34701 1.27640 20.8 15 -0.03371 2.79528 18.6 16 0.25797 0.57765 18.1 17 1.21520 0.59110 17.0 18 1.27463 -0.67969 17.6 19 1.54104 -0.61835 16.5 20 1.29402 0.49045 18.2 Universitas Sumatera Utara 56 21 -0.74830 -0.52154 26.5 22 0.12599 0.59012 21.9 23 -1.28319 -0.40562 34.1 24 -1.10843 -0.88249 35.1 25 -0.86508 -0.15788 27.4 26 -1.20717 -0.57010 31.5 27 -1.25958 0.53568 29.5 28 -0.76794 0.50634 28.4 29 0.37355 -2.75705 28.8 30 0.31772 -1.73932 26.8 (perhitungan pada lampiran C) Skor komponen utama tersebut kemudian diregresikan dengan variabel bebas Y dengan metode kuadrat terkecil. Adapun model regresi komponen utama dengan dua komponen adalah : (perhitungan pada lampiran E) dengan : ̂ (3.10) ̅ Tabel 3.8 Uji Signifikansi Koefisien Regresi Komponen Utama Komponen Koefisien SE. Koefisien T- Hitung Utama Regresi Konstanta 23.273 0.488 47.730 -4.834 0.496 -9.747 1 -2.458 0.496 -4.955 1 Dengan taraf nyata maka Koefisien Komponen utama dan ( VIF lampiran E) sudah signifikan serta nilai VIF adalah 1, ini menunjukkan bahwa sudah tidak ada lagi masalah multikolinieritas. Dengan mensubstitusikan persamaan (3.9) ke persamaan (3.10) maka didapat Model regresi linier berganda yang melibatkan variabel Z yang merupakan hasil transformasi dari variabel W sebagai variabel bebas. Hasil transformasi ditunjukkan pada persamaan (3.11) berikut : Universitas Sumatera Utara 57 ̂ 3.3.4 Uji Signifikansi Koefisien Regresi Komponen Utama Variabel Baku Koefisien regresi pada persamaan (3.11) akan diuji secara parsial. Berdasarkan persamaan (3.6) dan (3.7) maka didapatkan nilai varian dan T-Hitung masing–masing variabel bebas Z seperti pada tabel berikut. Tabel 3.9 Variabel Nilai Varian dan T-Hitung Variable Bebas Z Koefisien Regresi Varian T-Hitung -1.270 0.011 -115.455 -1.381 0.014 -98.643 -1.089 0.009 -121.000 -1.758 0.026 -67.615 -1.769 0.071 -24.915 -0.272 0.023 -11.826 Dengan taraf nyata maka ( lampiran E) Berdasarkan uji signifikansi koefisien regresi secara parsial, didapatkan bahwa semua | ( ̂ )| > Hal ini menyebabkan ditolak sehingga dapat disimpulkan bahwa semua variabel bebas Z berpengaruh secara nyata terhadap variabel terikat (Y). Maka dengan menggunakan persamaan (2.40), persamaan (3.11) akan diubah kebentuk semula. Persamaan yang terdapat variable Z ditransformasi menjadi variabel X sebagai variabel bebasnya dengan . Sehingga diperoleh model regresi dengan variabel bebas X yaitu : ̂ Universitas Sumatera Utara 58 Bab 4 KESIMPULAN DAN SARAN 4.1 Kesimpulan 1. Analisis regresi komponen utama merupakan suatu metode yang dapat mengatasi masalah multikolinieritas pada analisis regresi berganda. Pada analisis regresi komponen utama semua variabel bebas masuk kedalam model, tetapi sudah tidak terjadi multikolinieritas karena sudah dihilangkan pada tahap analisis komponen utama. 2. Pada tahap analisis komponen utama berdasarkan matriks korelasi dihasilkan dua buah komponen utama yang saling bebas (tidak ada korelasi) yang menjelaskan 91.683% keragaman dari total keragaman variabel asal dengan nilai akar ciri masing-masing 4.452 dan 1.049. 3. Nilai T-hitung masing-masing variable baku Z lebih besar dari T-tabel, sehingga berdasarkan uji signifikan koefisien secara parsial semua variabel pada regresi komponen utama berpengaruh nyata terhadap variable terikat (Y), hal ini menjadi ukuran bahwa model regresi komponen utama merupakan model yang tepat untuk analisis data. 4. Melalui analisis regresi komponen utama diperoleh persamaan regresi yang sudah tepat untuk analisis data yaitu : ̂ Universitas Sumatera Utara 59 4.2 Saran Multikolinieritas merupakan masalah yang dapat menimbulkan model yang diperoleh kurang baik untuk analisis, untuk itu multikolinieritas harus terlebih dulu diatasi. Salah satu cara adalah dengan menggunakan analisis komponen utama. Agar masalah multikolinieritas ini dapat teratasi dengan lebih tepat maka perlu dilakukan kajian terhadap metode–metode lain yang juga dapat mengatasi masalah multikolinieritas. Oleh karena itu, disarankan kepada peneliti selanjutnya agar menggunakan metode yang lain untuk mengatasi masalah multikolinieritas serta membandingkannya dengan metode ini dengan melihat kelebihan dan kekurangan masing-maasing metode. Universitas Sumatera Utara 60 DAFTAR PUSTAKA Abraham, Bovas and Ledolter Johannes. 1983. Statistical Methods for Forecasting. New York : John Wiley and Son Inc. Anton, Howard. 1987. Aljabar Linier Elementer . Edisi Kelima. Jakarta : Erlangga. Bakti, Haris.2008. Analisis Regresi Komponen Utama Untuk Mengatasi Masalah Multikolinieritas Dalam Analisis Regresi Linier Berganda . Diakses tanggal 8 april 2011 Chatterjee, Samprit and Price, Bertram. 1977. Regression Analysis by Example. Second Edition. New York : University New York. Drapper. N.R. and Smith. 1981. Applied Regression Analysis. Second Edition. New York : John Wiley and Son Inc. Gasperz, Vincent. 1991. Ekonometrika Terapan. Jilid 2. Bandung : Tarsito. Gujarati, Damodar. 1995. Ekonometrika Dasar. Terjemahan Sumarno. Jakarta : Erlangga Lungan, Richard. 2006. Aplikasi Statistika dan Hitung Peluang. Yogyakarta : Graha Ilmu Universitas Sumatera Utara 61 Naftali, Y. 2007. Regresi dan Multikolinieritas Dalam Regresi. http://yohanli.wordpress.com/category/science/ Diakses tanggal 15 Februari, 2011. Sembiring, R.K. 2003. Analisis Regresi. Bandung : ITB Bandung Sigit, Nugroho. Regresi Ridge Untuk Mengatasi Multikolinieritas. e-Jurnal Statistika. Diakses tanggal 15 Februari, 2011 Supranto, J. 1984. Ekonometrik. Jilid 2. Jakarta : LPFE Universitas Indonesia. Supranto, J. 2004. Analisis Multivariat. Jakarta : Rineka Cipta. Walpole, R.E. dan R.H. Myers. 1995. Ilmu Peluang dan Statistik Untuk Insnyiur dan Ilmuwan. Terjemahan Edisi Keempat. Bandung : ITB Bandung. Universitas Sumatera Utara
Kovariat Dari Fungsional Prinsipal Komponen Analisis Untuk Data Longitudinal Kovariat Dari Fungsional Prinsipal Komponen Analisis Untuk Data Longitudinal
Aktifitas terbaru
Penulis
Dokumen yang terkait
Upload teratas

Kovariat Dari Fungsional Prinsipal Komponen Analisis Untuk Data Longitudinal

Gratis