Monday, December 17, 2012
Konsep Dasar Mengolah Susenas dengan SPSS
Survei Sosial Ekonomi Nasional atau Susenas sering saya ulas di blog ini, baik dari sisi kekurangan dan kelebihan maupun informasi terbaru tentang Susenas. Kali ini saya coba share pengalaman dalam mengolah Susenas dengan SPSS yaitu software statistika yang sering digunakan oleh pengolah data di Indonesia. Sebelumnya saya ingatkan bahwa apa yang saya tulis disini sekadar satu dari banyak cara yang bisa dilakukan dengan software SPSS, jadi bukan suatu langkah-langkah baku dalam pengolahan data Susenas atau data lainnya. Bisa saja dianggap sebagai Trik!
Pemboboton Data
Susenas adalah sebuah survey artinya hanya responden yang terambil acak berdasarkan metode sampling tertentu, bukan pendataan seluruh penduduk seperti Sensus! Jadi hasil dari sampel acak ini supaya bisa menggambarkan kondisi Indonesia, maka setiap responden rumahtangga diboboti dengan nilai tertentu. Bahasa mudahnya setiap responden terpilih memakili sekian banyak penduduk, jumlah keterwakilannya disebut pembobot. Pembobot di Susenas ada 2 yaitu pembobot rumah tangga untuk data rumah tangga dan pembobot individu untuk data individu.
Jadi dalam mengolah data Susenas dengan SPSS, langkah wajib yang harus dilakukan sebelum melakukan pengolahan lebih lanjut adalah melakukan pembobotan data. Umumnya variable pembobot dalam data Susenas diberikan pada variable terakhir di dalam data mentah Susenas, kadang dinamakan “weind” atau “wert” atau nama lain, yang jelas besarannya lebih dari 10. Langkah di SPSS bisa dilihat dalam gambar, disini Anda tinggal masukan varibel pembobot ke dalam box “Frequency Variabel” yang aktif setelah option “Weight cases by” dipilih. Anda tinggal scroll-down variable yang ada disamping, setelah ditemukan klik variable pembobot tersebut dan klik tombol panah kecil dan otomatis didalam box frequency variable muncul nama variable pembobotnya.
Filtering Data
Filtering data ini istilah saya saja, maksudnya adalah langkah yang sering dilakukan untuk mendapatkan hasil pengolahan data sesuai kriteria yang kita inginkan. Misalnya kita ingin membuat tabulasi penduduk dengan kriteria umur balita maka kita melakukan filter data khusus penduduk yang mempunyai umur kurang dari 5. Bisa saja filtering melibatkan banyak variable, misalnya anak yang sedang sekolah di SD sederajat, maka kriteria pertama adalah penduduk yang saat ini sedang sekolah dan kriteria kedua adalah anak yang pernah/sedang sekolah di SD atau Madrasah Ibtidaiyah (MI).
Walaupun terkesan mudah, tetapi ternyata banyak orang yang sering salah menyusun sebuah kriteria dalam filtering data ini. Salah satunya adalah penggunaan operator DAN (and) dan ATAU (or). Misalnya kita ingin filter penduduk tidak produktif yang didefinisikan penduduk dengan umur kurang dari 15 tahun (umur<15) dan umur lebih dari 64 tahun (umur>64). Mana yang benar dalam penulisan kreteria filter: umur<15 DAN umur>64 dibandingkan dengan umur<15 ATAU umur>64 mana yang benar? Konsep yang sederhana tetapi masih banyak salah, jawaban yang benar adalah ATAU, walaupun didefinisi sebelumnya disebut dengan ‘dan’. Kita ingat kembali konsep himpunan dengan diagram ven untuk bisa paham kapan kita gunakan operator DAN – ATAU. Konsep ini sangat penting untuk dipahami karena hampir semua filtering menerapkan konsep DAN – ATAU ini.
Untuk penerapan di SPSS, langkahnya sangat mudah seperti ditunjukan gambar di atas. Hanya klik menu Data+Select Cases. Setelah itu klik tombol “IF” dengan mengaktifkan dahulu opsi “If Condition is Satisfied”. Tinggal Anda ketikan filter yang Anda inginkan, atau juga bisa memanfaatkan list variable yang ada disamping jendela tersebut. Penulisan operator DAN bisa dituliskan AND atau simbol “&”, sedankan ATAU bisa dituliskan OR atau tanda “ I “. Perlu diingat bahwa operator AND akan diproses terlebih dahulu dibandingkan operator OR. Jadi jika ada banyak operator, sebaiknya untuk operator OR bisa di awali dengan kurung buka diakhirnya kurung tutup, misalnya: jk=2 AND (umur<=14 OR umur>=65). Disini filter umur diproses dahulu, kemudian proses selanjutnya menjalankan operator AND.
Mungkin itu dulu 2 konsep dasar pengolahan data Susenas di SPSS, saya ingatkan kembali bahwa langkah ini bukan langkah baru, mungkin saja ada cara baru di SPSS yang berbeda, maka penulis ingin bisa sharing dengan Anda. Semoga tip sederhana ini makin bisa mengenalkan Susenas untuk masyarakat umum. Dan kita harus berdoa bersama supaya Pemerintah mau menggratiskan data, minimum gratis untuk akademika perguruan tinggi, supaya penelitian di perguruan tinggi makin maju saja.
(Copyright : http://statstatistics.blogspot.com/2010/12/manfaat-statistika.html)
Tentang Statistika
Statistika adalah ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data. Singkatnya, statistika adalah ilmu yang berkenaan dengan data. Istilah ‘statistika’ (bahasa Inggris: statistics) berbeda dengan ‘statistik’ (statistic). Statistika merupakan ilmu yang berkenaan dengan data, sedang statistik adalah data, informasi, atau hasil penerapan algoritma statistika pada suatu data. Dari kumpulan data, statistika dapat digunakan untuk menyimpulkan atau mendeskripsikan data; ini dinamakan statistika deskriptif. Sebagian besar konsep dasar statistika mengasumsikan teori probabilitas. Beberapa istilah statistika antara lain: populasi, sampel, unit sampel, dan probabilitas.
Statistika banyak diterapkan dalam berbagai disiplin ilmu, baik ilmu-ilmu alam (misalnya astronomi dan biologi maupun ilmu-ilmu sosial (termasuk sosiologi dan psikologi), maupun di bidang bisnis, ekonomi, dan industri. Statistika juga digunakan dalam pemerintahan untuk berbagai macam tujuan; sensus penduduk merupakan salah satu prosedur yang paling dikenal. Aplikasi statistika lainnya yang sekarang popular adalah prosedur jajak pendapat atau polling (misalnya dilakukan sebelum pemilihan umum), serta jajak cepat (perhitungan cepat hasil pemilu) atau quick count. Di bidang komputasi, statistika dapat pula diterapkan dalam pengenalan pola maupun kecerdasan buatan.
Konsep dasar
Dalam mengaplikasikan statistika terhadap permasalahan sains, industri, atau sosial, pertama-tama dimulai dari mempelajari populasi. Makna populasi dalam statistika dapat berarti populasi benda hidup, benda mati, ataupun benda abstrak. Populasi juga dapat berupa pengukuran sebuah proses dalam waktu yang berbeda-beda, yakni dikenal dengan istilah deret waktu.
Melakukan pendataan (pengumpulan data) seluruh populasi dinamakan sensus. Sebuah sensus tentu memerlukan waktu dan biaya yang tinggi. Untuk itu, dalam statistika seringkali dilakukan pengambilan sampel (sampling), yakni sebagian kecil dari populasi, yang dapat mewakili seluruh populasi. Analisis data dari sampel nantinya digunakan untuk menggeneralisasi seluruh populasi.
Jika sampel yang diambil cukup representatif, inferensial (pengambilan keputusan) dan simpulan yang dibuat dari sampel dapat digunakan untuk menggambarkan populasi secara keseluruhan. Metode statistika tentang bagaimana cara mengambil sampel yang tepat dinamakan teknik sampling.
Analisis statistik banyak menggunakan probabilitas sebagai konsep dasarnya hal terlihat banyak digunakannya uji statistika yang mengambil dasar pada sebaran peluang. Sedangkan matematika statistika merupakan cabang dari matematika terapan yang menggunakan teori probabilitas dan analisis matematika untuk mendapatkan dasar-dasar teori statistika.
Ada dua macam statistika, yaitu statistika deskriptif dan statistika inferensial. Statistika deskriptif berkenaan dengan deskripsi data, misalnya dari menghitung rata-rata dan varians dari data mentah; mendeksripsikan menggunakan tabel-tabel atau grafik sehingga data mentah lebih mudah “dibaca” dan lebih bermakna. Sedangkan statistika inferensial lebih dari itu, misalnya melakukan pengujian hipotesis, melakukan prediksi observasi masa depan, atau membuat model regresi.
• Statistika deskriptif berkenaan dengan bagaimana data dapat digambarkan dideskripsikan) atau disimpulkan, baik secara numerik (misalnya menghitung rata-rata dan deviasi standar) atau secara grafis (dalam bentuk tabel atau grafik), untuk mendapatkan gambaran sekilas mengenai data tersebut, sehingga lebih mudah dibaca dan bermakna.
• Statistika inferensial berkenaan dengan permodelan data dan melakukan pengambilan keputusan berdasarkan analisis data, misalnya melakukan pengujian hipotesis, melakukan estimasi pengamatan masa mendatang (estimasi atau prediksi), membuat permodelan hubungan (korelasi, regresi, ANOVA, deret waktu), dan sebagainya.
Arti Dan Kegunaan Data
Informasi yang di dapat dari observasi / pengumpulan data dengan metode tertentu menghasilkan apa yang disebut dengan data, data dapat bersifat kuantitatif dan bersifat kualitatif. Informasi kuantitatif berupa angka-angka, sedangkan informasi yang bersifat kualitatif berbentuk selain angka-angka. Analisis terhadap jenis informasi tersebut tidak sama karena keduanya menuntut cara-carayang sesuai dengan keadaan informasi yang bersangkutan.Statistik dibutuhkan untuk menganalisis dan mengolah informasi yang bersifat kuantitatif. Statistik dibutuhkan karena data kuantitatif secara sendiri, apa adanya, dan masih bertumbuh, berapa pun jumlahnya, pada umumnya belum memberikan informasi secara bermakna dan komunikatif sebagaimana yang dibutuhkan pihak pengambil keputusan.
Kegunaan data pada dasarnya adalah untuk membuat keputusan oleh para pembuat keputusan (decision makers). Siapa saja yang membuat keputusan disebut decision makers. Namun dalam prakteknya, yang dimaksud sebagai decision makers biasanya adalah pimpinan. Data dapat berguna, bila dikaitkan dengan masalah manajemen .
Metodologi Pemecahan Masalah Secara Statistik
1. Mengidentifikasi masalah atau peluang
2. Mengumpulkan fakta yang tersedia
3. Mengumpulkan data orisinil yang baru
4. Mengklasifikasikan dan mengikhtisarkan data
5. Menyajikan data
6. Menganalisis data
Syarat Data Yang Baik
1. Objektif. Data yang objektif berarti bahwa data harus sesuai dengan keadaan yang sebenarnya (as it is).
2. Representative (mewakili). Data yang harus mewakili objek yang diamati
3. Kesalahan baku (standard error) kecil. Suatu perkiraan (estimate) dikatakan baik (mempunyai tingkat ketelitian yang tinggi) apabila kesalahan bakunya kecil
4. Tepat waktu.
5. Relevan. Data yang dikumpulkan harus ada hubungannya dengan masalah yang akan dipecahkan.
Jenis-Jenis Data
-Data dapat dikelompokkan, antara lain, menurut sifat, sumber, cara memperoleh, dan waktu pengumpulan.
Data menurut sifatnya.
Data menurut sifatnya dibedakan menjadi dua yaitu data kualitatif dan data kuantitatif
Data kualitatif adalah data yang tidak berbentuk angka (nonnumeric) yang biasanya merupakan data verbal yang diperoleh dari pengamatan, wawancara, atau bahan tertulis
Data kuantitatif dapat dibedakan ke dalam empat macam data yang mempunyai skala tertentu, yaitu (1) data nominal (nominal data), (2) data ordinal (ordinal data), (3) data interval (interval data), dan data (4) data rasio (ratio data).
Data nominal
adalah angka yang berfungsi hanya sebagai pengganti nama atau sebutan suatu gejala.
Data ordinal
adalah angka yang selain berfungsi sebagai pengganti nama atau sebutan suatu gejala juga menunjukkan bahwa masing-masing gejala mempunyai perbedaan intensitas dan atau tinggi-rendah.
Data interval
adalah data yang mempunyai ciri-ciri skala ordinal, namun jarak antara tiap bilangan itu diketahui
Data menurut sumbernya.
Data menurut sumbernya mengacu kepada sumber perolehan data, yakni eksternal dan internal. Data internal adalah yang bersumber dari keadaan atau kegiatan suatu organisasi atau kelompok. Misalnya, data penjualan dan data produksi suatu perusahaan. Data eksternal adalah data yang bersumber dari luar suatu organisasi atau kelompok. Misalnya, suatu persuahaan mencari data mengenai daya beli konsumen kepada kantor pusat statistik setempat.
Data menurut cara memperolehnya.
Berdasarkan cara memperolehnya, data data dibedakan antara data primer dan data sekunder. Data primer adalah data yang dikumpulkan dan diolah sendiri oleh suatu organisasi atau perorangan langsung dari objeknya. Misalnya, suatu perusahaan ingin mengetahui konsumsi rata-rata susu penduduk di suatu daerah dengan cara melakukan wawancara langsung kepada penduduk setempat. Data sekunder adalah data yang diperoleh dalam bentuk jadi dan telah diolah oleh pihak lain, yang biasanya dalam bentuk publikasi.
Data menurut waktu pengumpulannya.
Berdasarkan waktu pengumpulannya, data dibedakan sebagai data cross section dan berkala (times series). Data cross section adalah data yang dikumpulkan dalam suatu periode tertentu.
(Copyright : http://yosafinerifki.wordpress.com/2012/02/25/mengenai-statistik/)
Subscribe to:
Comments (Atom)