Pendefinisian data
Pada saat peneliti atau analist telah mengidentifikasi masalah atau tujuan riset maka hal penting yang perlu dilakukan selanjutnya adalah mendefinisikan data melalui pendefinisian variabel. Pendefinisian variabel dilakukan dengan menguraikan definisi operasional serta menentukan jenis dan pengukuran variabel tersebut, contoh:
Variabel profitabilitas adalah kemampuan perusahaan dalam menciptakan laba dari aset yang dimilikinya yang diukur dengan rasio pengembalian aset atau perbandingan laba bersih atas total aset.
Berdasarkan jenisnya, maka variabel dapat dibagi menjadi 2 (dua), yaitu numerik (numerical) dan kategori (categorical). Variabel numerik merupakan data yang berasal dari hasil penghitungan atau pengukuran kuantitas sedangkan variabel kategori merupakan data yang berasal dari hasil klasifikasi. Khusus untuk variabel numerik, perlu ditentukan apakah variabel bersifat diskrit (discrete) atau kontinu (continuous).Variabel diskrit berasal dari data penghitungan proses (misalnya, data bulanan) sedangkan variabel kontinu berasal dari data pengukuran proses (misalnya, waktu tunggu). Pada saat jenis variabel telah ditentukan, maka penentuan selanjutnya adalah pengukuran variabel atau skala. Variabel numerik dapat diukur dengan menggunakan skala interval (merefleksikan perbedaan dan sering melibatkan data ordinal) dan skala rasio (ukuran unit yang diketahui dan memiliki makna interpretasi). Contoh:
Skala interval:
1 - 3 = kurang baik
4 - 6 = cukup
7 - 8 = baik
9 -10 = sangat baik
Skala rasio:
|
Data 1
|
Data 2
|
Rasio (Data 1/Data 2)
|
|
1
|
2
|
0.5
|
|
2
|
5
|
0.4
|
Berbeda halnya dengan variabel kategori dimana variabel ini diukur dengan skala nominal (pembeda tanpa makna urut) dan skala ordinal (pembeda dengan makna urut).
Skala nominal:
Laki-laki = 1
Perempuan = 2
Skala ordinal:
Rendah = 0
Tinggi = 1
Pengumpulan data
Populasi dan sampel merupakan hal penting dalam melakukan pengumpulan data. Populasi adalah kumpulan seluruh karakter atau individu sedangkan sampel adalah bagian dari populasi yang sesuai dengan kebutuhan analisis. Pengumpulan data dari populasi atau sampel dapat dilakukan secara langsung dari sumber utama (primary data source) atau berasal dari pengolahan data atau informasi pihak lain (secondary data source). Selanjutnya, data yang telah dikumpulkan akan mengalami pemilihan spesifik atau perlakuan (treatment) untuk kebutuhan analisis.
|
Jenis kelamin
|
Jumlah
|
|
Laki-laki
|
20
|
|
Perempuan
|
30
|
|
Populasi
|
50
|

Jenis metode pengumpulan data
Pada saat proses pengumpulan data dari sampel, seorang analist atau peneliti telah melakukan pembingkaian (frame). Para analist atau peneliti melakukan proses pembingkaian dengan menggunakan pemilihan sampel tanpa peluang (nonprobability sample) atau sampel berpeluang (probability sample). Jenis sampel tanpa peluang dapat berbentuk sampel yang bersifat kebetulan (convenience sample) dan sampel justifikasi (judgement sample). Sebaliknya, untuk jenis sampel berpeluang dapat berupa sampel acak sederhana (simple random sample), sampel sistematik (systematic sample), sampel berstrata (stratified sample), dan sampel kelompok (cluster sample).
Pembersihan data
Para analist atau peneliti melakukan pembersihan atas data yang memiliki nilai tidak valid (invalid values), kesalahan kode (coding errors), kesalahan integrasi (data integration errors), tanpa nilai (missing values), dan nilai ekstrim (extreme numerical values).
Sumber:
Berenson, M. L., Levine, D. M., Szabat, K. A., & Stephan, D. F. (2020). Basic Business Statistics: Concepts and Applications, 14th Edition. Harlow: Pearson Education Limited.
Lind, D. A., Marchal, W. G., & Wathen, S. A. (2022). Basic Statistics for Business and Economics, 10th Edition. New York: McGraw-Hill.