Monday, March 14, 2022

Jarak, varians dan simpangan baku, koefisien variasi, Z-Scores

Jarak (range)
Jarak merupakan pengukuran sebaran yang paling sederhana yang dihitung berdasarkan selisih antara nilai tertinggi dengan nilai terendah. Contoh:
 
1
2
2
3
4
5
6
Data diatas menunjukkan range sebesar 5 atau selisih antara nilai 6 dengan nilai 1. Hal ini mengindikasikan bahwa perbedaan paling tinggi dalam data adalah sebesar 5.
 
Varians dan simpangan baku
Varians dan simpangan baku (variance and standard deviation) merupakan pengukuran sebaran berdasarkan data yang ada dan tidak hanya mempertimbangkan 2 (dua) nilai data seperti range. Pengukuran atas varians dan simpangan baku seringkali diterapkan pada populasi dan sampel. Contoh (diadopsi dari Lind et al., 2022:74):
 
Bulan (N)
Volume (x)
(x-μ)
(x-μ)2
1
19
-10
100
2
17
-12
144
3
22
-7
49
4
18
-11
121
5
28
-1
1
6
34
5
25
7
45
16
256
8
39
10
100
9
38
9
81
10
44
15
225
11
34
5
25
12
10
-19
361
Mean (μ)
29
0
1,488
 
Varians populasi (σ2) = (∑(x-μ)2)/N atau 1,488/12 atau 124. 
Simpangan baku populasi (σ) = Öσ2 atau Ö124 atau 11.14.
Varians sampel (s2) = (∑(x-x̅)2)/(n-1) atau 1,488/11 atau 135.27.
Simpangan baku sampel (s) = Ös2 atau Ö135.27 atau 11.63.
 
Koefisien variasi
Pengukuran ini bertujuan untuk melihat sebaran simpangan baku dari nilai rata-rata. Koefisien variasi dihitung dengan formula berikut:
(simpangan baku / nilai rata-rata) x 100%
Berdasarkan data (lihat data contoh varians dan simpangan baku) maka nilai coefficient of variation (CV) berdasarkan populasi adalah 11.14/29 atau 0.38 sedangkan berdasarkan sampel adalah 11.63/29 atau 0.40. 
 
Z-Scores
Nilai Z merupakan ukuran yang membantu mendeteksi adanya nilai yang ekstrim berbeda dengan mean (outliers). Beberapa kondisi nilai Z adalah sebagai berikut.
- Nilai Z = 0 mengindikasikan nilai tersebut sama dengan mean. 
- Nilai Z bertanda + atau - mengindikasikan nilai berada diatas atau dibawah mean.
- Nilai Z kurang dari -3.0 atau lebih dari 3.0 mengindikasikan nilai tersebut adalah outliers.
Nilai Z dihitung dengan formula (x - x̅) / s dimana x adalah data, x̅ adalah mean, dan s adalah simpangan baku. Contoh:

Nilai data                    = 20
Mean                           = 15
Simpangan baku          = 10
Z-Score                       = (20 - 15) / 10 atau 0.5

Berdasarkan nilai Z sebesar 0.5 dapat diinterpretasikan bahwa: (1) nilai tersebut dekat dengan mean (hampir mendekati 0); (2) nilai tersebut berada diatas mean; dan (3) nilai tersebut bukan  merupakan outliers.
 

Sumber:

Berenson, M. L., Levine, D. M., Szabat, K. A., & Stephan, D. F. (2020). Basic Business Statistics: Concepts and Applications, 14th Edition. Harlow: Pearson Education Limited.

Lind, D. A., Marchal, W. G., & Wathen, S. A. (2022). Basic Statistics for Business and Economics, 10th Edition. New York: McGraw-Hill.

Nilai rata-rata geometrik (geometric mean)

Nilai rata-rata geometrik merupakan pengukuran lokasi dari akar produk ke n dari nilai n. Nilai rata-rata geometrik sering diterapkan pada data keuangan untuk mencari tingkat pertumbuhan dalam sebuah periode atau waktu. Formula dasar yang digunakan dalam menghitung rata-rata geometrik adalah: 
 
Contoh:
Seorang investor menginvestasikan Rp. 1,000 di bulan 1 pada sebuah aset. Tabel berikut menyajikan nilai investasi, perubahan nilai pada bulan-bulan berikutnya, serta tingkat pertumbuhannya.

BulanNilai investasiTingkat pertumbuhan
11,000-
21,3000.3
31,200-0.08
41,4000.17

Investor tersebut ingin mengetahui:
1. Rata-rata tingkat pertumbuhan investasi untuk 3 bulan sejak awal investasi dilakukan.
2. Rata-rata tingkat pertumbuhan investasi selama 3 bulan sejak awal investasi dilakukan.
Informasi atas kedua pertanyaan tersebut dapat dihitung sebagai berikut:
1. Rata-rata tingkat pertumbuhan investasi untuk 3 bulan (nilai rata-rata aritmetik)
(0.30 - 0.08 + 0.17) / 3 = 0.13
atau
rata-rata tingkat pertumbuhan adalah 0.13 per bulan
 
2. Rata-rata tingkat pertumbuhan investasi selama 3 bulan (nilai rata-rata geometrik)
[(1+0.30) x (1-0.08) x (1+0.17)]1/3 - 1 = 0.12
atau
rata-rata tingkat pertumbuhan adalah 0.12 per bulan
 

Sumber:

Berenson, M. L., Levine, D. M., Szabat, K. A., & Stephan, D. F. (2020). Basic Business Statistics: Concepts and Applications, 14th Edition. Harlow: Pearson Education Limited.

Lind, D. A., Marchal, W. G., & Wathen, S. A. (2022). Basic Statistics for Business and Economics, 10th Edition. New York: McGraw-Hill.

Mean, median, mode

Nilai rata-rata (mean)
Mean dapat disebut juga sebagai nilai rata-rata aritmetik (arithmetic mean). Contoh:
 
TahunLaba bersih
110
233
324
445
556
Total168
Jumlah data5
Mean (Total/Jumlah data)33.6

Berdasarkan mean sebesar 33.6 maka dapat disimpulkan bahwa rata-rata laba bersih selama 5 (lima) tahun adalah sebesar 33.6.
 
Nilai tengah (median)
Median merupakan nilai yang muncul antara kelompok nilai terkecil hingga kelompok nilai terbesar saat data diurutkan. Contoh:

Tabel 1
PerusahaanLaba bersih (sebelum diurutkan)
146
234
323
416
562
654
Tabel 2
PerusahaanLaba bersih (setelah diurutkan)
416
323
234
146
654
562
Median40

Penentuan median dapat diperoleh melalui formula (jumlah data + 1) / 2. Pada contoh ini, letak median adalah berada pada data ke-3.5 atau (6 + 1) / 2. Median dengan nilai 3.5 berarti bahwa nilai tengah dari data setelah diurutkan (lihat Tabel 2) berada di antara data ke-3 atau laba bersih sebesar 34 (perusahaan 2) dengan data ke-4 atau laba bersih sebesar 46 (perusahaan 1) sehingga median dapat ditentukan sebesar 40 atau (34 + 46) / 2. 
 
Nilai yang sering muncul (mode)
Modus (mode) merupakan nilai yang sering muncul dalam sebuah rangkaian data. Mode juga memiliki hubungan erat dengan frekuensi. Contoh:

1223456
 
Berdasarkan data diatas, maka mode yang ditemukan adalah bernilai 2. Hal ini berarti nilai 2 adalah nilai yang sering muncul atau memiliki frekuensi tertinggi diantara nilai yang lain.
 

Sumber:

Berenson, M. L., Levine, D. M., Szabat, K. A., & Stephan, D. F. (2020). Basic Business Statistics: Concepts and Applications, 14th Edition. Harlow: Pearson Education Limited.

Lind, D. A., Marchal, W. G., & Wathen, S. A. (2022). Basic Statistics for Business and Economics, 10th Edition. New York: McGraw-Hill.

Thursday, March 3, 2022

Konsep pendefinisian dan pengumpulan data

Pendefinisian data

Pada saat peneliti atau analist telah mengidentifikasi masalah atau tujuan riset maka hal penting yang perlu dilakukan selanjutnya adalah mendefinisikan data melalui pendefinisian variabel. Pendefinisian variabel dilakukan dengan menguraikan definisi operasional serta menentukan jenis dan pengukuran variabel tersebut, contoh:

 

Variabel profitabilitas adalah kemampuan perusahaan dalam menciptakan laba dari aset yang dimilikinya yang diukur dengan rasio pengembalian aset atau perbandingan laba bersih atas total aset.

 

Berdasarkan jenisnya, maka variabel dapat dibagi menjadi 2 (dua), yaitu numerik (numerical) dan kategori (categorical). Variabel numerik merupakan data yang berasal dari hasil penghitungan atau pengukuran kuantitas sedangkan variabel kategori merupakan data yang berasal dari hasil klasifikasi. Khusus untuk variabel numerik, perlu ditentukan apakah variabel bersifat diskrit (discrete) atau kontinu (continuous).Variabel diskrit berasal dari data penghitungan proses (misalnya, data bulanan) sedangkan variabel kontinu berasal dari data pengukuran proses (misalnya, waktu tunggu). Pada saat jenis variabel telah ditentukan, maka penentuan selanjutnya adalah pengukuran variabel atau skala. Variabel numerik dapat diukur dengan menggunakan skala interval (merefleksikan perbedaan dan sering melibatkan data ordinal) dan skala rasio (ukuran unit yang diketahui dan memiliki makna interpretasi). Contoh: 

 

Skala interval:

1 - 3 = kurang baik

4 - 6 = cukup

7 - 8 = baik

9 -10 = sangat baik

 

Skala rasio:

Data 1

Data 2

Rasio (Data 1/Data 2)

1

2

0.5

2

5

0.4

 

Berbeda halnya dengan variabel kategori dimana variabel ini diukur dengan skala nominal (pembeda tanpa makna urut) dan skala ordinal (pembeda dengan makna urut). 

 

Skala nominal:

Laki-laki = 1

Perempuan = 2

 

Skala ordinal:

Rendah = 0

Tinggi = 1

 

Pengumpulan data

Populasi dan sampel merupakan hal penting dalam melakukan pengumpulan data. Populasi adalah kumpulan seluruh karakter atau individu sedangkan sampel adalah bagian dari populasi yang sesuai dengan kebutuhan analisis. Pengumpulan data dari populasi atau sampel dapat dilakukan secara langsung dari sumber utama (primary data source) atau berasal dari pengolahan data atau informasi pihak lain (secondary data source). Selanjutnya, data yang telah dikumpulkan akan mengalami pemilihan spesifik atau perlakuan (treatment) untuk kebutuhan analisis.

 

Jenis kelamin

Jumlah

Laki-laki

20

Perempuan

30

Populasi

50

image

Jenis metode pengumpulan data

Pada saat proses pengumpulan data dari sampel, seorang analist atau peneliti telah melakukan pembingkaian (frame). Para analist atau peneliti melakukan proses pembingkaian dengan menggunakan pemilihan sampel tanpa peluang (nonprobability sample) atau sampel berpeluang (probability sample). Jenis sampel tanpa peluang dapat berbentuk sampel yang bersifat kebetulan (convenience sample) dan sampel justifikasi (judgement sample). Sebaliknya, untuk jenis sampel berpeluang dapat berupa sampel acak sederhana (simple random sample), sampel sistematik (systematic sample), sampel berstrata (stratified sample), dan sampel kelompok (cluster sample).

 

Pembersihan data

Para analist atau peneliti melakukan pembersihan atas data yang memiliki nilai tidak valid (invalid values), kesalahan kode (coding errors), kesalahan integrasi (data integration errors), tanpa nilai (missing values), dan nilai ekstrim (extreme numerical values).

 

 

Sumber:

Berenson, M. L., Levine, D. M., Szabat, K. A., & Stephan, D. F. (2020). Basic Business Statistics: Concepts and Applications, 14th Edition. Harlow: Pearson Education Limited.

Lind, D. A., Marchal, W. G., & Wathen, S. A. (2022). Basic Statistics for Business and Economics, 10th Edition. New York: McGraw-Hill.

 

Analisis varians

Penjelasan analisis varians atau analysis of variance (ANOVA) secara ringkas dapat mengguna...