R adalah nama sebuah bahasa pemrograman sekaligus software untuk pengolahan data dan grafik.
R sangat popular saat ini karena tiga hal berikut:
- Banyak pilihan pengolahan data dengan jumlah fitur yang sangat komplit – dari grafik sampai machine learning.
- Lebih cepat dipelajari dan dijalankan untuk mengolah data dibandingkan dengan bahasa lain.
- R bersifat gratis dan open source yang artinya, tidak perlu biaya lisensi yang biasanya sangat mahal untuk software pengolahan data.
Kepopuleran bahasa R disebabkan karena penggunaannya pada berbagai perusahaan besar dunia.
Perusahaan besar yang dimaksud diantaranya adalah AirBnB untuk data science, Microsoft untuk menambahkan fungsionalitas di produk-produknya, Uber untuk analisa statistik, Facebook untuk behavior analysis, dan lain-lain.
Comment pada R
Comment merupakan teks untuk menambahkan keterangan pada kode yang ditulis. Penambahan keterangan ini akan mengingatkan kita kembali ketika membuka code tersebut di suatu waktu di masa depan.
Comment tidak dianggap sebagai code yang dapat dieksekusi.
Penggunaan comment dalam bahasa R dapat dilakukan dengan mengawali suatu teks dengan tanda ‘#’.
Berikut ini merupakan contoh penggunaan comment
10 + 7 #Ini adalah baris komentar
atau seperti ini
#Ini adalah baris komentar. 10 + 7
Vector pada R
Vector merupakan sebuah struktur data yang dapat menyimpan lebih dari satu data yang akan digunakan di R.
Penggunaannya sangat sederhana, yaitu menggunakan fungsi c disertai data-data yang ingin disimpan. Perhatikan potongan kode berikut
c(5, 10, 20)
ini artinya kamu akan menyimpan nilai 5, 10 dan 20 dalam satu struktur yang disebut vektor. Selanjutnya, jika kamu ingin menyimpan rangkaian angka yang terurut, misalkan angka 1 sampai dengan 20, maka kamud dapat dapat mengetikkan potongan kode berikut
c(1:20)
Menggunakan Fungsi Summary
Kekuatan bahasa pemrograman R terdapat pada fungsi-fungsi bawaan yang kaya untuk dipergunakan dalam analisis data. Salah satu fungsi ini adalah fungsi bernama summary yang bisa digunakan untuk menyimpulkan data yang lagi kita proses. Kesimpulan ini berupa nilai statistik deskriptif dari data yang dimiliki, diantaranya nilai minimum, nilai kuartil pertama, nilai tengah (median), nilai kuartil ketiga, dan nilai maksimum data.
Ketikkanlah perintah berikut di Code Editor agar kita dapat melihat karakteristik dari vector c(1:5)
summary(c(1:5))
Penjelasan:
Min. 1st Qu. Median Mean 3rd Qu. Max.
1 2 3 3 4 5
Ini artinya dari vector tersebut terdapat angka paling kecil 1 (Min), angka paling besar 5 (Max), angka rata-rata 3 (Mean), dan angka tengah 3 (Median).