About Me

Hai, saya Rosihan Ari Yuana. Saya sehari-hari adalah mengajar di Universitas Sebelas Maret.

Bidang riset saya tentang adaptive learning, computer aided learning, dan datascience

Selain itu, saya juga seorang penulis buku dan blogger.

More about me...

  • Home
  • /
  • Category Archives: Data Science

Tutorial Python SVM Classification dan Menampilkan Prediction Report dengan Confusion Matrix

SVM (Support Vector Machine) merupakan salah satu metode yang sering digunakan dalam Python clasification algorithm. SVM merupakan salah satu metode dalam supervised learning yang biasanya digunakan untuk klasifikasi dan regresi. SVM memiliki konsep yang lebih matang dan lebih jelas secara matematis dibandingkan dengan teknik-teknik klasifikasi lainnya di dalam pemodelan klasifikasi. SVM juga dapat mengatasi masalah…

Generate CSV berdasarkan Kategori di Python dengan Pandas, OS, dan NumPy

Salah satu kasus yang sering dihadapi seorang Data Scientist adalah diberikan dataset yang stukturnya tidak cocok dengan kebutuhan untuk membuat Machine Learning Model. Sehingga perlu adanya penanganan manual yang termasuk dalam tahap pre-processing data. Pada artikel ini kita akan membahas bagaimana mengenerate file CSV berdasarkan kategori dengan Python menggunakan library Pandas, OS, dan NumPy.

Encoding Data Kategori ke Numerik di Python

Dalam banyak kasus di datascience, seringkali dijumpai dataset yang berisi data kategori berbentuk non numerik. Sebagai contoh misalkan dataset karyawan yang di dalamnya terdapat kolom gender, di mana datanya berupa kategori ‘laki-laki’ atau ‘perempuan’. Contoh lainnya, masih dari dataset karyawan, misalnya jenis karyawan: ‘karyawan tetap’, ‘karyawan kontrak’, ‘freelance’. Data-data kategori dalam dataset yang diberikan pada…

Menangani Missing Data dengan Python

Dalam datascience, sering kali kita jumpai data-data yang tidak utuh, atau hilang (missing data atau missing value). Sebagai contoh adalah data berikut ini: Gambar di atas menunjukkan data ketepatan waktu lulus dari mahasiswa dari beberapa program studi. Dalam hal ini kolom ‘Prodi’, ‘Usia’, dan ‘IPK’ kita sebut sebagai variabel bebas (X) dan kolom ‘LulusTepatWaktu’ sebagai…

Analisis Time Series Data NetCDF dengan Library Python FBProphet

Melalui artikel kali ini, saya akan mencoba mengupas tuntas sebuah metode dalam data science, yaitu analisis time series, menggunakan Python. Seperti yang sudah diketahui secara umum bahwa untuk keperluan data science, Python telah menyediakan banyak sekali library, yang dengannya analisis data menjadi lebih mudah dan cepat. Tidak terkecuali analisis time series. Artikel ini akan membahas…

Import Data File NetCDF di Python dengan Library NetCDF4

Format file NetCDF dikembangkan dan dikelola oleh Unidata yang merupakan bagian dari University Corporation for Atmospheric Research (UCAR) Community Programs (UCP). Dalam penggunaannya, file NetCDF seringkali digunakan sebagai dataset di bidang geoscience. Di dalam file inilah terdapat data keadaan dari beberapa titik lokasi di bumi. Misalnya rata-rata suhu dari beberapa titik lokasi (berdasarkan koordinat latitude dan longitude) dalam rentang waktu…