About Me

Hai, saya Rosihan Ari Yuana. Saya sehari-hari adalah mengajar di Universitas Sebelas Maret.

Bidang riset saya tentang adaptive learning, computer aided learning, dan datascience

Selain itu, saya juga seorang penulis buku dan blogger.

More about me...

  • Home
  • /
  • Tag Archives:  data preprocessing

Generate CSV berdasarkan Kategori di Python dengan Pandas, OS, dan NumPy

Salah satu kasus yang sering dihadapi seorang Data Scientist adalah diberikan dataset yang stukturnya tidak cocok dengan kebutuhan untuk membuat Machine Learning Model. Sehingga perlu adanya penanganan manual yang termasuk dalam tahap pre-processing data. Pada artikel ini kita akan membahas bagaimana mengenerate file CSV berdasarkan kategori dengan Python menggunakan library Pandas, OS, dan NumPy.

Encoding Data Kategori ke Numerik di Python

Dalam banyak kasus di datascience, seringkali dijumpai dataset yang berisi data kategori berbentuk non numerik. Sebagai contoh misalkan dataset karyawan yang di dalamnya terdapat kolom gender, di mana datanya berupa kategori ‘laki-laki’ atau ‘perempuan’. Contoh lainnya, masih dari dataset karyawan, misalnya jenis karyawan: ‘karyawan tetap’, ‘karyawan kontrak’, ‘freelance’. Data-data kategori dalam dataset yang diberikan pada…

Menangani Missing Data dengan Python

Dalam datascience, sering kali kita jumpai data-data yang tidak utuh, atau hilang (missing data atau missing value). Sebagai contoh adalah data berikut ini: Gambar di atas menunjukkan data ketepatan waktu lulus dari mahasiswa dari beberapa program studi. Dalam hal ini kolom ‘Prodi’, ‘Usia’, dan ‘IPK’ kita sebut sebagai variabel bebas (X) dan kolom ‘LulusTepatWaktu’ sebagai…