Mencari Duplikasi Data dengan SQL
June 26th, 2008 | by rosihanari |
Cetak Artikel
Anda ingin mencari data yang berduplikasi dalam tabel dalam database yang Anda miliki? Dengan menggunakan statement SQL, Anda dapat mengetahui data yang berduplikasi dengan mudah dan cepat.
Bagaimana caranya? Simak artikel ini dengan baik.
Untuk pembahasan, akan diambil contoh tabel mahasiswa dengan struktur field berikut ini
NIM -> Varchar(10)
NamaMhs -> Varchar(20)
Pada struktur tabel di atas, memang seharusnya tidak boleh ada data pada field NIM yang berduplikasi. Repot… apabila ada dua atau lebih mahasiswa yang memiliki NIM yang sama.
Bagi programmer yang baik, tentunya akan membuat primary key pada field NIM untuk mencegah duplikasi data. Namun bagaimana seandainya si programmer lupa untuk memberikan primary key pada NIM, padahal data mahasiswa sudah telanjur tersimpan dalam tabel? Jangan khawatir wahai programmer… ada cara untuk mencari data yang berduplikasi. Gunakan saja statement SQL.
Begini perintahnya:
SELECT nim, count(*) as jumlah FROM namatabel GROUP BY nim ORDER BY jumlah DESC;
Perintah di atas akan menghitung jumlah data untuk setiap kelompok nim. Secara logika, suatu nim akan unik atau tunggal jika jumlah nimnya adalah 1. Sedangkan nim yang berduplikasi, apabila jumlah data pada nim tersebut adalah lebih dari 1.
Sebagai contoh, perhatikan data yang tersimpan dalam tabel di atas (sampel saja)Â berikut ini:
| NIM | Nama Mhs |
| 001 | si A |
| 002 | si B |
| 001 | si C |
| 003 | si D |
| 002 | si E |
Dari contoh record di atas, setelah diberikan perintah SQL yang telah saya berikan sebelumnya, akan dihasilkan
| NIM | jumlah |
| 001 | 2 |
| 002 | 2 |
| 003 | 1 |
Dari hasil yang diperoleh tampak bahwa terdapat NIM 001 yang berduplikat (sejumlah 2 data) dan NIM 002 yang juga 2 data. Perintah ORDER BY jumlah digunakan untuk mengurutkan jumlah data tiap kelompok NIM mulai yang terbesar. Harapannya supaya data yang duplikat terletak di paling atas dalam tampilan, sehingga kita enak mencarinya.
Gimana.. mudah kan?
| Baca Juga Artikel Terkait |
Kata kunci:




[...] Anda membaca artikel saya tentang mencari selisih waktu dan tanggal dengan SQL? Kalau belum, sebaiknya baca artikel tersebut terlebih dahulu karena artikel ini terkait dengan [...]
kpd mas rosihan,
sy mw tnya da ga fungsi minute atau waktu pada SQL
ada mas eko, gunakan perintah minute().
Contoh:
SELECT MINUTE(’10:05:03′);
Perintah di atas akan menghasilkan ’5′ (menit ke-5)
[...] artikel sebelumnya yang pernah saya tulis dalam topik Mencari Duplikasi Data dengan SQL, di situ sudah disinggung trik mencari data mana yang berduplikasi. Ya… yang namanya manusia, [...]
Salam buat P. Rosihan.
Pak, saya mau tanya. bagaimana cara menampilkan data terbesar.
Contoh kasusnya seperti dibawah ini.
Tabel:
idKary Nama Bagian Gaji
1 A Admin 100
2 B Admin 250
3 D Admin 150
4 C Sales 110
hasil yang diharapkan dari tabel diatas:
Nama Bagian Gaji
B Admin 250
C Sales 110
Jadi intinya menampilkan gaji terbesar tiap bagian.
saya sudah menggunakan script dibawah ini:
SELECT * FROM bagian WHERE Bagian=’$Bagian’ GROUP BY Bagian ORDER BY Gaji DESC;
tapi yang muncul malah gaji terkecil.
Mohon bantuannya. terima kasih.
@nico: coba pakai query ini mas -> SELECT * FROM bagian WHERE gaji = (SELECT MAX(gaji) FROM bagian AS b WHERE b.bagian = bagian.bagian)
Terima kasih banyak atas bantuannya Pak.
Salut buat Pak Rosihan. mau membantu kami dengan pencerahan-pencerahannya..
Sukses selalu buat Pak Rosihan…
@nico: sama2 mas…
mas.. gmn kalau ingin menapilkan hanya 1 data saja di data yang duplikat itu…
contoh:
id NIM IDDOSEN
1 0523 545
2 0523 856
3 0524 555
Saya ingin menampilkan semua, tapi jika ada yang duplikat hanya satu yang ditampilkan..
hasil :
NIM
0523
0524
Thax be4…
Mas, mau nanya tp di luar materi di atas.
Web saya ga mau konek ke database server. pdhal tadinya bisa konek.
muncul warning :
Warning: mssql_connect() [function.mssql-connect]: message: Login failed for user ‘bsmi@2013′. Reason: Not associated with a trusted SQL Server connection. (severity 14)
tp klo saya konek ke SQL server dgn SQL query analyzer mau login.
kpn ya mas?
mslhnya di SQL Server atau di Xammp-nya ya?
@erik: kemungkinan besar di mssql nya mas, feeling saya sih.. anda gak ubah apa2 di mssql nya?
Saya ga ubah apa2 mas di SQL server-nya, coz itu server database t’sndiri… Saya ga pnya akses ngrubah settingan SQL Server…
Mas Rosihan,
untuk keperluan membuat chart, bagaimana cara saya memasukkan data hasil query.. dalam contoh diatas
NIM jumlah
001 2
002 2
003 1
kedalam sebuah tabel dummies untuk dibaca program pembuat grafik chart?
mohon bimbingannya
@haris: kenapa gak langsung pake saja data hasil query tsb mas, kan bisa tanpa harus pake tabel dummy?