Memahami Konsep Data Mining Beserta Prosesnya

Pada artikel kali ini akan Memahami Konsep Data Mining Beserta Prosesnya, mengetahui apa saja algoritma data mining dan berbagai pertanyaan tentang data mining.

alangkah lebih baiknya mengetahui terlebih dahulu perbedaan data dan informasi. Data itu berbeda dengan informasi, data adalah catatan atas kumpulan fakta. Sedangkan Informasi merupakan kumpulan data yang sudah diolah menjadi bentuk yang memiliki nilai atau bermakna. Demikianlah pembahasan singkat mengenai perbedaan data dan informasi.

Apa itu data mining ?

Proses pengolahan dari kumpulan data menjadi sebuah pengetahuan baru, proses ini dikenal dengan istilah data mining. Data mining adalah disiplin ilmu yang mempelajari berbagai metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu kumpulan data yang besar. Pengetahuan yang dihasilkan ini dapat berupa pola, rumus, aturan atau model.

Apa saja fungsi data mining itu ?

Fungsi utamanya dalam data mining ada dua; Yaitu fungsi descriptive dan fungsi predictive.

Descriptive/Deskripsi

Fungsi ini dalam data mining merupakan sebuah fungsi untuk memahami lebih jauh tentang data yang diamati. Dengan melakukan sebuah proses diharap dapat mengetahui perilaku atau pola dari sebuah data tersebut. Data tersebutlah yang nantinya bisa digunakan untuk mengetahui karakteristik dari data yang diamati.

Dengan menggunakan Fungsi deskripsi Data mining, maka selanjutnya dapat ditemukan pola tertentu yang tersembunyi dalam sebuah data. Dengan demikian, apabila pola yang berulang dan bernilai tersebut merupakan karakteristik sebuah data dapat diketahui.

Predictive/prediksi

Fungsi prediksi merupakan sebuah fungsi untuk mengetahui bagaimana sebuah proses nantinya akan menemukan pola tertentu dari suatu data. Pola-pola tersebut bisa diketahui dari berbagai variabel-variabel yang ada pada data.

Ketika pola sudah ditemukan, selanjutnya pola yang didapat tersebut dapat digunakan untuk memprediksi variabel lain yang belum diketahui nilai ataupun jenisnya.

Itulah mengapa fungsi satu ini dikatakan sebagai fungsi prediksi sama halnya dengan melakukan predictive analisis. Fungsi ini juga dapat digunakan untuk memprediksi sebuah variabel tertentu yang belum ada dalam suatu data. Sehingga fungsi ini sangat memudahkan dan menguntungkan bagi siapapun yang memerlukan prediksi yang akurat untuk menjadikan hal penting tersebut menjadi lebih baik.

Fungsi lain dari Data mining

Fungsi lain dari Data mining yaitu : characterization and discrimination, association, classification, clustering, outlier and trend analysis, dan Trend and evolution analysis.

  • characterization(Karakterisasi) dan discrimination(diskriminasi), berfungsi untuk menggeneralisasikan, meringkas, dan membedakan karakteristik data, dll.
  • assocaition(asosiasi), Analisis asosiasi adalah teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item.
  • Classification and prediction, Membangun model (fungsi) yang menggambarkan dan membedakan kelas atau konsep untuk melakukan prediksi terhadap masa depan. Misalnya, Mengklasifikasikan negara berdasarkan (iklim), atau mengklasifikasikan mobil berdasarkan jarak tempuh gas)
  • Cluster analysis, Membuat data yang akan dijadikan dalam bentuk grup untuk membentuk kelas baru. Misalnya, Memaksimalkan kesamaan intra-kelas & meminimalkan kesamaan antar kelas
  • Outlier analysis, Objek data yang tidak memiliki kesesuaian dengan pola umum dari data, berguna untuk melakukan pendeteksian penipuan dan analisis kejadian langka.
  • Trend and evolution analysis, Analisis evolusi data yang menjelaskan dan memodelkan trend dari suatu objek yang memiliki perilaku yang terus berubah setiap waktu

Mengubah Data Menjadi Pengetahuan

Data harus kita olah menjadi pengetahuan supaya bisa bermanfaat bagi manusia. Dengan pengetahuan
tersebut, manusia dapat:

  • Melakukan estimasi dan prediksi apa yang terjadi di depan
  • Melakukan analisis tentang asosiasi, korelasi dan pengelompokan antar data dan atribut
  • Membantu pengambilan keputusan dan pembuatan kebijakan

Kalian dapat mengunduh contoh data set dengan format file CSV di sini.

Data

NIPTanggalDatangPulang
110302/12/200407:2015:40
114202/12/200407:4515:33
115602/12/200407:5116:00
117302/12/200408:0015:15
118002/12/200407:0116:31
Data Kehadiran Karyawan

Informasi

NIPMasukAlpaCutiSakitTelat
110322
11421822
115610111
11731255
11801012
Informasi Akumulasi Bulanan Kehadiran Karyawan

Pengetahuan

SeninSelasaRabuKamisJumat
Terlambat70105
Pulang Cepat01118
Izin30014
Alpa10202
Pola Kebiasaan Kehadiran Mingguan Karyawan

Kebijakan

  • Kebijakan penataan jam kerja karyawan khusus untuk hari senin dan jumat
  • Peraturan jam kerja:
    • Hari Senin dimulai jam 10:00
    • Hari Jumat diakhiri jam 14:00
    • Sisa jam kerja dikompensasi ke hari lain

Masalah-Masalah di Data Mining

  1. Jumlah data yang luar biasa
    • Algoritma harus sangat skalabel untuk menangani seperti tera-byte data
  2. Dimensi data yang tinggi
    • Micro-array mungkin memiliki puluhan ribu dimensi
  3. Kompleksitas data yang tinggi
    • Data stream dan data sensor
    • Data time-series, data temporal, data urutan
    • Struktur data, grafik, jejaring sosial dan data multi-link
    • Basis data heterogen dan basis data warisan
    • Data spasial, spasial, multimedia, teks dan Web
    • Program perangkat lunak, simulasi ilmiah
  4. Aplikasi baru dan canggih

Tipe Data

Tipe DataDeskripsiContohOperasi
Ratio
(Mutlak)
• Data yang diperoleh dengan cara
pengukuran, dimana jarak dua titik
pada skala sudah diketahui
• Mempunyai titik nol yang absolut
(*, /)
• Umur
• Berat badan
• Tinggi badan
• Jumlah uang
geometric mean,
harmonic mean,
percent variation
Interval
(Jarak)
• Data yang diperoleh dengan cara
pengukuran, dimana jarak dua titik
pada skala sudah diketahui
• Tidak mempunyai titik nol yang
absolut
(+, – )
• Suhu 0°c-100°c,
• Umur 20-30 tahun
mean, standard
deviation,
Pearson’s
correlation, t and
F tests
Ordinal
(Peringkat)
• Data yang diperoleh dengan cara
kategorisasi atau klasifikasi
• Tetapi diantara data tersebut
terdapat hubungan atau berurutan
(<, >)
• Tingkat kepuasan
pelanggan (puas,
sedang, tidak puas)
median,
percentiles, rank
correlation, run
tests, sign tests
Nominal
(Label)
• Data yang diperoleh dengan cara
kategorisasi atau klasifikasi
• Menunjukkan beberapa object
yang berbeda
(=, ≠)
• Kode pos
• Jenis kelamin
• Nomer id karyawan
• Nama kota
mode, entropy,
contingency
correlation, ꭕ²
test
Tabel Tipe Data Dalam Data Mining

Peran Utama Data Mining

Estimasi

Contohnya yakni Estimasi Waktu Pengiriman Pizza.

Peran Utama Data Mining: Estimasi Waktu Pengiriman Pizza
Estimasi Waktu Pengiriman Pizza

Forecasting

Contohnya Forecasting Cuaca.

Data Mining: Forecasting Cuaca
Forecasting Cuaca

Klasifikasi

Contohnya Rekomendasi Main Golf.

Peran Utama Data Mining: Rekomendasi Main Golf
Rekomendasi Main Golf

Klastering

Contohnya Klastering Sentimen Warga.

Peran Utama Data Mining: Klastering Sentimen Warga
Klastering Sentimen Warga

Asosiasi

Contohnya Aturan Asosiasi di Amazon.com

Peran Utama Data Mining: Aturan Asosiasi di Amazon.com
Aturan Asosiasi di Amazon.com

Metode Learning Algoritma Data Mining

Supervised Learning

  • Pembelajaran dengan guru, data set memiliki target/label/class
  • Sebagian besar algoritma data mining (estimation, prediction/forecasting, classification) adalah supervised learning
  • Algoritma melakukan proses belajar berdasarkan nilai dari variabel target yang terasosiasi dengan nilai dari variable prediktor

Dataset dengan Class

Metode Learning Algoritma Data Mining: Dataset dengan Class
Dataset dengan Class

Unsupervised Learning

  • Algoritma data mining mencari pola dari semua variable (atribut)
  • Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)
  • Algoritma clustering adalah algoritma unsupervised learning

Dataset tanpa Class

Metode Learning Algoritma Data Mining: Dataset Tanpa Class
Dataset tanpa Class

Semi-Supervised Learning

Metode Learning Algoritma Data Mining: Semi-Supervised Learning
Semi-Supervised Learning
  • Semi-supervised learning adalah metode data mining yang menggunakan data dengan label dan tidak berlabel sekaligus dalam proses pembelajarannya
  • Data yang memiliki kelas digunakan untuk membentuk model (pengetahuan), data tanpa label digunakan untuk membuat batasan antara kelas

Metode Data Mining

  1. Estimation (Estimasi):
    Linear Regression (LR), Neural Network (NN), Deep Learning (DL), Support Vector Machine (SVM), Generalized Linear Model (GLM) dll.
  2. Forecasting (Prediksi/Peramalan):
    Linear Regression (LR), Neural Network (NN), Deep Learning (DL), Support Vector Machine (SVM), Generalized Linear Model (GLM), dll.
  3. Classification (Klasifikasi):
    Decision Tree (CART, ID3, C4.5, Credal DT, Credal C4.5, Adaptative Credal C4.5), Naive Bayes (NB), K-Nearest Neighbor (kNN), Linear Discriminant Analysis (LDA), Logistic Regression (LogR), dll.
  4. Clustering (Klastering):
    K-Means, K-Medoids, Self-Organizing Map (SOM), Fuzzy C-Means (FCM), dll.
  5. Association (Asosiasi):
    FP-Growth, A Priori, Coefficient of Correlation, Chi Square, dll.

Output/Pola/Model/Knowledge

  1. Formula/Function (Rumus atau Fungsi Regresi)
    • WAKTU TEMPUH = 0.48 + 0.6 JARAK + 0.34 LAMPU + 0.2 PESANAN
  2. Decision Tree (Pohon Keputusan)
  3. Tingkat Korelasi
  4. Rule (Aturan)
    • IF ips3=2.8 THEN lulustepatwaktu
  5. Cluster (Klaster)

Kriteria Evaluasi dan Validasi Model

  1. Akurasi
    • Ukuran dari seberapa baik model mengkorelasikan antara hasil dengan atribut dalam data yang telah disediakan
    • Terdapat berbagai model akurasi, tetapi semua model akurasi tergantung pada data yang digunakan
  2. Kehandalan
    • Ukuran di mana model data mining diterapkan pada dataset yang berbeda
    • Model data mining dapat diandalkan jika menghasilkan pola umum yang sama terlepas dari data testing yang disediakan
  3. Kegunaan
    • Mencakup berbagai metrik yang mengukur apakah model tersebut memberikan informasi yang berguna

Keseimbangan diantaranya ketiganya diperlukan karena belum tentu model yang akurat adalah handal, dan yang handal atau akurat belum tentu berguna.

Tools Data Mining

KNIME

Tools Data Mining: KNIME
KNIME

Rapidminer

Tools Data Mining: Rapidminer
Rapidminer

Bagaimana proses dalam melakukan data mining ?

Proses Data Mining
Sumber : ilmukoputer.com

Berikut ini merupakan tahapan proses dalam Data mining :

Himpunan Data

Pada tahapan ini kita perlu untuk memahamai dan mempersiapkan data yang dikenal dengan istilah Data Preprocessing. Metode yang digunakan dalam Data Preprocessing yakni:

  • Data Cleaning, memeriksa data yang tidak konsisten seperti penulisan tanggal dengan format yang berbeda, contoh: 1 Januari 2020, 01/01/2020, menghilangkan nilai-nilai data yang salah, memperbaiki kekacauan data dan
  • Data Integration, menggabungkan data dari beberapa sumber seperti :database, data cube, atau jenis file lain ke dalam penyimpanan data yang sesuai.
  • Data Reduction, menguraikan data ke dalam bentuk yang lebih kecil ukurannya tetapi tetap menghasilkan hasil analitis yang sama.
  • Data Transformation, normalisasi dan pengumpulan data sehingga format data menjadi sama.

Metode Data Mining

Pada tahapan ini kita perlu memilih metode yang sesuai dengan karakter data yang dikenal dengan istilah Modeling. Beberapa metode yang ada dalam Modeling yakni :

  • Estimation, untuk menerka sebuah nilai yang belum diketahui, contoh: menerka penghasilan seseorang ketika informasi mengenai orang tersebut telah diketahui. Metode yang digunakan diantaranya: Point Estimation dan Confidence Interval Estimations, Simple Linear Regression dan Correlation, serta Multiple Regression.
  • Prediction, untuk memperkirakan nilai di masa mendatang, contoh: memprediksi stok barang untuk satu tahun ke depan. Metode yang digunakan diantaranya: Neural Network, Decision Tree, serta kNearest Neighbor.
  • Classification, yaitu menyimpulkan definisi-definisi karakteristik dalam sebuah grup. Contoh: pelanggan-pelanggan perusahaan tertentu yang telah berpindah ke perusahaan pesaing yang lain.
  • Clustering, yaitu mengindentifikasikan suatu kelompok dari berbagai produk atau barang-barang yang memiliki karakteristik khusus (clustering memiliki perbedaan dengan classification, yakni pada clustering tidak terdapat definisi untuk karakteristik awal yang diberikan pada saat classification.)
  • Association, yaitu mengidentifikasikan hubungan antara peristiwa yang terjadi pada suatu waktu, Contoh: isi-isi dari keranjang belanja.

Pengetahuan

Pada tahapan ini kita perlu memahami model dan pengetahuan yang sesuai sehingga dapat memilih model. Jenis-jenis Model yang dapat dipilih yakni:

  • Formula/Function, dapat berupa rumus atau fungsi regresi
  • Tree, Decision tree merupakan suatu metode untuk klasifikasi yang memiliki bentuk seperti struktur pohon, dimana setiap node berfungsi untuk merepresentasikan atribut dan cabangnya berfungsi untuk merepresentasikan nilai dari atribut, sedangkan setiap daunnya digunakan untuk merepresentasikan kelas.
  • Cluster, Clustering merupakan metode penganalisaan data, tujuannya yakni untuk mengelompokkan data dengan karakteristik atau pola yang sama ke suatu ‘wilayah’ yang sama dan data dengan karakteristik atau pola yang berbeda ke ‘wilayah’ yang lain.
  • Rule, Analisis asosiasi atau association rule mining merupakan sebuah teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item. Contoh untuk aturan assosiatif yakni analisa dalam pembelian di suatu pasar, untuk mengetahui seberapa besar kemungkinan untuk seorang pelanggan yang membeli telur bersamaan dengan gula.
  • Correlation, Pengelompokan korelasi menyediakan metode untuk pengelompokan sekumpulan objek ke dalam jumlah cluster yang optimal tanpa menentukan angka sebelumnya.

Evaluation

Pada tahap ini kita melakukan evaluasi terhadap Analisis Model dan Kinerja Metode. Berikut ini apa saja yang perlu dilakukan evaluasi:

  • Pembagian dataset, perbandingan 90:10 atau 80:20: Data Training, Data Testing
  • Data training untuk pembentukan suatu model, dan data testing digunakan untuk pengujian suatu model
  • Pemisahan data training dan testing
    1. Data dipisahkan secara manual
    2. Data dipisahkan otomatis dengan operator Split Data
    3. Data dipisahkan otomatis dengan X Validation
  • Kinerja Metode : Akurasi, Tingkat Erorr, dan jumlah cluster
  • Analisis Model :
    • Estimation:
      • Error: Root Mean Square Error (RMSE), MSE, dan MAPE
    • Prediction/Forecasting (Prediksi/Peramalan):
      • Error: Root Mean Square Error (RMSE) , MSE, MAPE, dll
    • Classification:
      • Confusion Matrix: Accuracy
      • ROC Curve: Area Under Curve (AUC)
    • Clustering:
      • Internal Evaluation: Davies–Bouldinindex, Dunn index,
      • External Evaluation: Rand measure, F-measure, Jaccard index, Fowlkes–Mallowsindex, Confusion matrix
    • Association:
      • Lift Charts: Lift Ratio
      • Precisionand Recall (F-measure)

Proses Data Mining berbasis CRISP-DM

Dunia industri yang beragam bidangnya memerlukan proses yang standard yang mampu mendukung penggunaan data mining untuk menyelesaikan masalah bisnis. Berdasarkan ‘best practice’, praktisi-praktisi dan peneliti Data Mining mengusulkan beberapa proses seperti workflow atau pendekatan dengan tahapan-tahapan yang sederhana untuk memperbesar peluang keberhasilan dalam melaksanakan berbagai projek dalam Data Mining. Usaha-usaha tersebut menghasilkan beberapa proses yang dijadikan sebagai standard, salah satu yang sudah terstandarisasi dan termasuk terpopuler yakni Metodologi Cross-Industry Standard Process for Data Mining (CRISP-DM).

Baca Juga: Metodologi CRISP-DM Beserta Contoh Kasusnya.

Persiapan Data Mining

Data Cleaning

Dalam data mining, persiapan data merupakan langkah awal untuk melakukan proses data mining. Proses ini dikenal dengan istilah data preprocessing. Dalam persiapan data atau data preprocessing terdapat empat tahapan, yakni : Data cleaning, data reduction, data transformation dan data integration. Apabila dikaitkan dengan metodologi CRISP-DM, maka persiapan data berada pada tahap ketiga yakni data preparation.

Baca Juga: Persiapan Data Dalam Data Mining: Data Cleaning.

Data Reduction

Pertumbuhan yang pesat dari akumulasi data telah menciptakan kondisi di mana data berlimpah tapi informasinya sedikit. Data preprocessing merupakan salah satu metode untuk mengatasi masalah tersebut. Salah satu bagian dalam data preprocessing adalah data reduction (reduksi data), yang merupakan suatu teknik yang dapat diterapkan untuk memperoleh hasil reduksi dari sejumlah dataset dengan jumlah volume data yang lebih kecil.

Baca Juga: Persiapan Data Dalam Data Mining: Data Reduction.

Data Transformation

Data transformation merupakan tahap ketiga dalam persiapan data dalam data processing . Data Transformation adalah tahapan di mana data ditransformasikan dan dikonsolidasikan ke dalam bentuk yang sesuai untuk mining (Han dkk.,2012). Menurut Junaedi dkk. (2011), dalam data transformation, terdapat beberapa operasi/teknik untuk melakukan transformasi data, yaitu normalization, discretization, smoothing, attribute construction, dan aggregation.

Baca Juga: Persiapan Data Dalam Data Mining: Data Transformation.

Data Integration

Data integration merupakan tahap keempat dalam persiapan data dalam data mining. Pada tahap data integration ini data yang sebelumnya telah melalui proses data cleaning, data reduction dan data transfotmation akan diintegrasikan dan dikombinasikan.

Baca Juga: Persiapan Data Dalam Data Mining: Data Integration.

Algoritma Data Mining

Algoritma Klasifikasi

Klasifikasi merupakan teknik dalam data mining untuk mengelompokkan data berdasarkan keterikatan data terhadap data sampel. Dalam klasifikasi terdapat beberapa algoritma yang dapat digunakan yakni Decision Tree, Bayesian Classification dan Neural Network.

Baca Juga:
Algoritma Classification dalam Data Mining: Decision Tree
Klasifikasi Naive Bayes (Bayesian Classification)
Neural Network (Jaringan Syaraf) untuk Klasifikasi

Algoritma Klastering

Analisis klastering (Clustering) merupakan salah satu aktifitas analisis data yakni klasifikasi atau pengelompokan data ke dalam beberapa kategori/cluster. Obyek-obyek/data yang dikelompokkan ke dalam suatu group memiliki ciri-ciri yang sama berdasarkan kriteria tertentu. Clustering sering digunakan sebagai alat yang berdiri sendiri untuk mendapatkan wawasan tentang distribusi data dan sebagai langkah preprocessing untuk algoritma lain.

Baca Juga :
Algoritma Clustering dalam Data Mining: Metode Partisi
Metode Clustering: hierarki, Density-Based dan Grid-Based

Algoritma Asosiasi

Algoritma asosiasi data mining merupakan suatu bentuk algoritma yang memberikan informasi tentang hubungan antar item data di dalam database. Salah satu pemanfaatan algoritma asosiasi untuk proses bisnis diantaranya dalam proses penjualan.

Baca Juga: Asosiasi Data Mining: Algoritma Apriori dan FP Growth

Algoritma Estimasi dan Forecasting

Algoritma Estimasi merupakan metode paling tepat untuk menyelesaikan yang berkaitan dengan memperkirakan seberapa banyak hasil produksi. Estimasi sendiri memiliki beberapa keunggulan diantara lain dapat memprediksi data time series dari beberapa tahun tertentu,yang dirangkum dan dihitung sehingga menghasilkan prediksi yang akan datang dengan hasil berupa persentase (Rohman dan Ami, 2008).

Time Series Forecasting adalah salah satu teknik analisis prediktif paling tua yang diketahui. Teknik ini telah ada dan telah digunakan secara luas bahkan sebelum istilah “analytics prediktif” pernah diciptakan. Algoritma forecasting (prediksi) sama dengan algoritma estimasi di mana label/target/class bertipe numerik, bedanya adalah data yang digunakan merupakan data rentet waktu (data time series). Variabel independen atau prediktor tidak sepenuhnya diperlukan untuk Time Series Forecasting univariat, tetapi sangat disarankan untuk deret waktu multivarian. Metode Time Series Forecasting yakni Metode Data Driven dan Metode Model Driven.

Baca Juga:
Algoritma Estimasi dalam Data Mining: Linear Regression
Time Series Forecasting Untuk Prediksi Dalam Data Mining

Beberapa Pertanyaan tentang Data Mining

Sebutkan 5 peran utama data mining!

  1. Estimation
  2. Prediction
  3. Classification
  4. Clustering
  5. Association

Algoritma apa saja yang dapat digunakan untuk peran utama data mining?

  • Estimation (Estimasi):
    – Linear Regression, Neural Network, Support Vector Machine, dll
  • Prediction/Forecasting (Prediksi/Peramalan):
    – Linear Regression, Neural Network, Support Vector Machine, dll
  • Classification (Klasifikasi):
    – Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Random Forest, Linear Discriminant Analysis, Neural Network, dll
  • Clustering (Klastering):
    – K-Means, K-Medoids, Self-Organizing Map (SOM), Fuzzy C-Means, dll
  • Association (Asosiasi):
    – FP-Growth, Apriori, dll

Jelaskan perbedaan estimasi dan prediksi!

Algoritma prediksi/forecasting sama dengan algoritma estimasi di mana label/target/class bertipe numerik, bedanya adalah data yang digunakan merupakan data rentet waktu (data time series)

Jelaskan perbedaan estimasi dan klasifikasi!

Algoritma estimasi mirip dengan algoritma klasifikasi, tapi variabel target adalah berupa bilangan numerik (kontinyu) dan bukan kategorikal (nominal atau diskrit).

Jelaskan perbedaan klasifikasi dan klastering!

Perbedaan utama algoritma klastering dengan klasifikasi adalah klastering tidak memiliki target/class/label, jadi termasuk unsupervised learning

Jelaskan perbedaan klastering dan prediksi!

Klastering adalah pengelompokkan data, hasil observasi dan kasus ke dalam class yang mirip. Sedangkan Istilah prediksi kadang digunakan juga untuk klasifikasi, tidak hanya untuk prediksi time series, karena sifatnya yang bisa menghasilkan class berdasarkan berbagai atribut yang kita sediakan.

Jelaskan perbedaan supervised dan unsupervised learning!

Supervised learning adalah sebuah pendekatan yang mana sudah terdapat data training dan terdapat variable yang ditargetkan sehingga tujuan dari supervised leraning ini adalah mengkelompokan suatu data ke data yang sudah ada. Sedangkan untuk unsupervised learning, pendekatan ini tidak memiliki data training, sehingga dari data yang ada, akan dikelompokkan menjadi 2 bagian atau 3 bagian data dan seterusnya.

Sebutkan tahapan utama proses data mining!

  1. Input (Himpunan Data)
  2. Metode (Algoritma Data Mining)
  3. Output (Pola/Model)
  4. Evaluation (Analisis Model dan Kinerja Metode)

Itulah informasi tentang Memahami Konsep Data Mining Beserta Prosesnya, Kamu bisa mempelajari tentang Data Mining untuk mendapatkan dan mengumpulkan informasi/data yang berguna untuk masa depan.

Tinggalkan komentar

error: Content is protected !!