Halo teman-teman, kembali lagi nih melanjutkan untuk Seri-3 pembahasan
tentang perbedaan dari AI, ML, JST dan Deep Learning. kali ini akan dibahas
tentang salah satu varian dari multilayer perception neural network, yaitu Deep
Learning. Buat teman-teman yang ketinggalan seri sebelumnya bisa cek di halaman
website ini juga. Sejarah deep learning dimulai pada tahun
2006, yaitu setelah Geoffrey Hinton mempublikasikan paper yang
memperkenalkan salah satu varian neural network yang
disebut deep belief nets. Paper ini merupakan awal
kemunculan istilah deep learning, untuk membedakan
arsitektur neural network konvensional (single layer) dengan
arsitektur neural network multi/banyak layer [1]. Deep Learning adalah salah satu cabang machine learning yang
menggunakan Deep Neural Network untuk menyelesaikan
permasalahan pada domain machine learning. Sayangnya ide deep
learning masih belum populer di waktu itu, disebabkan algoritma deep
learning sangat kompleks, sehingga membutuhkan komputer dengan
spesifikasi tinggi yang belum dapat dipenuhi saat itu. Arsitektur AI, ML dan Deep Learning Pada tahun 2009, Andrew memperkenalkan penggunaan GPU untuk deep
learning melalui paper yang berjudul Large-scale
Deep Unsupervised Learning using Graphics Processors. Dengan menggunakan
GPU, algoritma deep learning dapat dijalankan lebih cepat
dibanding dengan tanpa GPU (hanya menggunakan GPU). Perkembangaan deep
learning maju pesat berkat keberadaan hardware yang
memadai. Dan saat ini, deep learning sudah banyak
diaplikasikan di berbagai area, seperti pengenal wajah, self-driving
car, pengenal suara dll [2]. Bentuk diagram network model deep learning dapat
dilihat seperti di bawah ini. Perhatikan bahwa hidden layer hanya
digambarkan dua lapis saja. Padahal kenyataannya bisa berjumlah sangat banyak
(Misal mencapai ribuan buah). Diagram Network Model Deep Learning
Deep learning sudah dikembangkan ke berbagai model atau
arsitektur yang berbeda-beda. Berikut daftar beberapa model atau arsitektur
untuk deep learning.
Reccurent Neural Networks (RNN) Reccurent Neural Network adalah model popular yang sangat menjanjikan
untuk mengerjakan tugas sebagai Natural Language Processing (NLP) [3]. Intinya
adalah model RNN digunakan agar mesin dapat memahami bahasa manusia. Mulai dari
cara berkomunikasi, mendengarkan, mengenali percakapan, hingga memahami tata
bahasa dan aksen. RNN dapat diimplementasikan juga untuk mengenali gambar —
gambar atau objek. Diagram Reccureent Neural Network
Convolutional Neural Networks (CNN) Algoritma Convolution Neural Network adalah sebuah MLP
(Multi Layer Perceptron) yang didesain secara khusus untuk
mengidentifikasi image/gambar dua dimensi. CNN meniru cara kerja
otak manusia untuk mengenali objek yang dilihatnya. Dengan bantuan CNN, kini
komputer dapat “melihat” dan “membedakan” berbagai objek. Fitur ini
disebut Image Recognation. Secara garis besar CNN tidak jauh berbeda dengan neural network biasa.
CNN terdiri dari neuron-neuron yang memiliki weight, bias dan activation
function. Sedangkan algoritma CNN secara sederhana dapat dijelaskan sebagai
berikut: 1. Membaca dataset berupa gambar (input game) 2. Memecah gambar menjadi beberapa gambar berukuran kecil (exract region) 3. Melakukan perhitungan dengan algoritma CNN (compute CNN
feature) 4. Melakukan klasifikasi (class) CNN Architecture
Haar Hascade Salah satu algoritma yang dapat digunakan dalam mendeteksi wajah adalah
Haar Cascade Classifier. Haar Cascade Classifier atau Haar Like Fiture atau
algoritma Viola-Jones merupakan suatu algoritma yang biasa digunakan untuk
mendeteksi objek pada citra digital, salah satunya adalah wajah. Haar like
fiture adalah suatu fitur berbentuk persegi (rectangular fitures) yang
memberikan indikasi secara spesifik pada sebuah citra. Nama haar berasal dari
suatu fungsi matematika yaitu Haar Wavelet. Pada awalnya, algoritma ini
digunakan untuk mengolah citra yang dilihat dari nilai RGB pada setiap
pikselnya, namun tidak efektif. Kemudian viola- jones mengembangkannya sehingga
terbentuk nama haar like fiture. Haar Like Feature
Haar like fiture dikenal juga dengan istilah haar cascade classifier.
Konsep yang digunakan pada algoritma ini adalah mendeteksi objek berdasarkan
nilai sederhana dari fitur[4]. Setiap fitur terdiri dari warna hitam. Nilai
fitur didapatkan dari hasil operasi pengurangan antara nilai piksel pada area
hitam dengan nilai piksel pada area putih ataupun sebaliknya. Didalam fitur
tersebut berisi piksel-piksel citra dengan jumlah dan nilai tertentu. Salah
satu kelebihan dari pendeteksian dengan menggunakan fitur adalah pemrosesannya
lebih cepat dibandingkan dengan penggunaan piksel.
Deep Belief Networks (DBN) Deep Belief Networks merupakan model deep learning yang memanfaatkan
tumpukan/stack Restricted Boltzmann Machines (RBM) atau kadangkala
Autoencoders. Autoencoder adalah model neural network yang memiliki input dan
output yang sama. Autoencoder mempelajari data input dan berusaha untuk
melakukan rekonstruksi terhadap data input tersebut. DBM terdiri atas multiple layers dari latent variables (hidden units),
dimana masing-masing RBM layer saling terhubung, namun node intra RBM layer
tidak saling terhubung dengan node intra RBM layer tidak saling terhubung
dengan node intra RBM lainnya.
You Only Look Once (YOLO) YOLO merupakan arsitektur deep learning yang masih dibilang terbaru.
YOLO merupakan algoritma object detection yang digunakan pada aplikasi ini.
YOLO merupakan algoritma berdasarkan pada regression (regresi) dimana alih-alih
memilih bagian interistring pada suatu gambar, algoritma ini memprediksi kelas
dan bounding box (kotak pembatas) untuk keseluruhan gambar dalam satu proses
running algoritma. YOLO biasa digunakan untuk mendeteksi objek secara real
time. Akhirnya kita udah bahas semuanya yah. Ada satu algoritma deep learning yang paling menarik, yaitu YOLO (You Only Look Once). Selanjutnya akan dibahas kehebatan dari YOLO ini. Akan dimulai dari membahas framework yang digunakan untuk menjalankan YOLO dan contoh pengaplikasiannya. Terimakasih untuk teman-teman semua yang udah mampir untuk baca artikel ini.
Referensi : 1.
Primartha, Rifkie. (2018). Belajar Machine Learning
Teori dan Praktik. Bandung: Informatika. 2.
Osinder, Simon. Teh, Yee-Whye. Hinton, Geoffrey. A
Fast Learning Algorithm for Deep Belief Nets. Neural Computation. 2006. 3.
Sak, Hasim; Senior, Andrew; Beaufays, Francoise
(2014). “Long
Short-Term Memory recurrent neural network architectures for large scale
acoustic modeling. 4.
Viola and Jones, “Rapid
object detection using a boosted cascade of simple features”, Computer cool
Vision and Pattern
Recognition, 2001.
Sumber: Haiqal Muhamad Alfarisi https://haiqalmuhamadalfarisi.medium.com
|