Halo teman-teman, kembali lagi nih melanjutkan untuk Seri-3 pembahasan tentang perbedaan dari AI, ML, JST dan Deep Learning. kali ini akan dibahas tentang salah satu varian dari multilayer perception neural network, yaitu Deep Learning. Buat teman-teman yang ketinggalan seri sebelumnya bisa cek di halaman website ini juga.

Sejarah deep learning dimulai pada tahun 2006, yaitu setelah Geoffrey Hinton mempublikasikan paper yang memperkenalkan salah satu varian neural network yang disebut deep belief netsPaper ini merupakan awal kemunculan istilah deep learning, untuk membedakan arsitektur neural network konvensional (single layer) dengan arsitektur neural network multi/banyak layer [1].

Deep Learning adalah salah satu cabang machine learning yang menggunakan Deep Neural Network untuk menyelesaikan permasalahan pada domain machine learning. Sayangnya ide deep learning masih belum populer di waktu itu, disebabkan algoritma deep learning sangat kompleks, sehingga membutuhkan komputer dengan spesifikasi tinggi yang belum dapat dipenuhi saat itu.


Arsitektur AI, ML dan Deep Learning

Pada tahun 2009, Andrew memperkenalkan penggunaan GPU untuk deep learning melalui paper yang berjudul Large-scale Deep Unsupervised Learning using Graphics Processors. Dengan menggunakan GPU, algoritma deep learning dapat dijalankan lebih cepat dibanding dengan tanpa GPU (hanya menggunakan GPU). Perkembangaan deep learning maju pesat berkat keberadaan hardware yang memadai. Dan saat ini, deep learning sudah banyak diaplikasikan di berbagai area, seperti pengenal wajah, self-driving car, pengenal suara dll [2].

Bentuk diagram network model deep learning dapat dilihat seperti di bawah ini. Perhatikan bahwa hidden layer hanya digambarkan dua lapis saja. Padahal kenyataannya bisa berjumlah sangat banyak (Misal mencapai ribuan buah).


Diagram Network Model Deep Learning

 

Deep learning sudah dikembangkan ke berbagai model atau arsitektur yang berbeda-beda. Berikut daftar beberapa model atau arsitektur untuk deep learning.

 

Reccurent Neural Networks (RNN)

Reccurent Neural Network adalah model popular yang sangat menjanjikan untuk mengerjakan tugas sebagai Natural Language Processing (NLP) [3]. Intinya adalah model RNN digunakan agar mesin dapat memahami bahasa manusia. Mulai dari cara berkomunikasi, mendengarkan, mengenali percakapan, hingga memahami tata bahasa dan aksen. RNN dapat diimplementasikan juga untuk mengenali gambar — gambar atau objek.


Diagram Reccureent Neural Network

 

Convolutional Neural Networks (CNN)

Algoritma Convolution Neural Network adalah sebuah MLP (Multi Layer Perceptron) yang didesain secara khusus untuk mengidentifikasi image/gambar dua dimensi. CNN meniru cara kerja otak manusia untuk mengenali objek yang dilihatnya. Dengan bantuan CNN, kini komputer dapat “melihat” dan “membedakan” berbagai objek. Fitur ini disebut Image Recognation.

Secara garis besar CNN tidak jauh berbeda dengan neural network biasa. CNN terdiri dari neuron-neuron yang memiliki weightbias dan activation function. Sedangkan algoritma CNN secara sederhana dapat dijelaskan sebagai berikut:

1. Membaca dataset berupa gambar (input game)

2. Memecah gambar menjadi beberapa gambar berukuran kecil (exract region)

3. Melakukan perhitungan dengan algoritma CNN (compute CNN feature)

4. Melakukan klasifikasi (class)


CNN Architecture

 

Haar Hascade

Salah satu algoritma yang dapat digunakan dalam mendeteksi wajah adalah Haar Cascade Classifier. Haar Cascade Classifier atau Haar Like Fiture atau algoritma Viola-Jones merupakan suatu algoritma yang biasa digunakan untuk mendeteksi objek pada citra digital, salah satunya adalah wajah. Haar like fiture adalah suatu fitur berbentuk persegi (rectangular fitures) yang memberikan indikasi secara spesifik pada sebuah citra. Nama haar berasal dari suatu fungsi matematika yaitu Haar Wavelet. Pada awalnya, algoritma ini digunakan untuk mengolah citra yang dilihat dari nilai RGB pada setiap pikselnya, namun tidak efektif. Kemudian viola- jones mengembangkannya sehingga terbentuk nama haar like fiture.


Haar Like Feature

 

Haar like fiture dikenal juga dengan istilah haar cascade classifier. Konsep yang digunakan pada algoritma ini adalah mendeteksi objek berdasarkan nilai sederhana dari fitur[4]. Setiap fitur terdiri dari warna hitam. Nilai fitur didapatkan dari hasil operasi pengurangan antara nilai piksel pada area hitam dengan nilai piksel pada area putih ataupun sebaliknya. Didalam fitur tersebut berisi piksel-piksel citra dengan jumlah dan nilai tertentu. Salah satu kelebihan dari pendeteksian dengan menggunakan fitur adalah pemrosesannya lebih cepat dibandingkan dengan penggunaan piksel.

 

Deep Belief Networks (DBN)

Deep Belief Networks merupakan model deep learning yang memanfaatkan tumpukan/stack Restricted Boltzmann Machines (RBM) atau kadangkala Autoencoders. Autoencoder adalah model neural network yang memiliki input dan output yang sama. Autoencoder mempelajari data input dan berusaha untuk melakukan rekonstruksi terhadap data input tersebut.

DBM terdiri atas multiple layers dari latent variables (hidden units), dimana masing-masing RBM layer saling terhubung, namun node intra RBM layer tidak saling terhubung dengan node intra RBM layer tidak saling terhubung dengan node intra RBM lainnya.

 

You Only Look Once (YOLO)

YOLO merupakan arsitektur deep learning yang masih dibilang terbaru. YOLO merupakan algoritma object detection yang digunakan pada aplikasi ini. YOLO merupakan algoritma berdasarkan pada regression (regresi) dimana alih-alih memilih bagian interistring pada suatu gambar, algoritma ini memprediksi kelas dan bounding box (kotak pembatas) untuk keseluruhan gambar dalam satu proses running algoritma. YOLO biasa digunakan untuk mendeteksi objek secara real time.

Akhirnya kita udah bahas semuanya yah. Ada satu algoritma deep learning yang paling menarik, yaitu YOLO (You Only Look Once). Selanjutnya akan dibahas kehebatan dari YOLO ini. Akan dimulai dari membahas framework yang digunakan untuk menjalankan YOLO dan contoh pengaplikasiannya. Terimakasih untuk teman-teman semua yang udah mampir untuk baca artikel ini.  

 

Referensi :

1.      Primartha, Rifkie. (2018). Belajar Machine Learning Teori dan Praktik. Bandung: Informatika.

2.      Osinder, Simon. Teh, Yee-Whye. Hinton, Geoffrey. A Fast Learning Algorithm for Deep Belief Nets. Neural Computation. 2006.

3.      Sak, Hasim; Senior, Andrew; Beaufays, Francoise (2014). “Long Short-Term Memory recurrent neural network architectures for large scale acoustic modeling.

4.      Viola and Jones, “Rapid object detection using a boosted cascade of simple features”, Computer cool Vision and Pattern Recognition, 2001.

 

Sumber:

Haiqal Muhamad Alfarisi

https://haiqalmuhamadalfarisi.medium.com

 

 Copyright stekom.ac.id 2018 All Right Reserved