Pembelajaran mesin adalah cabang  kecerdasan buatan (AI)  dan ilmu komputer yang berfokus pada penggunaan data dan algoritme untuk meniru cara manusia belajar, secara bertahap meningkatkan akurasinya. IBM memiliki  sejarah yang kaya  dengan pembelajaran mesin. Salah satunya, Arthur Samuel, dikreditkan karena menciptakan istilah, "pembelajaran mesin" dengan penelitiannya  (  PDF, 481 KB) (tautan berada di luar IBM) seputar permainan catur. Robert Nealey, master catur yang memproklamirkan diri, memainkan permainan di komputer IBM 7094 pada tahun 1962, dan dia kalah dari komputer. Dibandingkan dengan apa yang bisa dilakukan hari ini, prestasi ini tampak sepele, tetapi dianggap sebagai tonggak utama di bidang kecerdasan buatan. Selama beberapa dekade terakhir, kemajuan teknologi dalam penyimpanan dan kekuatan pemrosesan telah memungkinkan beberapa produk inovatif berdasarkan pembelajaran mesin, seperti mesin rekomendasi Netflix dan mobil self-driving.

Pembelajaran mesin adalah komponen penting dari bidang ilmu data yang berkembang. Melalui penggunaan metode statistik, algoritme dilatih untuk membuat klasifikasi atau prediksi, dan mengungkap wawasan kunci dalam proyek penambangan data. Wawasan ini selanjutnya mendorong pengambilan keputusan dalam aplikasi dan bisnis, yang secara ideal berdampak pada metrik pertumbuhan utama. Saat big data terus berkembang dan tumbuh, permintaan pasar akan ilmuwan data akan meningkat. Mereka akan diminta untuk membantu mengidentifikasi pertanyaan bisnis yang paling relevan dan data untuk menjawabnya.

Algoritme pembelajaran mesin biasanya dibuat menggunakan kerangka kerja yang mempercepat pengembangan solusi, seperti TensorFlow dan PyTorch.

Pembelajaran Mesin vs. Pembelajaran Mendalam vs. Jaringan Neural

Karena deep learning dan machine learning cenderung digunakan secara bergantian, perlu diperhatikan nuansa di antara keduanya. Pembelajaran mesin, pembelajaran mendalam, dan jaringan saraf semuanya adalah sub-bidang kecerdasan buatan. Namun, jaringan saraf sebenarnya adalah sub-bidang pembelajaran mesin, dan pembelajaran mendalam adalah sub-bidang jaringan saraf.

Perbedaan antara deep learning dan machine learning terletak pada cara masing-masing algoritme belajar. Machine learning "Deep" dapat menggunakan kumpulan data berlabel, juga dikenal sebagai pembelajaran terawasi, untuk menginformasikan algoritmenya, tetapi tidak selalu memerlukan kumpulan data berlabel. Pembelajaran mendalam dapat menyerap data tidak terstruktur dalam bentuk mentahnya (misalnya, teks atau gambar), dan dapat secara otomatis menentukan kumpulan fitur yang membedakan berbagai kategori data satu sama lain. Ini menghilangkan beberapa intervensi manusia yang diperlukan dan memungkinkan penggunaan set data yang lebih besar. Anda dapat menganggap pembelajaran mendalam sebagai "pembelajaran mesin yang dapat diskalakan" seperti yang dicatat Lex Fridman dalam  kuliah MIT ini (01:08:05)  (tautan berada di luar IBM).

Pembelajaran mesin klasik, atau "tidak mendalam", lebih bergantung pada intervensi manusia untuk belajar. Pakar manusia menentukan kumpulan fitur untuk memahami perbedaan antara input data, biasanya membutuhkan data yang lebih terstruktur untuk dipelajari.

Jaringan saraf, atau jaringan syaraf tiruan (JST), terdiri dari lapisan simpul, yang berisi lapisan masukan, satu atau lebih lapisan tersembunyi, dan lapisan keluaran. Setiap node, atau neuron buatan, terhubung ke yang lain dan memiliki bobot dan ambang yang terkait. Jika output dari setiap node berada di atas nilai ambang yang ditentukan, node tersebut diaktifkan, mengirim data ke lapisan jaringan berikutnya. Jika tidak, tidak ada data yang diteruskan ke lapisan jaringan berikutnya oleh node tersebut. "Deep" dalam pembelajaran mendalam hanya mengacu pada jumlah lapisan dalam jaringan saraf. Jaringan saraf yang terdiri dari lebih dari tiga lapisan—yang mencakup input dan output—dapat dianggap sebagai algoritme pembelajaran mendalam atau jaringan saraf dalam. Jaringan saraf yang hanya memiliki tiga lapisan hanyalah jaringan saraf dasar.

Pembelajaran mendalam dan jaringan saraf dikreditkan dengan mempercepat kemajuan di berbagai bidang seperti visi komputer, pemrosesan bahasa alami, dan pengenalan suara.

Lihat postingan blog “ AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: Apa Bedanya? ” untuk melihat lebih dekat bagaimana berbagai konsep berhubungan.

Cara kerja pembelajaran mesin

UC Berkeley  (tautan berada di luar IBM) membagi sistem pembelajaran dari algoritma pembelajaran mesin menjadi tiga bagian utama.

  1. Proses Keputusan: Secara umum, algoritma pembelajaran mesin digunakan untuk membuat prediksi atau klasifikasi. Berdasarkan beberapa data masukan, yang dapat diberi label atau tidak diberi label, algoritme Anda akan menghasilkan perkiraan tentang suatu pola dalam data.
  2. Fungsi Kesalahan: Fungsi kesalahan mengevaluasi prediksi model. Jika ada contoh yang diketahui, fungsi error dapat membuat perbandingan untuk menilai akurasi model.
  1. Proses Optimasi Model: Jika model dapat lebih cocok dengan titik data dalam set pelatihan, maka bobot disesuaikan untuk mengurangi perbedaan antara contoh yang diketahui dan perkiraan model. Algoritme akan mengulangi proses "evaluasi dan optimalkan" ini, memperbarui bobot secara mandiri hingga ambang akurasi tercapai.  

Metode pembelajaran mesin

Model pembelajaran mesin terbagi dalam tiga kategori utama.

Pembelajaran mesin yang diawasi            

Pembelajaran terawasi , juga dikenal sebagai pembelajaran mesin terawasi, didefinisikan dengan penggunaan kumpulan data berlabel untuk melatih algoritme guna mengklasifikasikan data atau memprediksi hasil secara akurat. Saat data masukan dimasukkan ke dalam model, model menyesuaikan bobotnya hingga sesuai. Hal ini terjadi sebagai bagian dari proses validasi silang untuk memastikan bahwa model terhindar dari  overfitting  atau  underfitting . Pembelajaran yang diawasi membantu organisasi memecahkan berbagai masalah dunia nyata dalam skala besar, seperti mengklasifikasikan spam dalam folder terpisah dari kotak masuk Anda. Beberapa metode yang digunakan dalam supervised learning antara lain neural network, naïve bayes, regresi linier, regresi logistik, random forest, dan support vector machine (SVM).

Pembelajaran mesin tanpa pengawasan

Pembelajaran tanpa pengawasan , juga dikenal sebagai pembelajaran mesin tanpa pengawasan, menggunakan algoritme pembelajaran mesin untuk menganalisis dan mengelompokkan kumpulan data yang tidak berlabel. Algoritme ini menemukan pola tersembunyi atau pengelompokan data tanpa perlu campur tangan manusia. Kemampuan metode ini untuk menemukan kesamaan dan perbedaan informasi membuatnya ideal untuk analisis data eksplorasi, strategi penjualan silang, segmentasi pelanggan, dan pengenalan citra dan pola. Ini juga digunakan untuk mengurangi jumlah fitur dalam model melalui proses pengurangan dimensi. Analisis komponen utama (PCA) dan dekomposisi nilai singular (SVD) adalah dua pendekatan umum untuk ini. Algoritme lain yang digunakan dalam pembelajaran tanpa pengawasan termasuk jaringan saraf, pengelompokan k-means, dan metode pengelompokan probabilistik.

Pembelajaran semi-diawasi 

Pembelajaran semi-diawasi menawarkan media yang menyenangkan antara pembelajaran yang diawasi dan tidak diawasi. Selama pelatihan, ini menggunakan kumpulan data berlabel yang lebih kecil untuk memandu klasifikasi dan ekstraksi fitur dari kumpulan data yang lebih besar dan tidak berlabel. Pembelajaran semi-diawasi dapat memecahkan masalah tidak adanya cukup data berlabel untuk algoritme pembelajaran yang diawasi. Ini juga membantu jika terlalu mahal untuk melabeli data yang cukup. 

Untuk mengetahui lebih dalam tentang perbedaan antara pendekatan-pendekatan ini, lihat " Pembelajaran Terbimbing vs. Tanpa Pengawasan: Apa Perbedaannya? "

Penguatan pembelajaran mesin

Pembelajaran mesin penguatan adalah model pembelajaran mesin yang mirip dengan pembelajaran terawasi, tetapi algoritmenya tidak dilatih menggunakan data sampel. Model ini belajar sambil berjalan dengan menggunakan trial and error. Urutan hasil yang sukses akan diperkuat untuk mengembangkan rekomendasi atau kebijakan terbaik untuk masalah tertentu.

Sistem IBM Watson® yang memenangkan  Jeopardy!  tantangan pada tahun 2011 adalah contoh yang baik. Sistem ini  menggunakan pembelajaran penguatan  untuk mempelajari kapan harus mencoba jawaban (atau pertanyaan, seolah-olah), kotak mana yang harus dipilih di papan tulis, dan berapa banyak yang harus dipertaruhkan—terutama pada ganda harian.

Pelajari lebih lanjut tentang pembelajaran penguatan.          

Algoritma pembelajaran mesin umum

Sejumlah algoritma pembelajaran mesin yang umum digunakan. Ini termasuk:

  • Jaringan saraf:  Jaringan saraf mensimulasikan cara kerja otak manusia, dengan sejumlah besar node pemrosesan yang terhubung. Jaringan saraf pandai mengenali pola dan memainkan peran penting dalam aplikasi termasuk terjemahan bahasa alami, pengenalan gambar, pengenalan ucapan, dan pembuatan gambar.
  • Regresi linier:  Algoritma ini digunakan untuk memprediksi nilai numerik, berdasarkan hubungan linier antara nilai yang berbeda. Misalnya, teknik tersebut dapat digunakan untuk memprediksi harga rumah berdasarkan data historis untuk wilayah tersebut.
  • Regresi logistik:  Algoritme pembelajaran terawasi ini membuat prediksi untuk variabel respons kategorikal, seperti jawaban “ya/tidak” untuk pertanyaan. Ini dapat digunakan untuk aplikasi seperti mengklasifikasikan spam dan kontrol kualitas pada lini produksi.
  • Clustering:  Menggunakan pembelajaran tanpa pengawasan, algoritma clustering dapat mengidentifikasi pola dalam data sehingga dapat dikelompokkan. Komputer dapat membantu ilmuwan data dengan mengidentifikasi perbedaan antara item data yang diabaikan manusia.
  • Pohon keputusan:  Pohon keputusan dapat digunakan untuk memprediksi nilai numerik (regresi) dan mengklasifikasikan data ke dalam kategori. Pohon keputusan menggunakan urutan percabangan dari keputusan terkait yang dapat direpresentasikan dengan diagram pohon. Salah satu keuntungan pohon keputusan adalah mudah divalidasi dan diaudit, tidak seperti kotak hitam jaringan saraf.
  • Hutan acak:  Di hutan acak, algoritme pembelajaran mesin memprediksi nilai atau kategori dengan menggabungkan hasil dari sejumlah pohon keputusan.

Kasus penggunaan pembelajaran mesin dunia nyata

Berikut adalah beberapa contoh pembelajaran mesin yang mungkin Anda temui setiap hari:

Pengenalan ucapan:  Ini juga dikenal sebagai pengenalan ucapan otomatis (ASR), pengenalan ucapan komputer, atau ucapan-ke-teks, dan ini adalah kemampuan yang menggunakan pemrosesan bahasa alami (NLP) untuk menerjemahkan ucapan manusia ke dalam format tertulis. Banyak perangkat seluler menggabungkan pengenalan suara ke dalam sistem mereka untuk melakukan pencarian suara—mis. Siri—atau meningkatkan aksesibilitas untuk mengirim SMS.

Layanan pelanggan:   Layanan pelanggan: Obrolan online menggantikan agen manusia di sepanjang perjalanan pelanggan, mengubah cara kami berpikir tentang keterlibatan pelanggan di seluruh situs web dan platform media sosial. Chatbots menjawab pertanyaan umum (FAQ) tentang topik seperti pengiriman, atau memberikan saran yang dipersonalisasi, penjualan silang produk, atau menyarankan ukuran untuk pengguna. Contohnya termasuk  agen virtual  di situs e-niaga; bot perpesanan, menggunakan Slack dan Facebook Messenger; dan tugas biasanya dilakukan oleh asisten virtual dan asisten suara.

Visi komputer:  Teknologi AI ini memungkinkan komputer memperoleh informasi bermakna dari gambar digital, video, dan input visual lainnya, lalu mengambil tindakan yang sesuai. Didukung oleh jaringan saraf convolutional, visi komputer memiliki aplikasi dalam penandaan foto di media sosial, pencitraan radiologi dalam perawatan kesehatan, dan mobil self-driving dalam industri otomotif. 

Mesin rekomendasi:  Dengan menggunakan data perilaku konsumsi masa lalu, algoritme AI dapat membantu menemukan tren data yang dapat digunakan untuk mengembangkan strategi penjualan silang yang lebih efektif. Pendekatan ini digunakan oleh pengecer online untuk membuat rekomendasi produk yang relevan kepada pelanggan selama proses checkout.

Perdagangan saham otomatis:  Dirancang untuk mengoptimalkan portofolio saham, platform perdagangan frekuensi tinggi yang digerakkan oleh AI menghasilkan ribuan atau bahkan jutaan perdagangan per hari tanpa campur tangan manusia.

Deteksi penipuan:  Bank dan lembaga keuangan lainnya dapat menggunakan pembelajaran mesin untuk menemukan transaksi yang mencurigakan. Pembelajaran yang diawasi dapat melatih model menggunakan informasi tentang transaksi penipuan yang diketahui. Deteksi anomali dapat mengidentifikasi transaksi yang terlihat tidak biasa dan perlu diselidiki lebih lanjut.

Tantangan pembelajaran mesin

Seiring perkembangan teknologi pembelajaran mesin, hal itu tentunya membuat hidup kita lebih mudah. Namun, menerapkan pembelajaran mesin dalam bisnis juga menimbulkan sejumlah masalah etika tentang teknologi AI. Beberapa di antaranya:

Singularitas teknologi

Sementara topik ini mendapat banyak perhatian publik, banyak peneliti tidak peduli dengan gagasan AI yang melampaui kecerdasan manusia dalam waktu dekat. Singularitas teknologi juga disebut sebagai AI yang kuat atau superintelligence. Filsuf Nick Bostrum mendefinisikan superintelligence sebagai "kecerdasan apa pun yang mengungguli otak manusia terbaik di hampir semua bidang, termasuk kreativitas ilmiah, kebijaksanaan umum, dan keterampilan sosial." Terlepas dari kenyataan bahwa superintelijen tidak akan segera muncul di masyarakat, gagasan tentangnya menimbulkan beberapa pertanyaan menarik saat kita mempertimbangkan penggunaan sistem otonom, seperti mobil yang dapat mengemudi sendiri. Tidak realistis untuk berpikir bahwa mobil tanpa pengemudi tidak akan pernah mengalami kecelakaan, tetapi siapa yang bertanggung jawab dan bertanggung jawab dalam keadaan seperti itu? Haruskah kita tetap mengembangkan kendaraan otonom, atau apakah kita membatasi teknologi ini pada kendaraan semi-otonom yang membantu orang berkendara dengan aman? Juri masih keluar untuk ini, tetapi ini adalah jenis perdebatan etis yang terjadi seiring perkembangan teknologi AI yang baru dan inovatif.

Dampak AI pada pekerjaan

Sementara banyak persepsi publik tentang pusat kecerdasan buatan seputar kehilangan pekerjaan, kekhawatiran ini mungkin harus diubah. Dengan setiap teknologi baru yang mengganggu, kami melihat bahwa permintaan pasar akan pergeseran peran pekerjaan tertentu. Misalnya, ketika kita melihat industri otomotif, banyak pabrikan, seperti GM, yang beralih fokus pada produksi kendaraan listrik agar sejalan dengan inisiatif hijau. Industri energi tidak akan hilang, tetapi sumber energi beralih dari penghematan bahan bakar ke listrik.

Dengan cara yang sama, kecerdasan buatan akan mengalihkan permintaan pekerjaan ke bidang lain. Perlu ada individu untuk membantu mengelola sistem AI. Masih diperlukan orang untuk mengatasi masalah yang lebih kompleks dalam industri yang kemungkinan besar akan terpengaruh oleh pergeseran permintaan pekerjaan, seperti layanan pelanggan. Tantangan terbesar dengan kecerdasan buatan dan pengaruhnya terhadap pasar kerja adalah membantu orang beralih ke peran baru yang dibutuhkan.

Pribadi

Privasi cenderung dibahas dalam konteks privasi data, perlindungan data, dan keamanan data. Kekhawatiran ini telah memungkinkan para pembuat kebijakan untuk membuat lebih banyak langkah dalam beberapa tahun terakhir. Misalnya, pada tahun 2016, undang-undang GDPR dibuat untuk melindungi data pribadi orang-orang di Uni Eropa dan Wilayah Ekonomi Eropa, memberikan lebih banyak kontrol kepada individu atas data mereka. Di Amerika Serikat, masing-masing negara bagian sedang mengembangkan kebijakan, seperti Undang-Undang Privasi Konsumen California (CCPA), yang diperkenalkan pada tahun 2018 dan mewajibkan bisnis untuk memberi tahu konsumen tentang pengumpulan data mereka. Perundang-undangan seperti ini telah memaksa perusahaan untuk memikirkan kembali bagaimana mereka menyimpan dan menggunakan informasi identitas pribadi (PII). Sebagai akibat,

Bias dan diskriminasi

Contoh bias dan diskriminasi di sejumlah sistem pembelajaran mesin telah menimbulkan banyak pertanyaan etis terkait penggunaan kecerdasan buatan. Bagaimana kita bisa melindungi dari bias dan diskriminasi ketika data pelatihan itu sendiri mungkin dihasilkan oleh proses manusia yang bias? Sementara perusahaan biasanya memiliki niat baik untuk upaya otomasi mereka,  Reuters  (tautan berada di luar IBM) ) menyoroti beberapa konsekuensi tak terduga dari memasukkan AI ke dalam praktik perekrutan. Dalam upaya mereka untuk mengotomatiskan dan menyederhanakan proses, Amazon secara tidak sengaja mendiskriminasi kandidat pekerjaan berdasarkan jenis kelamin untuk peran teknis, dan perusahaan akhirnya harus menghentikan proyek tersebut. ulasan Bisnis Harvard (tautan berada di luar IBM) telah mengajukan pertanyaan tajam lainnya tentang penggunaan AI dalam praktik perekrutan, seperti data apa yang seharusnya dapat Anda gunakan saat mengevaluasi kandidat untuk suatu peran.

Bias dan diskriminasi juga tidak terbatas pada fungsi sumber daya manusia; mereka dapat ditemukan di sejumlah aplikasi mulai dari perangkat lunak pengenal wajah hingga algoritme media sosial.

Saat bisnis menjadi lebih sadar akan risiko AI, mereka juga menjadi lebih aktif dalam diskusi seputar etika dan nilai AI. Misalnya, IBM telah menghentikan produk pengenalan wajah dan analisis tujuan umumnya. CEO IBM Arvind Krishna menulis: “IBM dengan tegas menentang dan tidak akan membiarkan penggunaan teknologi apa pun, termasuk teknologi pengenalan wajah yang ditawarkan oleh vendor lain, untuk pengawasan massal, pembuatan profil rasial, pelanggaran hak asasi manusia dan kebebasan dasar, atau tujuan apa pun yang tidak konsisten. dengan nilai-nilai dan Prinsip Kepercayaan dan Transparansi kami.”

 

sumber:https://www.ibm.com/topics/machine-learning#:~:text=the%20next%20step-,What%20is%20machine%20learning%3F,learn%2C%20gradually%20improving%20its%20accuracy.

 Copyright stekom.ac.id 2018 All Right Reserved