Pembelajaran mesin adalah cabang kecerdasan buatan (AI) dan ilmu komputer yang berfokus pada penggunaan data dan algoritme untuk meniru cara manusia belajar, secara bertahap meningkatkan akurasinya. IBM memiliki sejarah yang kaya dengan pembelajaran mesin. Salah satunya, Arthur Samuel, dikreditkan karena menciptakan istilah, "pembelajaran mesin" dengan penelitiannya ( PDF, 481 KB) (tautan berada di luar IBM) seputar permainan catur. Robert Nealey, master catur yang memproklamirkan diri, memainkan permainan di komputer IBM 7094 pada tahun 1962, dan dia kalah dari komputer. Dibandingkan dengan apa yang bisa dilakukan hari ini, prestasi ini tampak sepele, tetapi dianggap sebagai tonggak utama di bidang kecerdasan buatan. Selama beberapa dekade terakhir, kemajuan teknologi dalam penyimpanan dan kekuatan pemrosesan telah memungkinkan beberapa produk inovatif berdasarkan pembelajaran mesin, seperti mesin rekomendasi Netflix dan mobil self-driving. Pembelajaran mesin adalah komponen penting dari bidang ilmu data yang
berkembang. Melalui penggunaan metode statistik, algoritme dilatih untuk
membuat klasifikasi atau prediksi, dan mengungkap wawasan kunci dalam proyek
penambangan data. Wawasan ini selanjutnya mendorong pengambilan keputusan
dalam aplikasi dan bisnis, yang secara ideal berdampak pada metrik pertumbuhan
utama. Saat big data terus berkembang dan tumbuh, permintaan pasar akan
ilmuwan data akan meningkat. Mereka akan diminta untuk membantu
mengidentifikasi pertanyaan bisnis yang paling relevan dan data untuk
menjawabnya. Algoritme pembelajaran mesin biasanya dibuat menggunakan kerangka kerja
yang mempercepat pengembangan solusi, seperti TensorFlow dan PyTorch. Pembelajaran Mesin vs. Pembelajaran
Mendalam vs. Jaringan Neural Karena deep learning dan machine learning cenderung digunakan secara
bergantian, perlu diperhatikan nuansa di antara keduanya. Pembelajaran mesin,
pembelajaran mendalam, dan jaringan saraf semuanya adalah sub-bidang kecerdasan
buatan. Namun, jaringan saraf sebenarnya adalah sub-bidang pembelajaran
mesin, dan pembelajaran mendalam adalah sub-bidang jaringan saraf. Perbedaan antara deep learning dan machine learning terletak pada cara
masing-masing algoritme belajar. Machine learning "Deep" dapat
menggunakan kumpulan data berlabel, juga dikenal sebagai pembelajaran terawasi,
untuk menginformasikan algoritmenya, tetapi tidak selalu memerlukan kumpulan
data berlabel. Pembelajaran mendalam dapat menyerap data tidak terstruktur
dalam bentuk mentahnya (misalnya, teks atau gambar), dan dapat secara otomatis
menentukan kumpulan fitur yang membedakan berbagai kategori data satu sama
lain. Ini menghilangkan beberapa intervensi manusia yang diperlukan dan
memungkinkan penggunaan set data yang lebih besar. Anda dapat menganggap
pembelajaran mendalam sebagai "pembelajaran mesin yang dapat
diskalakan" seperti yang dicatat Lex Fridman dalam kuliah
MIT ini (01:08:05) (tautan berada di luar IBM). Pembelajaran mesin klasik, atau "tidak mendalam", lebih
bergantung pada intervensi manusia untuk belajar. Pakar manusia menentukan
kumpulan fitur untuk memahami perbedaan antara input data, biasanya membutuhkan
data yang lebih terstruktur untuk dipelajari. Jaringan saraf, atau jaringan syaraf tiruan (JST), terdiri dari lapisan
simpul, yang berisi lapisan masukan, satu atau lebih lapisan tersembunyi, dan
lapisan keluaran. Setiap node, atau neuron buatan, terhubung ke yang lain
dan memiliki bobot dan ambang yang terkait. Jika output dari setiap node
berada di atas nilai ambang yang ditentukan, node tersebut diaktifkan, mengirim
data ke lapisan jaringan berikutnya. Jika tidak, tidak ada data yang
diteruskan ke lapisan jaringan berikutnya oleh node
tersebut. "Deep" dalam pembelajaran mendalam hanya mengacu pada
jumlah lapisan dalam jaringan saraf. Jaringan saraf yang terdiri dari
lebih dari tiga lapisan—yang mencakup input dan output—dapat dianggap sebagai
algoritme pembelajaran mendalam atau jaringan saraf dalam. Jaringan saraf
yang hanya memiliki tiga lapisan hanyalah jaringan saraf dasar. Pembelajaran mendalam dan jaringan saraf dikreditkan dengan mempercepat
kemajuan di berbagai bidang seperti visi komputer, pemrosesan bahasa alami, dan
pengenalan suara. Lihat postingan blog “ AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: Apa
Bedanya? ” untuk melihat lebih dekat bagaimana berbagai konsep
berhubungan. UC Berkeley (tautan berada di luar IBM)
membagi sistem pembelajaran dari algoritma pembelajaran mesin menjadi tiga
bagian utama.
Model pembelajaran mesin terbagi dalam tiga kategori utama. Pembelajaran mesin yang diawasi
Pembelajaran terawasi , juga dikenal sebagai
pembelajaran mesin terawasi, didefinisikan dengan penggunaan kumpulan data
berlabel untuk melatih algoritme guna mengklasifikasikan data atau memprediksi
hasil secara akurat. Saat data masukan dimasukkan ke dalam model, model
menyesuaikan bobotnya hingga sesuai. Hal ini terjadi sebagai bagian dari
proses validasi silang untuk memastikan bahwa model terhindar dari overfitting atau underfitting . Pembelajaran yang diawasi
membantu organisasi memecahkan berbagai masalah dunia nyata dalam skala besar,
seperti mengklasifikasikan spam dalam folder terpisah dari kotak masuk
Anda. Beberapa metode yang digunakan dalam supervised learning antara lain
neural network, naïve bayes, regresi linier, regresi logistik, random forest,
dan support vector machine (SVM). Pembelajaran mesin tanpa pengawasan Pembelajaran tanpa pengawasan , juga dikenal
sebagai pembelajaran mesin tanpa pengawasan, menggunakan algoritme pembelajaran
mesin untuk menganalisis dan mengelompokkan kumpulan data yang tidak
berlabel. Algoritme ini menemukan pola tersembunyi atau pengelompokan data
tanpa perlu campur tangan manusia. Kemampuan metode ini untuk menemukan
kesamaan dan perbedaan informasi membuatnya ideal untuk analisis data
eksplorasi, strategi penjualan silang, segmentasi pelanggan, dan pengenalan
citra dan pola. Ini juga digunakan untuk mengurangi jumlah fitur dalam
model melalui proses pengurangan dimensi. Analisis komponen utama (PCA)
dan dekomposisi nilai singular (SVD) adalah dua pendekatan umum untuk
ini. Algoritme lain yang digunakan dalam pembelajaran tanpa pengawasan
termasuk jaringan saraf, pengelompokan k-means, dan metode pengelompokan
probabilistik. Pembelajaran semi-diawasi Pembelajaran semi-diawasi menawarkan media yang menyenangkan antara
pembelajaran yang diawasi dan tidak diawasi. Selama pelatihan, ini
menggunakan kumpulan data berlabel yang lebih kecil untuk memandu klasifikasi
dan ekstraksi fitur dari kumpulan data yang lebih besar dan tidak berlabel. Pembelajaran
semi-diawasi dapat memecahkan masalah tidak adanya cukup data berlabel untuk
algoritme pembelajaran yang diawasi. Ini juga membantu jika terlalu mahal
untuk melabeli data yang cukup. Untuk mengetahui lebih dalam tentang perbedaan antara pendekatan-pendekatan
ini, lihat " Pembelajaran Terbimbing vs. Tanpa Pengawasan: Apa Perbedaannya? " Pembelajaran mesin penguatan adalah model pembelajaran mesin yang mirip
dengan pembelajaran terawasi, tetapi algoritmenya tidak dilatih menggunakan
data sampel. Model ini belajar sambil berjalan dengan menggunakan trial
and error. Urutan hasil yang sukses akan diperkuat untuk mengembangkan
rekomendasi atau kebijakan terbaik untuk masalah tertentu. Sistem IBM Watson® yang memenangkan Jeopardy! tantangan
pada tahun 2011 adalah contoh yang baik. Sistem ini menggunakan pembelajaran penguatan untuk
mempelajari kapan harus mencoba jawaban (atau pertanyaan, seolah-olah), kotak
mana yang harus dipilih di papan tulis, dan berapa banyak yang harus
dipertaruhkan—terutama pada ganda harian. Pelajari lebih lanjut tentang pembelajaran penguatan.
Algoritma pembelajaran mesin umum Sejumlah algoritma pembelajaran mesin yang umum digunakan. Ini
termasuk:
Kasus penggunaan pembelajaran mesin
dunia nyata Berikut adalah beberapa contoh pembelajaran mesin yang mungkin Anda temui
setiap hari: Pengenalan
ucapan: Ini juga dikenal sebagai
pengenalan ucapan otomatis (ASR), pengenalan ucapan komputer, atau
ucapan-ke-teks, dan ini adalah kemampuan yang menggunakan pemrosesan bahasa
alami (NLP) untuk menerjemahkan ucapan manusia ke dalam format
tertulis. Banyak perangkat seluler menggabungkan pengenalan suara ke dalam
sistem mereka untuk melakukan pencarian suara—mis. Siri—atau meningkatkan
aksesibilitas untuk mengirim SMS. Layanan
pelanggan: Layanan pelanggan:
Obrolan online menggantikan agen manusia di sepanjang perjalanan pelanggan,
mengubah cara kami berpikir tentang keterlibatan pelanggan di seluruh situs web
dan platform media sosial. Chatbots menjawab pertanyaan umum (FAQ) tentang
topik seperti pengiriman, atau memberikan saran yang dipersonalisasi, penjualan
silang produk, atau menyarankan ukuran untuk pengguna. Contohnya
termasuk agen virtual di
situs e-niaga; bot perpesanan, menggunakan Slack dan Facebook
Messenger; dan tugas biasanya dilakukan oleh asisten virtual dan asisten
suara. Visi
komputer: Teknologi AI ini
memungkinkan komputer memperoleh informasi bermakna dari gambar digital, video,
dan input visual lainnya, lalu mengambil tindakan yang sesuai. Didukung
oleh jaringan saraf convolutional, visi komputer memiliki aplikasi dalam
penandaan foto di media sosial, pencitraan radiologi dalam perawatan kesehatan,
dan mobil self-driving dalam industri otomotif. Mesin
rekomendasi: Dengan menggunakan data
perilaku konsumsi masa lalu, algoritme AI dapat membantu menemukan tren data
yang dapat digunakan untuk mengembangkan strategi penjualan silang yang lebih
efektif. Pendekatan ini digunakan oleh pengecer online untuk membuat
rekomendasi produk yang relevan kepada pelanggan selama proses checkout. Perdagangan
saham otomatis: Dirancang untuk
mengoptimalkan portofolio saham, platform perdagangan frekuensi tinggi yang
digerakkan oleh AI menghasilkan ribuan atau bahkan jutaan perdagangan per hari
tanpa campur tangan manusia. Deteksi
penipuan: Bank dan lembaga keuangan
lainnya dapat menggunakan pembelajaran mesin untuk menemukan transaksi yang
mencurigakan. Pembelajaran yang diawasi dapat melatih model menggunakan
informasi tentang transaksi penipuan yang diketahui. Deteksi anomali dapat
mengidentifikasi transaksi yang terlihat tidak biasa dan perlu diselidiki lebih
lanjut. Seiring perkembangan teknologi pembelajaran mesin, hal itu tentunya membuat
hidup kita lebih mudah. Namun, menerapkan pembelajaran mesin dalam bisnis
juga menimbulkan sejumlah masalah etika tentang teknologi AI. Beberapa di
antaranya: Singularitas teknologi Sementara topik ini mendapat banyak perhatian publik, banyak peneliti tidak
peduli dengan gagasan AI yang melampaui kecerdasan manusia dalam waktu
dekat. Singularitas teknologi juga disebut sebagai AI yang kuat atau
superintelligence. Filsuf Nick Bostrum mendefinisikan superintelligence
sebagai "kecerdasan apa pun yang mengungguli otak manusia terbaik di
hampir semua bidang, termasuk kreativitas ilmiah, kebijaksanaan umum, dan
keterampilan sosial." Terlepas dari kenyataan bahwa superintelijen
tidak akan segera muncul di masyarakat, gagasan tentangnya menimbulkan beberapa
pertanyaan menarik saat kita mempertimbangkan penggunaan sistem otonom, seperti
mobil yang dapat mengemudi sendiri. Tidak realistis untuk berpikir bahwa
mobil tanpa pengemudi tidak akan pernah mengalami kecelakaan, tetapi siapa yang
bertanggung jawab dan bertanggung jawab dalam keadaan seperti
itu? Haruskah kita tetap mengembangkan kendaraan otonom, atau apakah
kita membatasi teknologi ini pada kendaraan semi-otonom yang membantu orang
berkendara dengan aman? Juri masih keluar untuk ini, tetapi ini adalah
jenis perdebatan etis yang terjadi seiring perkembangan teknologi AI yang baru
dan inovatif. Dampak AI pada pekerjaan Sementara banyak persepsi publik tentang pusat kecerdasan buatan seputar
kehilangan pekerjaan, kekhawatiran ini mungkin harus diubah. Dengan setiap
teknologi baru yang mengganggu, kami melihat bahwa permintaan pasar akan
pergeseran peran pekerjaan tertentu. Misalnya, ketika kita melihat
industri otomotif, banyak pabrikan, seperti GM, yang beralih fokus pada
produksi kendaraan listrik agar sejalan dengan inisiatif hijau. Industri
energi tidak akan hilang, tetapi sumber energi beralih dari penghematan bahan
bakar ke listrik. Dengan cara yang sama, kecerdasan buatan akan mengalihkan permintaan
pekerjaan ke bidang lain. Perlu ada individu untuk membantu mengelola
sistem AI. Masih diperlukan orang untuk mengatasi masalah yang lebih
kompleks dalam industri yang kemungkinan besar akan terpengaruh oleh pergeseran
permintaan pekerjaan, seperti layanan pelanggan. Tantangan terbesar dengan
kecerdasan buatan dan pengaruhnya terhadap pasar kerja adalah membantu orang
beralih ke peran baru yang dibutuhkan. Pribadi Privasi cenderung dibahas dalam konteks privasi data, perlindungan data,
dan keamanan data. Kekhawatiran ini telah memungkinkan para pembuat
kebijakan untuk membuat lebih banyak langkah dalam beberapa tahun
terakhir. Misalnya, pada tahun 2016, undang-undang GDPR dibuat untuk
melindungi data pribadi orang-orang di Uni Eropa dan Wilayah Ekonomi Eropa,
memberikan lebih banyak kontrol kepada individu atas data mereka. Di
Amerika Serikat, masing-masing negara bagian sedang mengembangkan kebijakan,
seperti Undang-Undang Privasi Konsumen California (CCPA), yang diperkenalkan
pada tahun 2018 dan mewajibkan bisnis untuk memberi tahu konsumen tentang
pengumpulan data mereka. Perundang-undangan seperti ini telah memaksa
perusahaan untuk memikirkan kembali bagaimana mereka menyimpan dan menggunakan
informasi identitas pribadi (PII). Sebagai akibat, Bias dan diskriminasi Contoh bias dan diskriminasi di sejumlah sistem pembelajaran mesin telah
menimbulkan banyak pertanyaan etis terkait penggunaan kecerdasan
buatan. Bagaimana kita bisa melindungi dari bias dan diskriminasi ketika
data pelatihan itu sendiri mungkin dihasilkan oleh proses manusia yang
bias? Sementara perusahaan biasanya memiliki niat baik untuk upaya otomasi
mereka, Reuters (tautan berada di luar IBM) )
menyoroti beberapa konsekuensi tak terduga dari memasukkan AI ke dalam praktik
perekrutan. Dalam upaya mereka untuk mengotomatiskan dan menyederhanakan
proses, Amazon secara tidak sengaja mendiskriminasi kandidat pekerjaan
berdasarkan jenis kelamin untuk peran teknis, dan perusahaan akhirnya harus
menghentikan proyek tersebut. ulasan Bisnis Harvard (tautan berada di luar IBM)
telah mengajukan pertanyaan tajam lainnya tentang penggunaan AI dalam praktik
perekrutan, seperti data apa yang seharusnya dapat Anda gunakan saat
mengevaluasi kandidat untuk suatu peran. Bias dan diskriminasi juga tidak terbatas pada fungsi sumber daya
manusia; mereka dapat ditemukan di sejumlah aplikasi mulai dari perangkat
lunak pengenal wajah hingga algoritme media sosial. Saat bisnis menjadi lebih sadar akan risiko AI, mereka juga menjadi lebih
aktif dalam diskusi seputar etika dan nilai AI. Misalnya, IBM telah
menghentikan produk pengenalan wajah dan analisis tujuan umumnya. CEO IBM
Arvind Krishna menulis: “IBM dengan tegas menentang dan tidak akan membiarkan
penggunaan teknologi apa pun, termasuk teknologi pengenalan wajah yang
ditawarkan oleh vendor lain, untuk pengawasan massal, pembuatan profil rasial,
pelanggaran hak asasi manusia dan kebebasan dasar, atau tujuan apa pun yang
tidak konsisten. dengan nilai-nilai dan Prinsip Kepercayaan dan Transparansi
kami.” |