Pembelajaran mesin adalah cabang kecerdasan buatan (AI) dan ilmu komputer yang berfokus pada penggunaan data dan algoritme untuk meniru cara manusia belajar, secara bertahap meningkatkan akurasinya. IBM memiliki sejarah yang kaya dengan pembelajaran mesin. Salah satunya, Arthur Samuel, dikreditkan karena menciptakan istilah, "pembelajaran mesin" dengan penelitiannya ( PDF, 481 KB) (tautan berada di luar IBM) seputar permainan catur. Robert Nealey, master catur yang memproklamirkan diri, memainkan permainan di komputer IBM 7094 pada tahun 1962, dan dia kalah dari komputer. Dibandingkan dengan apa yang bisa dilakukan hari ini, prestasi ini tampak sepele, tetapi dianggap sebagai tonggak utama di bidang kecerdasan buatan. Selama beberapa dekade terakhir, kemajuan teknologi dalam penyimpanan dan kekuatan pemrosesan telah memungkinkan beberapa produk inovatif berdasarkan pembelajaran mesin, seperti mesin rekomendasi Netflix dan mobil self-driving. Pembelajaran mesin adalah komponen penting dari bidang ilmu data yang berkembang. Melalui penggunaan metode statistik, algoritme dilatih untuk membuat klasifikasi atau prediksi, dan mengungkap wawasan kunci dalam proyek penambangan data. Wawasan ini selanjutnya mendorong pengambilan keputusan dalam aplikasi dan bisnis, yang secara ideal berdampak pada metrik pertumbuhan utama. Saat big data terus berkembang dan tumbuh, permintaan pasar akan ilmuwan data akan meningkat. Mereka akan diminta untuk membantu mengidentifikasi pertanyaan bisnis yang paling relevan dan data untuk menjawabnya. Algoritme pembelajaran mesin biasanya dibuat menggunakan kerangka kerja yang mempercepat pengembangan solusi, seperti TensorFlow dan PyTorch. Pembelajaran Mesin vs. Pembelajaran Mendalam vs. Jaringan Neural Karena deep learning dan machine learning cenderung digunakan secara bergantian, perlu diperhatikan nuansa di antara keduanya. Pembelajaran mesin, pembelajaran mendalam, dan jaringan saraf semuanya adalah sub-bidang kecerdasan buatan. Namun, jaringan saraf sebenarnya adalah sub-bidang pembelajaran mesin, dan pembelajaran mendalam adalah sub-bidang jaringan saraf. Perbedaan antara deep learning dan machine learning terletak pada cara masing-masing algoritme belajar. Machine learning "Deep" dapat menggunakan kumpulan data berlabel, juga dikenal sebagai pembelajaran terawasi, untuk menginformasikan algoritmenya, tetapi tidak selalu memerlukan kumpulan data berlabel. Pembelajaran mendalam dapat menyerap data tidak terstruktur dalam bentuk mentahnya (misalnya, teks atau gambar), dan dapat secara otomatis menentukan kumpulan fitur yang membedakan berbagai kategori data satu sama lain. Ini menghilangkan beberapa intervensi manusia yang diperlukan dan memungkinkan penggunaan set data yang lebih besar. Anda dapat menganggap pembelajaran mendalam sebagai "pembelajaran mesin yang dapat diskalakan" seperti yang dicatat Lex Fridman dalam kuliah MIT ini (01:08:05) (tautan berada di luar IBM). Pembelajaran mesin klasik, atau "tidak mendalam", lebih bergantung pada intervensi manusia untuk belajar. Pakar manusia menentukan kumpulan fitur untuk memahami perbedaan antara input data, biasanya membutuhkan data yang lebih terstruktur untuk dipelajari. Jaringan saraf, atau jaringan syaraf tiruan (JST), terdiri dari lapisan simpul, yang berisi lapisan masukan, satu atau lebih lapisan tersembunyi, dan lapisan keluaran. Setiap node, atau neuron buatan, terhubung ke yang lain dan memiliki bobot dan ambang yang terkait. Jika output dari setiap node berada di atas nilai ambang yang ditentukan, node tersebut diaktifkan, mengirim data ke lapisan jaringan berikutnya. Jika tidak, tidak ada data yang diteruskan ke lapisan jaringan berikutnya oleh node tersebut. "Deep" dalam pembelajaran mendalam hanya mengacu pada jumlah lapisan dalam jaringan saraf. Jaringan saraf yang terdiri dari lebih dari tiga lapisan—yang mencakup input dan output—dapat dianggap sebagai algoritme pembelajaran mendalam atau jaringan saraf dalam. Jaringan saraf yang hanya memiliki tiga lapisan hanyalah jaringan saraf dasar. Pembelajaran mendalam dan jaringan saraf dikreditkan dengan mempercepat kemajuan di berbagai bidang seperti visi komputer, pemrosesan bahasa alami, dan pengenalan suara. Lihat postingan blog “ AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: Apa Bedanya? ” untuk melihat lebih dekat bagaimana berbagai konsep berhubungan. UC Berkeley (tautan berada di luar IBM) membagi sistem pembelajaran dari algoritma pembelajaran mesin menjadi tiga bagian utama.
Model pembelajaran mesin terbagi dalam tiga kategori utama. Pembelajaran mesin yang diawasi Pembelajaran terawasi , juga dikenal sebagai pembelajaran mesin terawasi, didefinisikan dengan penggunaan kumpulan data berlabel untuk melatih algoritme guna mengklasifikasikan data atau memprediksi hasil secara akurat. Saat data masukan dimasukkan ke dalam model, model menyesuaikan bobotnya hingga sesuai. Hal ini terjadi sebagai bagian dari proses validasi silang untuk memastikan bahwa model terhindar dari overfitting atau underfitting . Pembelajaran yang diawasi membantu organisasi memecahkan berbagai masalah dunia nyata dalam skala besar, seperti mengklasifikasikan spam dalam folder terpisah dari kotak masuk Anda. Beberapa metode yang digunakan dalam supervised learning antara lain neural network, naïve bayes, regresi linier, regresi logistik, random forest, dan support vector machine (SVM). Pembelajaran mesin tanpa pengawasan Pembelajaran tanpa pengawasan , juga dikenal sebagai pembelajaran mesin tanpa pengawasan, menggunakan algoritme pembelajaran mesin untuk menganalisis dan mengelompokkan kumpulan data yang tidak berlabel. Algoritme ini menemukan pola tersembunyi atau pengelompokan data tanpa perlu campur tangan manusia. Kemampuan metode ini untuk menemukan kesamaan dan perbedaan informasi membuatnya ideal untuk analisis data eksplorasi, strategi penjualan silang, segmentasi pelanggan, dan pengenalan citra dan pola. Ini juga digunakan untuk mengurangi jumlah fitur dalam model melalui proses pengurangan dimensi. Analisis komponen utama (PCA) dan dekomposisi nilai singular (SVD) adalah dua pendekatan umum untuk ini. Algoritme lain yang digunakan dalam pembelajaran tanpa pengawasan termasuk jaringan saraf, pengelompokan k-means, dan metode pengelompokan probabilistik. Pembelajaran semi-diawasi Pembelajaran semi-diawasi menawarkan media yang menyenangkan antara pembelajaran yang diawasi dan tidak diawasi. Selama pelatihan, ini menggunakan kumpulan data berlabel yang lebih kecil untuk memandu klasifikasi dan ekstraksi fitur dari kumpulan data yang lebih besar dan tidak berlabel. Pembelajaran semi-diawasi dapat memecahkan masalah tidak adanya cukup data berlabel untuk algoritme pembelajaran yang diawasi. Ini juga membantu jika terlalu mahal untuk melabeli data yang cukup. Untuk mengetahui lebih dalam tentang perbedaan antara pendekatan-pendekatan ini, lihat " Pembelajaran Terbimbing vs. Tanpa Pengawasan: Apa Perbedaannya? " Pembelajaran mesin penguatan adalah model pembelajaran mesin yang mirip dengan pembelajaran terawasi, tetapi algoritmenya tidak dilatih menggunakan data sampel. Model ini belajar sambil berjalan dengan menggunakan trial and error. Urutan hasil yang sukses akan diperkuat untuk mengembangkan rekomendasi atau kebijakan terbaik untuk masalah tertentu. Sistem IBM Watson® yang memenangkan Jeopardy! tantangan pada tahun 2011 adalah contoh yang baik. Sistem ini menggunakan pembelajaran penguatan untuk mempelajari kapan harus mencoba jawaban (atau pertanyaan, seolah-olah), kotak mana yang harus dipilih di papan tulis, dan berapa banyak yang harus dipertaruhkan—terutama pada ganda harian. Pelajari lebih lanjut tentang pembelajaran penguatan. Algoritma pembelajaran mesin umum Sejumlah algoritma pembelajaran mesin yang umum digunakan. Ini termasuk:
Kasus penggunaan pembelajaran mesin dunia nyata Berikut adalah beberapa contoh pembelajaran mesin yang mungkin Anda temui setiap hari: Pengenalan ucapan: Ini juga dikenal sebagai pengenalan ucapan otomatis (ASR), pengenalan ucapan komputer, atau ucapan-ke-teks, dan ini adalah kemampuan yang menggunakan pemrosesan bahasa alami (NLP) untuk menerjemahkan ucapan manusia ke dalam format tertulis. Banyak perangkat seluler menggabungkan pengenalan suara ke dalam sistem mereka untuk melakukan pencarian suara—mis. Siri—atau meningkatkan aksesibilitas untuk mengirim SMS. Layanan pelanggan: Layanan pelanggan: Obrolan online menggantikan agen manusia di sepanjang perjalanan pelanggan, mengubah cara kami berpikir tentang keterlibatan pelanggan di seluruh situs web dan platform media sosial. Chatbots menjawab pertanyaan umum (FAQ) tentang topik seperti pengiriman, atau memberikan saran yang dipersonalisasi, penjualan silang produk, atau menyarankan ukuran untuk pengguna. Contohnya termasuk agen virtual di situs e-niaga; bot perpesanan, menggunakan Slack dan Facebook Messenger; dan tugas biasanya dilakukan oleh asisten virtual dan asisten suara. Visi komputer: Teknologi AI ini memungkinkan komputer memperoleh informasi bermakna dari gambar digital, video, dan input visual lainnya, lalu mengambil tindakan yang sesuai. Didukung oleh jaringan saraf convolutional, visi komputer memiliki aplikasi dalam penandaan foto di media sosial, pencitraan radiologi dalam perawatan kesehatan, dan mobil self-driving dalam industri otomotif. Mesin rekomendasi: Dengan menggunakan data perilaku konsumsi masa lalu, algoritme AI dapat membantu menemukan tren data yang dapat digunakan untuk mengembangkan strategi penjualan silang yang lebih efektif. Pendekatan ini digunakan oleh pengecer online untuk membuat rekomendasi produk yang relevan kepada pelanggan selama proses checkout. Perdagangan saham otomatis: Dirancang untuk mengoptimalkan portofolio saham, platform perdagangan frekuensi tinggi yang digerakkan oleh AI menghasilkan ribuan atau bahkan jutaan perdagangan per hari tanpa campur tangan manusia. Deteksi penipuan: Bank dan lembaga keuangan lainnya dapat menggunakan pembelajaran mesin untuk menemukan transaksi yang mencurigakan. Pembelajaran yang diawasi dapat melatih model menggunakan informasi tentang transaksi penipuan yang diketahui. Deteksi anomali dapat mengidentifikasi transaksi yang terlihat tidak biasa dan perlu diselidiki lebih lanjut. Seiring perkembangan teknologi pembelajaran mesin, hal itu tentunya membuat hidup kita lebih mudah. Namun, menerapkan pembelajaran mesin dalam bisnis juga menimbulkan sejumlah masalah etika tentang teknologi AI. Beberapa di antaranya: Singularitas teknologi Sementara topik ini mendapat banyak perhatian publik, banyak peneliti tidak peduli dengan gagasan AI yang melampaui kecerdasan manusia dalam waktu dekat. Singularitas teknologi juga disebut sebagai AI yang kuat atau superintelligence. Filsuf Nick Bostrum mendefinisikan superintelligence sebagai "kecerdasan apa pun yang mengungguli otak manusia terbaik di hampir semua bidang, termasuk kreativitas ilmiah, kebijaksanaan umum, dan keterampilan sosial." Terlepas dari kenyataan bahwa superintelijen tidak akan segera muncul di masyarakat, gagasan tentangnya menimbulkan beberapa pertanyaan menarik saat kita mempertimbangkan penggunaan sistem otonom, seperti mobil yang dapat mengemudi sendiri. Tidak realistis untuk berpikir bahwa mobil tanpa pengemudi tidak akan pernah mengalami kecelakaan, tetapi siapa yang bertanggung jawab dan bertanggung jawab dalam keadaan seperti itu? Haruskah kita tetap mengembangkan kendaraan otonom, atau apakah kita membatasi teknologi ini pada kendaraan semi-otonom yang membantu orang berkendara dengan aman? Juri masih keluar untuk ini, tetapi ini adalah jenis perdebatan etis yang terjadi seiring perkembangan teknologi AI yang baru dan inovatif. Dampak AI pada pekerjaan Sementara banyak persepsi publik tentang pusat kecerdasan buatan seputar kehilangan pekerjaan, kekhawatiran ini mungkin harus diubah. Dengan setiap teknologi baru yang mengganggu, kami melihat bahwa permintaan pasar akan pergeseran peran pekerjaan tertentu. Misalnya, ketika kita melihat industri otomotif, banyak pabrikan, seperti GM, yang beralih fokus pada produksi kendaraan listrik agar sejalan dengan inisiatif hijau. Industri energi tidak akan hilang, tetapi sumber energi beralih dari penghematan bahan bakar ke listrik. Dengan cara yang sama, kecerdasan buatan akan mengalihkan permintaan pekerjaan ke bidang lain. Perlu ada individu untuk membantu mengelola sistem AI. Masih diperlukan orang untuk mengatasi masalah yang lebih kompleks dalam industri yang kemungkinan besar akan terpengaruh oleh pergeseran permintaan pekerjaan, seperti layanan pelanggan. Tantangan terbesar dengan kecerdasan buatan dan pengaruhnya terhadap pasar kerja adalah membantu orang beralih ke peran baru yang dibutuhkan. Pribadi Privasi cenderung dibahas dalam konteks privasi data, perlindungan data, dan keamanan data. Kekhawatiran ini telah memungkinkan para pembuat kebijakan untuk membuat lebih banyak langkah dalam beberapa tahun terakhir. Misalnya, pada tahun 2016, undang-undang GDPR dibuat untuk melindungi data pribadi orang-orang di Uni Eropa dan Wilayah Ekonomi Eropa, memberikan lebih banyak kontrol kepada individu atas data mereka. Di Amerika Serikat, masing-masing negara bagian sedang mengembangkan kebijakan, seperti Undang-Undang Privasi Konsumen California (CCPA), yang diperkenalkan pada tahun 2018 dan mewajibkan bisnis untuk memberi tahu konsumen tentang pengumpulan data mereka. Perundang-undangan seperti ini telah memaksa perusahaan untuk memikirkan kembali bagaimana mereka menyimpan dan menggunakan informasi identitas pribadi (PII). Sebagai akibat, Bias dan diskriminasi Contoh bias dan diskriminasi di sejumlah sistem pembelajaran mesin telah menimbulkan banyak pertanyaan etis terkait penggunaan kecerdasan buatan. Bagaimana kita bisa melindungi dari bias dan diskriminasi ketika data pelatihan itu sendiri mungkin dihasilkan oleh proses manusia yang bias? Sementara perusahaan biasanya memiliki niat baik untuk upaya otomasi mereka, Reuters (tautan berada di luar IBM) ) menyoroti beberapa konsekuensi tak terduga dari memasukkan AI ke dalam praktik perekrutan. Dalam upaya mereka untuk mengotomatiskan dan menyederhanakan proses, Amazon secara tidak sengaja mendiskriminasi kandidat pekerjaan berdasarkan jenis kelamin untuk peran teknis, dan perusahaan akhirnya harus menghentikan proyek tersebut. ulasan Bisnis Harvard (tautan berada di luar IBM) telah mengajukan pertanyaan tajam lainnya tentang penggunaan AI dalam praktik perekrutan, seperti data apa yang seharusnya dapat Anda gunakan saat mengevaluasi kandidat untuk suatu peran. Bias dan diskriminasi juga tidak terbatas pada fungsi sumber daya manusia; mereka dapat ditemukan di sejumlah aplikasi mulai dari perangkat lunak pengenal wajah hingga algoritme media sosial. Saat bisnis menjadi lebih sadar akan risiko AI, mereka juga menjadi lebih aktif dalam diskusi seputar etika dan nilai AI. Misalnya, IBM telah menghentikan produk pengenalan wajah dan analisis tujuan umumnya. CEO IBM Arvind Krishna menulis: “IBM dengan tegas menentang dan tidak akan membiarkan penggunaan teknologi apa pun, termasuk teknologi pengenalan wajah yang ditawarkan oleh vendor lain, untuk pengawasan massal, pembuatan profil rasial, pelanggaran hak asasi manusia dan kebebasan dasar, atau tujuan apa pun yang tidak konsisten. dengan nilai-nilai dan Prinsip Kepercayaan dan Transparansi kami.”
sumber:https://www.ibm.com/topics/machine-learning#:~:text=the%20next%20step-,What%20is%20machine%20learning%3F,learn%2C%20gradually%20improving%20its%20accuracy. |