Ulasan: Google Cloud AI menyalakan pembelajaran mesin

Google mempunyai salah satu tumpukan pembelajaran mesin terbesar di industri, yang kini berpusat pada Google Cloud AI dan Platform Pembelajaran Mesin. Google menjadikan TensorFlow sebagai sumber terbuka bertahun-tahun yang lalu, tetapi TensorFlow masih merupakan rangka pembelajaran mendalam yang paling matang dan banyak disebut. Begitu juga, Google menjadikan Kubernetes sebagai sumber terbuka bertahun-tahun yang lalu, tetapi masih merupakan sistem pengurusan kontena yang dominan.

Google adalah salah satu sumber utama alat dan infrastruktur untuk pembangun, saintis data, dan pakar pembelajaran mesin, tetapi secara historis Google AI tidak begitu menarik bagi penganalisis perniagaan yang tidak mempunyai latar belakang sains data atau pengaturcaraan yang serius. Itu mula berubah.

Platform Google Cloud AI dan Machine Learning merangkumi blok bangunan AI, platform AI dan pemecut, dan penyelesaian AI. Penyelesaian AI agak baru dan ditujukan kepada pengurus perniagaan dan bukannya saintis data. Mereka mungkin termasuk berunding dari Google atau rakan-rakannya.

Blok bangunan AI, yang sudah dilatih sebelumnya tetapi dapat disesuaikan, dapat digunakan tanpa pengetahuan mendalam tentang pengaturcaraan atau sains data. Walaupun begitu, mereka sering digunakan oleh saintis data yang mahir untuk alasan pragmatik, pada dasarnya untuk menyelesaikan sesuatu tanpa latihan model yang luas.

Platform AI dan pemecut umumnya untuk saintis data yang serius, dan memerlukan kemahiran pengekodan, pengetahuan tentang teknik penyediaan data, dan banyak masa latihan. Saya cadangkan pergi ke sana hanya setelah mencuba blok bangunan yang berkaitan.

Masih ada beberapa pautan yang hilang dalam penawaran AI Google Cloud, terutama dalam penyediaan data. Perkara paling dekat yang dimiliki oleh Google Cloud dengan perkhidmatan pengimportan dan pengkondisian data adalah Cloud Dataprep pihak ketiga oleh Trifacta; Saya mencubanya setahun yang lalu dan merasa kurang senang. Kejuruteraan ciri yang terdapat di dalam Cloud AutoML Tables memang menjanjikan, dan akan berguna untuk menyediakan perkhidmatan semacam itu untuk senario lain.

Bahagian bawah AI yang berkait rapat dengan etika dan tanggungjawab (atau kekurangannya), bersama dengan bias model yang berterusan (selalunya kerana data berat sebelah yang digunakan untuk latihan). Google menerbitkan Prinsip AInya pada tahun 2018. Ini sedang dijalankan, tetapi ini merupakan asas panduan seperti yang dibincangkan dalam catatan blog baru-baru ini mengenai AI yang Bertanggungjawab.

Terdapat banyak persaingan di pasar AI (lebih dari selusin vendor), dan banyak persaingan di pasar awan awam (lebih dari setengah lusin vendor yang boleh dipercayai). Untuk membuat keadilan perbandingan, saya harus menulis artikel sekurang-kurangnya lima kali lebih lama daripada yang satu ini, kerana saya tidak suka meninggalkannya, saya harus menghilangkan kebanyakan perbandingan produk. Untuk perbandingan yang paling jelas, saya dapat meringkaskan: AWS melakukan kebanyakan perkara yang dilakukan oleh Google, dan juga sangat bagus, tetapi secara amnya mengenakan harga yang lebih tinggi.

Blok Bangunan AI Google Cloud

Blok Bangunan Google Cloud AI adalah komponen yang mudah digunakan yang dapat anda masukkan ke dalam aplikasi anda sendiri untuk menambahkan penglihatan, bahasa, perbualan, dan data terstruktur. Sebilangan besar blok bangunan AI adalah rangkaian saraf pra-terlatih, tetapi dapat disesuaikan dengan pembelajaran pemindahan dan pencarian rangkaian saraf jika tidak memenuhi keperluan anda di luar kotak. AutoML Tables sedikit berbeza, kerana ia mengotomatisasi proses yang akan digunakan oleh saintis data untuk mencari model pembelajaran mesin terbaik untuk set data tabular.

AutoML

Perkhidmatan Google Cloud AutoML menyediakan rangkaian neural dalam yang disesuaikan untuk terjemahan pasangan bahasa, klasifikasi teks, pengesanan objek, klasifikasi gambar, dan klasifikasi dan penjejakan objek video. Mereka memerlukan data yang diberi tag untuk latihan, tetapi tidak memerlukan pengetahuan yang signifikan tentang pembelajaran mendalam, pembelajaran transfer, atau pengaturcaraan.

Google Cloud AutoML menyesuaikan rangkaian neural mendalam yang diuji dengan pertempuran dan tepat untuk data yang ditandai oleh Google. Daripada bermula dari awal ketika melatih model dari data anda, AutoML melaksanakan pembelajaran pemindahan mendalam secara automatik (yang bermaksud ia bermula dari rangkaian neural dalam yang ada yang dilatih pada data lain) dan carian seni bina saraf (yang bermaksud bahawa ia menemui kombinasi lapisan jaringan tambahan yang tepat ) untuk terjemahan pasangan bahasa dan perkhidmatan lain yang disenaraikan di atas.

Di setiap kawasan, Google sudah mempunyai satu atau lebih perkhidmatan pra-latihan berdasarkan rangkaian neural dalam dan sekumpulan besar data berlabel. Ini mungkin berfungsi untuk data anda yang tidak diubah suai, dan anda harus mengujinya untuk menjimatkan masa dan wang anda. Sekiranya mereka tidak melakukan apa yang anda perlukan, Google Cloud AutoML membantu anda membuat model yang sesuai, tanpa memerlukan anda tahu bagaimana melakukan pembelajaran transfer atau bagaimana merancang rangkaian saraf.

Pembelajaran transfer menawarkan dua kelebihan besar daripada melatih rangkaian saraf dari awal. Pertama, ia memerlukan lebih banyak data untuk latihan, kerana kebanyakan lapisan rangkaian sudah terlatih dengan baik. Kedua, latihan lebih cepat, kerana hanya mengoptimumkan lapisan akhir.

Walaupun perkhidmatan Google Cloud AutoML dulu disajikan bersama sebagai pakej, mereka sekarang disenaraikan dengan perkhidmatan pra-latihan asas mereka. Apa yang kebanyakan syarikat lain panggil AutoML dilakukan oleh Google Cloud AutoML Tables.

Baca ulasan lengkap Google Cloud AutoML

Jadual AutoML

Proses sains data yang biasa untuk banyak masalah regresi dan klasifikasi adalah dengan membuat jadual data untuk latihan, membersihkan dan mengkondisikan data, melakukan rekayasa ciri, dan berusaha melatih semua model yang sesuai pada tabel yang diubah, termasuk langkah untuk mengoptimumkan hyperparameter model terbaik. Google Cloud AutoML Tables dapat melakukan keseluruhan proses ini secara automatik setelah anda mengenal pasti bidang sasaran secara manual.

AutoML Tables secara automatik mencari di zoo model Google untuk data berstruktur untuk mencari model terbaik untuk keperluan anda, mulai dari model regresi linier / logistik untuk set data yang lebih sederhana hingga kaedah pencarian mendalam, ensembel, dan seni bina yang lebih maju dan lebih kompleks. Ia mengautomasikan kejuruteraan ciri dalam pelbagai jenis data primitif - seperti nombor, kelas, rentetan, cap waktu, dan senarai - dan membantu anda mengesan dan menjaga kehilangan nilai, garis besar, dan masalah data biasa yang lain.

Antaramuka tanpa kod membimbing anda melalui kitaran hayat pembelajaran mesin hujung-ke-hujung sepenuhnya, memudahkan sesiapa sahaja dalam pasukan anda untuk membina model dan menggabungkannya dengan pasti ke dalam aplikasi yang lebih luas. AutoML Tables menyediakan data input yang luas dan ciri-ciri perilaku model yang dapat dijelaskan, bersama dengan pagar pengawal untuk mengelakkan kesilapan biasa. AutoML Tables juga tersedia di lingkungan API dan notebook.

AutoML Tables bersaing dengan Driverless AI dan beberapa pelaksanaan dan kerangka kerja AutoML yang lain.

API Penglihatan

Google Cloud Vision API adalah perkhidmatan pembelajaran mesin pra-terlatih untuk mengkategorikan gambar dan mengeluarkan pelbagai ciri. Ia dapat mengklasifikasikan gambar menjadi ribuan kategori pra-latihan, mulai dari objek generik dan haiwan yang terdapat dalam gambar (seperti kucing), hingga keadaan umum (misalnya senja), hingga mercu tanda tertentu (Menara Eiffel, Grand Canyon), dan mengenal pasti sifat umum gambar, seperti warnanya yang dominan. Ia dapat mengasingkan kawasan yang berwajah, kemudian menerapkan geometri (orientasi wajah dan mercu tanda) dan analisis emosi pada wajah, walaupun tidak mengenali wajah sebagai milik orang tertentu, kecuali selebriti (yang memerlukan lesen penggunaan khas). Vision API menggunakan OCR untuk mengesan teks dalam gambar dalam lebih dari 50 bahasa dan pelbagai jenis fail. Ia juga dapat mengenal pasti logo produk, dan mengesan orang dewasa,kandungan ganas dan perubatan.

Baca ulasan lengkap API Pembelajaran Mesin Awan Google

API Perisikan Video

API Kepintaran Video Google Cloud secara automatik mengenali lebih dari 20,000 objek, tempat, dan tindakan dalam video yang disimpan dan streaming. Ia juga membezakan perubahan pemandangan dan mengekstrak metadata yang kaya pada tahap video, rakaman, atau bingkai. Ia juga melakukan pengesanan dan pengekstrakan teks menggunakan OCR, mengesan kandungan eksplisit, mengotomatiskan kapsyen tertutup dan sari kata, mengenali logo, dan mengesan wajah, orang, dan pose.

Google mengesyorkan Video Intelligence API untuk mengekstrak metadata untuk mengindeks, mengatur dan mencari kandungan video anda. Ia dapat mentranskripsikan video dan menghasilkan kapsyen tertutup, serta menandai dan menyaring kandungan yang tidak sesuai, semuanya lebih menjimatkan berbanding dengan transkrip manusia. Kes penggunaan termasuk penyederhanaan konten, cadangan kandungan, arkib media, dan iklan kontekstual.

API Bahasa Asli

Pemprosesan bahasa semula jadi (NLP) adalah sebahagian besar dari "rahsia sos" yang memberi input kepada Carian Google dan Pembantu Google berfungsi dengan baik. Google Cloud Natural Language API memperlihatkan teknologi yang sama untuk program anda. Ia dapat melakukan analisis sintaks (lihat gambar di bawah), pengekstrakan entiti, analisis sentimen, dan klasifikasi kandungan, dalam 10 bahasa. Anda boleh menentukan bahasa jika anda mengetahuinya; jika tidak, API akan berusaha mengesan bahasa secara automatik. API berasingan, yang kini tersedia untuk akses awal atas permintaan, mengkhususkan diri dalam kandungan yang berkaitan dengan kesihatan.

Baca ulasan lengkap API Pembelajaran Mesin Awan Google

Terjemahan

API Terjemahan Google Cloud dapat menterjemahkan lebih dari seratus pasangan bahasa, dapat mengesan bahasa sumber secara automatik jika anda tidak menentukannya, dan terdapat dalam tiga rasa: Terjemahan Asas, Lanjutan, dan Media. API Terjemahan Lanjutan menyokong glosari, terjemahan kumpulan, dan penggunaan model tersuai. API Terjemahan Asas pada dasarnya adalah apa yang digunakan oleh antara muka Terjemahan Google pengguna. Terjemahan AutoML membolehkan anda melatih model khusus menggunakan pembelajaran pemindahan.

API Terjemahan Media menerjemahkan kandungan secara langsung dari audio (ucapan), sama ada fail audio atau aliran, dalam 12 bahasa, dan secara automatik menghasilkan tanda baca. Terdapat model berasingan untuk audio video dan panggilan telefon.

Baca ulasan lengkap API Pembelajaran Mesin Awan Google