Bina model tersuai dengan Pereka Pembelajaran Mesin Azure

Pembelajaran mesin adalah bahagian penting dalam pengembangan aplikasi moden, menggantikan banyak yang biasa dilakukan dengan menggunakan rangkaian mesin peraturan yang kompleks, dan memperluas liputan ke sekumpulan masalah yang jauh lebih luas. Perkhidmatan seperti Azure's Cognitive Services menyediakan model prabuaian, pra-latihan yang menyokong banyak kes penggunaan biasa, tetapi banyak lagi yang memerlukan pengembangan model khusus.

Menjadi kebiasaan dengan ML

Bagaimana kita membina model pembelajaran mesin tersuai? Anda boleh bermula pada satu hujung menggunakan bahasa analisis statistik seperti R untuk membina dan mengesahkan model, di mana anda sudah merasakan struktur data anda yang mendasari, atau anda boleh menggunakan ciri aljabar linear dari suite Anaconda Python's. Begitu juga, alat seperti PyTorch dan TensorFlow dapat membantu membina model yang lebih kompleks, memanfaatkan jaring neural dan pembelajaran mendalam sambil masih berintegrasi dengan bahasa dan platform yang biasa.

Itu semua baik jika anda mempunyai pasukan saintis data dan ahli matematik yang dapat membina, menguji, dan (yang paling penting) mengesahkan model mereka. Dengan kepakaran pembelajaran mesin yang sukar dicari, apa yang diperlukan adalah alat untuk membantu membimbing pemaju melalui proses membuat model yang diperlukan oleh perniagaan. Dalam praktiknya, kebanyakan model pembelajaran mesin terdiri daripada dua jenis: yang pertama mengenal pasti data yang serupa, yang kedua mengenal pasti data yang terpencil.

Kami mungkin menggunakan jenis aplikasi pertama untuk mengenal pasti item tertentu pada tali sawat atau melihat kedua untuk masalah dalam data dari rangkaian sensor industri. Senario seperti ini tidak terlalu rumit, tetapi masih memerlukan pembinaan model yang disahkan, memastikannya dapat mengenal pasti apa yang anda cari dan mencari isyarat dalam data, tidak memperkuatkan andaian atau bertindak balas terhadap kebisingan.

Memperkenalkan Pereka Pembelajaran Mesin Azure

Azure menyediakan pelbagai alat untuk ini, di samping modelnya yang sudah siap dibina, yang sudah siap dibina dan disesuaikan. Satu, Pereka Pembelajaran Mesin Azure, membolehkan anda bekerja dengan data yang ada dengan sekumpulan alat reka bentuk visual dan kawalan seret dan lepas.

Anda tidak perlu menulis kod untuk membina model anda, walaupun ada pilihan untuk membawa R atau Python tersuai jika perlu. Ini adalah pengganti alat ML Studio yang asli, menambahkan integrasi yang lebih mendalam ke dalam SDK pembelajaran mesin Azure dan dengan sokongan untuk lebih daripada model berasaskan CPU, yang menawarkan pembelajaran mesin bertenaga GPU dan latihan dan penalaan model automatik.

Untuk memulakan dengan Azure Machine Learning Designer, buka laman Azure Machine Learning dan log masuk dengan akaun Azure. Mulailah dengan menyambung ke langganan dan membuat ruang kerja untuk model anda. Wizard persediaan meminta anda untuk menentukan sama ada model yang dihasilkan mempunyai titik akhir awam atau peribadi dan sama ada anda akan menggunakan data sensitif sebelum memilih bagaimana kunci diuruskan. Data sensitif akan diproses dalam apa yang didefinisikan oleh Azure sebagai "ruang kerja dengan kesan perniagaan yang tinggi", yang mengurangkan jumlah data diagnostik yang dikumpulkan oleh Microsoft dan menambahkan tahap penyulitan tambahan.

Mengkonfigurasi ruang kerja pembelajaran mesin

Setelah anda melalui wizard, Azure memeriksa tetapan anda sebelum membuat ruang kerja ML anda. Dengan berguna ia menawarkan templat ARM sehingga anda dapat mengotomatisasi proses pembuatan di masa depan, menyediakan kerangka kerja untuk skrip yang dapat digunakan oleh penganalisis perniagaan dari portal dalaman untuk mengurangkan beban pada pentadbir Azure anda. Menggunakan sumber yang diperlukan untuk membuat ruang kerja memerlukan masa, jadi bersiaplah untuk menunggu sebentar sebelum anda dapat mula membina model apa pun.

Ruang kerja anda mengandungi alat untuk mengembangkan dan mengurus model pembelajaran mesin, dari reka bentuk dan latihan hingga menguruskan pengkomputeran dan penyimpanan. Ini juga membantu anda melabel data yang ada, meningkatkan nilai set data latihan anda. Anda mungkin mahu memulakan dengan tiga pilihan utama: bekerjasama dengan Azure ML Python SDK dalam buku nota gaya Jupyter, menggunakan alat latihan automatik Azure ML, atau permukaan Pereka seret-dan-lepas kod rendah. 

Menggunakan Azure ML Designer untuk membuat model

Pereka adalah cara tercepat untuk memulai dengan pembelajaran mesin khusus, kerana memberi anda akses ke sekumpulan modul prebuilt yang dapat dirantai bersama untuk membuat API pembelajaran mesin yang siap digunakan dalam kod anda. Mulailah dengan membuat kanvas untuk saluran paip ML anda, tetapkan sasaran komputasi untuk saluran paip anda. Sasaran komputasi dapat ditetapkan untuk keseluruhan model, atau untuk modul individu dalam proses, yang memungkinkan anda untuk menyesuaikan prestasi dengan tepat.

Sebaiknya anggap sumber komputasi model anda sebagai pengkomputeran tanpa pelayan, yang mana perlu naik dan turun. Apabila anda tidak menggunakannya, ia akan turun menjadi sifar dan memerlukan masa sehingga lima minit untuk berputar lagi. Ini mungkin mempengaruhi operasi aplikasi, jadi pastikan ia tersedia sebelum menjalankan aplikasi yang bergantung padanya. Anda perlu mempertimbangkan sumber yang diperlukan untuk melatih model ketika memilih sasaran komputasi. Model yang kompleks dapat memanfaatkan sokongan GPU Azure, dengan sokongan untuk kebanyakan pilihan komputasi Azure (bergantung pada kuota yang ada).

Setelah anda menyediakan sumber komputasi latihan anda, pilih satu set data latihan. Ini boleh menjadi data anda sendiri atau salah satu contoh Microsoft. Kumpulan data khusus dapat dibuat dari file lokal, dari data yang sudah tersimpan di Azure, dari Web, atau dari kumpulan data terbuka yang didaftarkan (yang sering menjadi maklumat pemerintah).

Menggunakan data dalam Azure ML Designer

Alat dalam Pereka membolehkan anda meneroka set data yang anda gunakan, jadi anda pasti mempunyai sumber yang tepat untuk model yang ingin anda bina. Dengan sumber data di kanvas, anda boleh mula menyeret modul dan menghubungkannya untuk memproses data latihan anda; misalnya, membuang lajur yang tidak mengandungi cukup data atau membersihkan data yang hilang. Proses drag-and-connect ini seperti bekerja dengan alat kod rendah, seperti yang ada di Power Platform. Yang berbeza di sini ialah anda mempunyai pilihan untuk menggunakan modul anda sendiri.

Setelah data diproses, anda boleh mula memilih modul yang ingin anda latih model anda. Microsoft menyediakan satu set algoritma umum, serta alat untuk membelah set data untuk latihan dan ujian. Model yang dihasilkan dapat dijaringkan menggunakan modul lain setelah anda menjalankannya melalui latihan. Markah diteruskan ke modul penilaian sehingga anda dapat melihat sejauh mana algoritma anda dikendalikan. Anda memerlukan sedikit pengetahuan statistik untuk menafsirkan hasilnya sehingga anda dapat memahami jenis kesalahan yang dihasilkan, walaupun dalam praktiknya semakin kecil nilai kesalahan, semakin baik. Anda tidak perlu menggunakan algoritma yang disediakan, kerana anda boleh memasukkan kod Python dan R anda sendiri.

Model terlatih dan teruji dapat dengan cepat diubah menjadi saluran penyimpangan, siap digunakan dalam aplikasi Anda. Ini menambahkan titik akhir REST API input dan output ke model anda, siap digunakan dalam kod anda. Model yang dihasilkan kemudian disebarkan ke kluster inferens AKS sebagai bekas yang siap digunakan.

Biarkan Azure melakukan semuanya untuk anda: Pembelajaran Mesin Automatik

Dalam banyak kes, anda tidak perlu melakukan banyak pembangunan. Microsoft baru-baru ini mengeluarkan pilihan ML Automatik, berdasarkan kerja yang dilakukan di Microsoft Research. Di sini anda mulakan dengan set data yang boleh diakses Azure, yang mesti berupa data jadual. Ini bertujuan untuk tiga jenis model: klasifikasi, regresi, dan ramalan. Setelah anda memberikan data dan memilih jenis model, alat ini secara automatik akan menghasilkan skema dari data yang dapat anda gunakan untuk menghidupkan dan mematikan medan data tertentu, membangun eksperimen yang kemudian dijalankan untuk membangun dan menguji model.

ML automatik akan membuat dan memberi peringkat beberapa model, yang boleh anda selidiki untuk menentukan mana yang terbaik untuk masalah anda. Setelah menemui model yang anda mahukan, anda dapat menambahkan peringkat input dan output dengan cepat dan menggunakannya sebagai perkhidmatan, siap digunakan dalam alat seperti Power BI.

Dengan pembelajaran mesin menjadi alat ramalan yang semakin penting dalam pelbagai jenis masalah perniagaan, Azure Machine Learning Designer dapat menghadirkan khalayak yang jauh lebih luas. Sekiranya anda mempunyai data, anda boleh membina model analitik dan ramalan, dengan kepakaran sains data yang minimum. Dengan perkhidmatan ML Automatik baru, mudah untuk beralih dari data ke perkhidmatan ke analisis tanpa kod.