Papan kekunci? Betapa peliknya

Zaman carian suara dan perisian yang dikendalikan oleh suara ada di atas kita. Sebagai pemaju, saya hidup dan mati menggunakan papan kekunci, tetapi saya sudah dapat melihat tanda-tanda: Seperti banyak orang, misalnya, saya bercakap dengan telefon Android saya (contohnya, "Navigasi ke Lowes [atau Starbucks atau Harris Teeter]") untuk dapatkan arah.

Dalam Laporan Trend Internet Mary Meeker 2016, dia melaporkan bahawa pertanyaan carian Google Voice telah meningkat dengan faktor tujuh sejak 2010. Saya juga menyedari bahawa anak lelaki saya yang berusia 12 tahun melakukan hampir semua cariannya melalui suara - dan saya teman wanita menghantar teks kepada saya dengan cara ini secara berkala. Juga, syarikat tempat saya bekerja, Lucidworks, baru-baru ini mengumumkan perkongsian baru dengan IBM untuk mengintegrasikan Watson dan kemampuan teks-ke-pertuturan ke dalam produk carian perusahaan kami. 

Teknologi ini berfungsi jauh lebih baik daripada sebelumnya, dan lebih mudah disatukan ke dalam aplikasi. Sekiranya anda mengembangkan untuk Android atau iOS, anda boleh menggunakan API untuk pengecaman pertuturan dengan mudah. Tetapi pengecaman pertuturan tidak bermula dan berakhir dengan arahan ucapan-ke-teks dan suara yang sederhana.

Memahami maksud carian adalah tugas yang sangat kontekstual, terutama dengan bahasa lisan. Lebih-lebih lagi, orang cenderung menggunakan lebih banyak kata dalam bahasa lisan semula jadi daripada ketika mereka berhadapan dengan bar carian. Terdapat lebih banyak "kata bising" dalam bahasa lisan daripada carian teks biasa.

Ini adalah cabaran AI yang ketara. Tetapi ketika kita mengatasi masalah konteks, pemaju akan mengetahui bahawa lebih banyak yang dapat dilakukan dengan suara daripada teks. Konteks emosi akan memainkan peranan. Sekiranya anda mencari stesen minyak, adakah anda mahukan stesen minyak termurah atau yang terdekat? Kandungan emotif suara anda boleh menyiratkannya. Pasti, anda mungkin menjelaskan, tetapi anda mungkin tidak perlu.

Masa depan bercakap anda

Zaman yang didorong oleh suara bukan mengenai carian sahaja. Ini akan mempengaruhi keseluruhan cara kita berinteraksi dengan komputer. Pada masa depan yang tidak terlalu jauh, papan kekunci akan dianggap "pelik", seperti yang dijelaskan oleh Scotty dalam "Star Trek IV."

Tetapi peralihan itu juga menuntut UI baru. Inilah gambaran kuno mengenai maksud saya: Semasa Windows 95 keluar, IBM telah menggabungkan perintah suara ke dalam PCnya. Pada masa itu, saya bekerja sebagai jurujual di Office Depot, dan dengan cepat menjadi jelas bagaimana perintah suara tidak praktikal. Antaramuka tingkap sama sekali tidak sesuai dengan bentuk interaksi ini.

Maksud saya, bagaimana anda memindahkan tetingkap yang tidak sesuai dengan tetingkap lain dan mengubah saiz keduanya agar sesuai di skrin dengan cara yang cekap dengan perintah suara? Anda tidak. Anda membuang tingkap tersebut (dan mungkin Windows) sama sekali. UI yang didorong oleh suara tidak menggunakan motif yang sama. Anda tidak pernah melihat antara muka pada tingkap "Star Trek."

Bercakap tentang "Star Trek," apabila orang mula membuat pengekodan atau melakukan sesuatu yang teknikal, mereka selalu beralih ke antara muka taktil (OK, tidak betul-betul taktil - ia kelihatan lebih seperti papan kekunci gelombang mikro yang dilapisi dengan perenderan art nouveau dari papan litar). Tetapi adakah regresi untuk "menaip" diperlukan? Benar, saya tidak dapat membayangkan menggunakan antara muka suara untuk membuat kod di Scala. Mungkin bahasa baru (tanpa tanda kurung, tidak seperti Scala - dan artikel saya) akan dikembangkan yang sesuai untuk suara.

Laman web pasti tidak akan kelihatan sama dan akan menawarkan paradigma navigasi baru. Anda akan mengatakan "tunjukkan kepada saya tawaran mengenai kasut", dan apa yang anda dapatkan mungkin akan lebih teratur dan lebih sensitif dari segi konteks daripada laman web purata anda ("tawaran" && "kasut"). Lebih-lebih lagi, saya tidak mahu menatal atau mengatakan "halaman seterusnya", jadi interaksi harus diperibadikan. Sistem ini semestinya tahu bahawa saya mahukan kasut lelaki dan saya tidak mahu kasut bertumit keras kerana tendonitis Achilles saya. Mungkin tahu saya lebih suka warna gelap. Mungkin saya menceritakannya atau mungkin menganalisis tingkah laku saya.

Adakah ini laman web sama sekali? Tentu, jika saya membeli-belah kasut, saya akan mahukan gambaran visual, tetapi jika saya bercakap mungkin mesin bercakap kembali. Mungkin itu menunjukkan kepada saya kasut, lalu bertanya: "Adakah anda mencari jenis kasut tertentu? Apa tujuan kasut ini? Adakah anda memakainya mendaki atau ke pesta?"

Era carian suara akan mengubah segalanya dari cara kita berinteraksi dengan mesin hingga bagaimana kita membuat kod. Banyak teknologi yang kita perlukan sudah tersedia untuk kita hari ini, sementara yang lain masih belum dicipta. Kesan pada antara muka pengguna boleh menjadi lebih mendalam daripada beralih dari kad tebuk ke papan kekunci.

Perubahan menyeluruh ini tidak akan datang sekaligus. Hari ini bukan hari untuk membuang papan kekunci anda. Tetapi mungkin hari untuk mula memikirkan untuk merancang semula laman web anda agar benar-benar dapat diakses oleh suara.