Kata Kunci

Blogumulus by Roy Tanck and Amanda Fazani

Duplex, Asisten Google Bicara Seperti Manusia!

KALAU di Terminal 4 Bandara Singapura kecerdasan buatan (artificial intelligence/AI) melayani penumpang dari check in sampai masuk pesawat tanpa bicara sepatah kata pun, fitur asisten Google justru merupakan AI yang bisa bicara seperti manusia. Fitur itu diberi nama Duplex. Uji cobanya lewat seorang pelayan restoran mengangkat telepon, "Hai, umm saya mau melakukan reservasi meja," terdengar suara lelaki dari seberang telepon. "Untuk tujuh orang?" sambut pelayan dalam bahasa Inggris dialek Tiongkok. "Umm, untuk empat orang," jawab si penelepon seolah ragu. Si pelayan tidak merasa aneh dengan telepon yang diterimanya. Biasa, orang memesan tempat di restorannya. Padahal, suara lelaki yang meneleponnya bukan manusia, melainkan program kecerdasan buatan (AI) dalam fitur baru asisten Google, Duplex. Fitur baru itu telah dipamerkan dalam arena Google I/O di Amerika Serikat awal Mei. (Kompas.com, 11/5) Terasa biasa oleh pelayan itu karena suara dan bahasa si 'lelaki' terdengar sangat natural, bicaranya luwes seperti orang sungguhan, tidak lagi seperti suara robot lazimnya. Apalagi, 'dia' juga memahami kata-kata lawan bicaranya di telepon secara spontan dan lancar. Dalam posting di blog miliknya, Google menjelaskan sang AI tadi mampu bercakap-cakap dengan manusia karena sudah dilatih sebelumnya. Duplex dirancang untuk melakukan hal-hal spesifik, meminta informasi seperti komunikasi dengan restoran tadi. "Untuk tugas-tugas macam ini, sistem (Duplex) membuat percakapan jadi senatural mungkin sehingga manusia lawan bicaranya bisa bercakap-cakap seperti dengan orang lain saja, tanpa perlu menyesuaikan diri dengan mesin," tulis Google. Di balik Duplex terdapat serangkai teknologi, agar program bisa mengerti bahasa dalam percakapan sehari-hari yang bersifat lebih acak, lebih cepat diucapkan, dan lebih bergantung konteks, dibanding pembicaraan dengan komputer dalam bahasa yang disederhanakan. Google menggunakan recurrent neural network (RNN) yang dibangun dengan framework tensorflow extended automatic speech recognition untuk memahami kata-kata yang diucapkan lawan bicara. Lalu engine text to speech dipakai untuk mengontrol intonasi suara. Ditambah gumaman dan jeda antarkata, agar suara terdengar lebih natural, seperti manusia sungguhan saat bicara. Duplex untuk pengguna umum dan bisnis. "Nantinya, kami masih terus mengembangkan teknologi ini," ujar CEO Google, Sundar Pichai, di panggung I/O. ***

0 komentar: