在此次Google I/O 2018里,Google借由讓展示Google Assistant代打電話給在地店家預(yù)約剪發(fā)及餐廳訂位,過(guò)程中幾乎讓接聽(tīng)人員未能察覺(jué)電話另一端并非人類(lèi),而是借由Duplex雙工技術(shù)驅(qū)動(dòng)的人工智能系統(tǒng),成為此次Google I/O 2018活動(dòng)期間最大亮眼展示。
過(guò)去人們不太擔(dān)心人工智能是否真正取代人類(lèi)工作權(quán)益,是因?yàn)槿斯?a class="channel_keylink" href="/search.asp">智能技術(shù)仍處于一問(wèn)一答的互動(dòng)模式,甚至還無(wú)法具體理解使用者實(shí)際需求,導(dǎo)致產(chǎn)生答非所問(wèn)的情況。
但是當(dāng)Google在此次Google I/O 2018展示采用全新Duplex雙工技術(shù)的Google Assistant,分別透過(guò)兩次電話代打預(yù)約剪發(fā)與餐廳訂位,Google Assistant不但能以相當(dāng)自然語(yǔ)調(diào)、頓句形式與電話另一端的店家工作人員對(duì)話,甚至也會(huì)出現(xiàn)人類(lèi)在真實(shí)情況中經(jīng)常出現(xiàn)的用語(yǔ)行為,同時(shí)也會(huì)出現(xiàn)揪舉接聽(tīng)人員聽(tīng)錯(cuò)部分,或是反問(wèn)更多問(wèn)題的情況,最后更在店家人員未察覺(jué)有異情況下完成預(yù)約,似乎讓人工智能技術(shù)給人的既定印象有了改變。
在此次展示中,Google Assistant不僅在對(duì)話過(guò)程成功理解店家人員表示無(wú)需預(yù)約的意思,甚至主動(dòng)詢(xún)問(wèn)大致約要等候時(shí)間,相比過(guò)往僅能理解單一語(yǔ)句的情況,更能同時(shí)理解前后文關(guān)聯(lián),借此在對(duì)話過(guò)程中試著將有關(guān)系詞句進(jìn)行串接,顯示新款Duplex技術(shù)將能讓人工智能系統(tǒng)正確判斷更多分析層內(nèi)容,使得Google Assistant能同時(shí)記錄理解復(fù)數(shù)以上提問(wèn)項(xiàng)目,并且在挑選合適回應(yīng)方式之余,也會(huì)記住先前曾經(jīng)回應(yīng)內(nèi)容,避免在對(duì)話過(guò)程產(chǎn)生答非所問(wèn)情形。
而Google是怎么辦到的?
第一個(gè)重點(diǎn)自然是先讓Google Assistant的語(yǔ)音呈現(xiàn)方式變得更自然,因此Google與John Lengend在內(nèi)人士合作真實(shí)聲音錄制,并且透過(guò)深度學(xué)習(xí)方式讓Google Assistant在發(fā)生過(guò)程能更貼近有自然起伏變化的真實(shí)語(yǔ)調(diào),而不會(huì)讓人一聽(tīng)就知道是電腦合成聲音。
其次,Google則是針對(duì)不同使用情境投入大量訓(xùn)練,例如此次在主題演講中展示的預(yù)約剪發(fā),以及餐廳訂位,看起來(lái)Google Assistant是用相同技術(shù)、邏輯達(dá)成相同成效,但實(shí)際上背后的訓(xùn)練邏輯可能還是會(huì)有所不同,例如第一個(gè)預(yù)約剪發(fā)的例子,基本上不太可能透過(guò)餐廳預(yù)約的場(chǎng)景進(jìn)行訓(xùn)練,雖然部分對(duì)話情況有些類(lèi)似,在實(shí)際談及內(nèi)容還是會(huì)有很大落差,例如在餐廳預(yù)約情況正常來(lái)說(shuō)并不會(huì)特別詢(xún)問(wèn)預(yù)約人的性別,同時(shí)也較不會(huì)出現(xiàn)多人一起預(yù)約的情況。
從Google的訓(xùn)練模式來(lái)看,預(yù)約剪發(fā)的場(chǎng)景會(huì)透過(guò)眾人過(guò)去預(yù)約對(duì)話內(nèi)容進(jìn)行訓(xùn)練,并且從中學(xué)習(xí)人類(lèi)在實(shí)際對(duì)談時(shí)可能出現(xiàn)的贅詞、重復(fù)內(nèi)容、代稱(chēng)或無(wú)意義的碎念,甚至模仿人類(lèi)透過(guò)“嗯哼”用詞表達(dá)仍在聽(tīng),而不是一再重復(fù)“我在聽(tīng)”,因此讓不少人訝異Google Assistant目前可實(shí)現(xiàn)技術(shù)。
由于人類(lèi)說(shuō)話內(nèi)容相當(dāng)復(fù)雜,一般要讓Google Assistant能理解使用者語(yǔ)句內(nèi)容,多半是透過(guò)擷取關(guān)鍵字詞進(jìn)行分析判斷,進(jìn)而決定以何種方式應(yīng)對(duì),但現(xiàn)階段要做到讓人工智能可快速針對(duì)不同場(chǎng)景調(diào)整應(yīng)對(duì)內(nèi)容,目前仍受限于處理效率與訓(xùn)練模型規(guī)模,使得Google目前仍?xún)H能讓Google Assistant對(duì)應(yīng)特定服務(wù)項(xiàng)目可提供真人般的互動(dòng)模式,并非已經(jīng)打造一款可真正與人無(wú)所不談的人工智能系統(tǒng)。
借由類(lèi)神經(jīng)網(wǎng)絡(luò)堆疊學(xué)習(xí),同時(shí)持續(xù)透過(guò)使用者互動(dòng)訓(xùn)練,Duplex技術(shù)將能讓Google Assistant在特定情境中變得更知道如何與人互動(dòng),甚至當(dāng)有全新互動(dòng)產(chǎn)生時(shí),系統(tǒng)也會(huì)持續(xù)學(xué)習(xí)。而這樣的作法,則適合讓店家能針對(duì)本身服務(wù)提供全自動(dòng)線上客服功能,例如餐廳可借由此項(xiàng)系統(tǒng)以更有效率方式接單或接受訂位,無(wú)需在繁忙時(shí)候仍須分配人手接聽(tīng)電話,消費(fèi)者端也能“委托”Google Assistant協(xié)助代勞聯(lián)系難以接通電話的餐廳,并且完成訂位,無(wú)論對(duì)餐廳業(yè)者、消費(fèi)者都能帶來(lái)更大便利。
目前Google暫時(shí)還沒(méi)有計(jì)劃讓Google Asssitant能同時(shí)理解眾多場(chǎng)景的對(duì)話互動(dòng)模式,但未來(lái)似乎也不排除往此方向發(fā)展。因此,為了避免造成使用者猜測(cè)電話另一端是否為人工智能系統(tǒng),Google計(jì)畫(huà)在未來(lái)服務(wù)內(nèi)使Google Assistant在電話代打過(guò)程中,將會(huì)自行“表明身分”。
我們需要為此擔(dān)心嗎?
當(dāng)人工智能已經(jīng)可以代勞完成餐廳預(yù)約等事項(xiàng)時(shí),我們是否應(yīng)該擔(dān)心?其實(shí)更應(yīng)該考量的是在這些科技推動(dòng)之下,如何調(diào)整自己的步伐接受更便利的科技體驗(yàn),就像手機(jī)逐漸改變傳統(tǒng)溝通方式,同時(shí)也持續(xù)改變消費(fèi)者對(duì)于內(nèi)容使用模式,進(jìn)而影響傳統(tǒng)報(bào)媒、電視等內(nèi)容發(fā)展結(jié)構(gòu),卻也產(chǎn)生App使用、移動(dòng)體驗(yàn)等全新發(fā)展機(jī)會(huì),而當(dāng)機(jī)器手臂逐漸取代傳統(tǒng)以手工制作的情況,是否也意味需要手工完成更精密的操作將有更充裕人力資源可分配。
事實(shí)上,當(dāng)科技發(fā)展速度越快的時(shí)候,原本就應(yīng)該以更謹(jǐn)慎心態(tài)看待此項(xiàng)技術(shù)發(fā)展,并且透過(guò)新技術(shù)推動(dòng)發(fā)展機(jī)會(huì),而不是一昧產(chǎn)生排斥,否則只會(huì)讓自身發(fā)展腳步變得落后。