在智能家居里,大家都似乎都聚焦著新的產(chǎn)品和體驗研發(fā),怎么樣的智能體驗最人性化,又適合生活所需呢?誰將會取代鍵盤和觸控屏成為下一個智能家居的人機界面呢?
近日,有外媒認為,稱計算機的問題在于,它仍然是人類與他們想要做的事情之間的中介者,增強現(xiàn)實未來或許可以將計算機剔除在外,產(chǎn)生下一個重要的界面。
不過,有的專家還有要激進得多的想法:開發(fā)界面來支持大腦與計算機之間的直接通訊。
▍界面與技術(shù)
電腦鍵盤對于正在使用它的人來說并不顯眼。它設(shè)計得為人所感知,產(chǎn)生的聲音被人聽見,但大多時候它的存在都不會引起注意。一旦你習慣使用它了,你通常都不會將注意力放在你所按的按鍵或者那些按鍵所產(chǎn)生的咔嗒聲上。相反,你是沉浸于電腦屏幕上出現(xiàn)的東西。
從這方面來看,技術(shù)一直以來都是扮演中介者的角色,通過它人類能夠與他們的環(huán)境產(chǎn)生關(guān)聯(lián)。最早期,當人類能利用身體來完成工作時,他們開發(fā)了工具,讓它們來幫忙完成那些事情,如斧頭、錘子和皮帶輪。一千年來,機器變得能夠處理越來越復雜的體力勞動,而人類仍要承擔大部分的信息處理工作。在上一世紀,這一點發(fā)生了巨大的變化。
由于計算機能夠處理諸如密碼破譯、復雜運算的任務,該平衡發(fā)生了變化??商幚頂?shù)據(jù)的機器需要比簡單的杠桿或者車輪復雜得多的界面。不過,同樣的在信息任務上帶來全新人機協(xié)作方式的界面也會受到其自身設(shè)計的制約。
▍信息處理問題
“這催生了信息處理問題?!泵绹鴩易赃m應神經(jīng)技術(shù)中心副主任格文·沙爾克表示,“忽然之間,在我們與環(huán)境的交互中,并不只有人和某種工具了,當中還有某樣東西——它就是計算機。”
在沙爾克看來,問題在于,人類和計算機能夠做的事情要遠遠多于橫在二者之間的界面允許他們做的事情。
“計算機非??焖?,它們非常先進,它們能夠在剎那之間處理海量復雜的數(shù)據(jù)?!彼f,“人類則很擅長其它的事情。對于某個場景,他們能夠一眼就看出正在發(fā)生什么事情。他們能夠建立起復雜的關(guān)系。現(xiàn)在出現(xiàn)的問題是通訊問題。所以根本性的問題在于,極其強大復雜的人類要如何與日益復雜能干的環(huán)境進行交互?機器人非常復雜,計算機非常復雜,我們的手機也非常復雜?!?/SPAN>
在技術(shù)史的當前階段,界面設(shè)計的目的是使得計算機能夠在人類感知運動系統(tǒng)的界限內(nèi)做盡可能多的事情。鑒于眾人使用電腦的目的,這一安排非常合理。大多時候,人們是用電腦來瀏覽資訊,編寫文本,或者看照片視頻。
“就那一點而言,鍵盤和鼠標——還有觸控板,以及由于可靠性相對不足而不那么普遍的語音控制——仍然很便宜,很適合處理那些任務?!睓C器人專家Kaijen-Hsiao指出。但對于其他人來說,傳統(tǒng)的界面其實并不足夠。
簡單來說,這是一個比人際溝通更有挑戰(zhàn)性的溝通問題——它本身就很復雜,且有多面性。人際溝通中通常都會伴隨某種程度的語言轉(zhuǎn)換。而與機器溝通所需的額外步驟則極其麻煩。
“當你試圖向計算機或者機器人解釋同一件事情時,你得將大腦中的鮮活意象轉(zhuǎn)化成符合語法和語義學的語言,這一過程已經(jīng)喪失了很多的鮮活性和語境。”沙爾克說道,“之后,你將那些語言轉(zhuǎn)化成手指運動,通過計算機鍵盤輸入那些句子。認真想想,你就知道這有多荒謬?!?/SPAN>
從實踐層面來看,對于大多數(shù)人說,這種荒謬是不存在的。畢竟,要編寫郵件,你得使用鍵盤來輸入內(nèi)容。
沙爾克指出,“任何形式的人類交流速度都不超過每秒鐘50拍——不管是口頭交流還是敲字交流。那基本上就是人類給外部技術(shù)設(shè)備傳輸信息的最快速度。每秒50拍可以說遠遠不夠,簡直是可悲。想想計算機和大腦每秒鐘能夠內(nèi)部處理多少GB的數(shù)據(jù),就知道這是何等量級的錯配啊?!?/SPAN>
▍微妙的通訊形式
隨著機器變得越來越先進,這種錯配會變得愈發(fā)明顯。數(shù)位機器人專家稱,要是沒能改進現(xiàn)有的界面,那么人類最終將無法在機器學習、人工智能等領(lǐng)域取得進展。
“隨著語音識別、自然語言處理、臉部識別等技術(shù)變得越來越出色,我們與機器的通訊應當能夠超越屏幕,包含部分我們用來與其他人互動的較為微妙的通訊形式?!痹诼槭±砉W院研究人機交互的凱特·達林指出,如果希望機器能夠模擬人類的情感狀態(tài),那么讓它通過音調(diào)、活動及其它線索表達出來,它的能力就會得到更加完整的表現(xiàn)。
杜克大學機器人實驗室主任米西·卡明斯指出,“跟其他人一塊時,我們會利用我們的周邊視覺來觀察他們的細微動作,從而推斷出他們的行動,而機器人則不能像人類那樣流暢行動。因此,我們必須要知道該如何理解更加細微的交互,比如通過結(jié)合利用光和聲?!?/SPAN>
在一些場景中,如人在駕駛,需要注意路況的時候,語音通訊仍然是最好的交互界面?!爱斎?,語音通訊的問題在于,語音識別系統(tǒng)還不夠出色?!笨魉拐f道。
目前已經(jīng)有公司在大力改進基于語音的界面,像Siri這樣的數(shù)字助手和像亞馬遜Echo這樣的智能設(shè)備將會在人們的日常生活中扮演越來越重要的角色。與此同時,其它的中介型界面也很可能將迎來改進。
▍增強現(xiàn)實和虛擬現(xiàn)實
觸控屏在某種程度上已經(jīng)獲得了改進。該界面曾在很長一段時間里被認為對于流行設(shè)備毫無價值,因為該技術(shù)不夠出色。不過,到目前為止,其它的界面——語音控制、手寫數(shù)字轉(zhuǎn)換器、運動控制等等——都還沒真正實現(xiàn)騰飛。
很多技術(shù)專家認為,增強現(xiàn)實和虛擬現(xiàn)實的興起將會產(chǎn)生下一個重要的界面。但有數(shù)位工程師和學者指出,這樣的躍進將需要目前還未出現(xiàn)的技術(shù)進步。
一方面,時下最先進的混合現(xiàn)實平臺在實時繪制用戶所在的現(xiàn)實世界方面都不夠精確。也就是說,該類系統(tǒng)便于將網(wǎng)頁或者其它的虛擬元素投射到所在房間的墻壁上,但它們還遠未能夠做些足夠革命性的事情來徹底改變?nèi)祟愃伎既藱C交互的方式。
對于開發(fā)者來說,這些系統(tǒng)的關(guān)鍵問題之一在于,理解非虛擬世界在不同時候?qū)θ祟惖闹匾潭?。喬治亞理工學院交互式計算教授布萊爾·麥金泰爾舉例說道,對于電話會議,使用增強現(xiàn)實要比虛擬現(xiàn)實好得多?!澳憧隙ú恢皇窍胍娫挄h的虛擬現(xiàn)實版本,因為我可能需要看看我的筆記,或者在電腦上輸入信息,又或者需要小心拿起我的咖啡杯,避免將其弄翻?!?/SPAN>
麥金泰爾喜歡將這一問題稱作“喝啤酒問題”,即你在玩視頻游戲時會需要停下來喝口啤酒?!霸谔摂M現(xiàn)實中,那不容易做到。”他說,“但在增強現(xiàn)實中,那就好辦點。”他認為,最終,增強現(xiàn)實將能夠追蹤較小的物體,擴增現(xiàn)實世界中較小的東西,這會使得它的應用程序和界面變得更加先進。顯示屏將會變得更加清晰。
例如,在機場查看航班信息,會意味著利用混合現(xiàn)實來在你眼前查閱信息,而不是通過智能手機查找相關(guān)信息,也不是在機場中尋找實體的展示板。
“但我覺得我們?nèi)孕枰I盤和觸控屏來輸入信息?!彼f,“觸覺反饋非常重要。我在HoloLens上試過通過空中的虛擬鍵盤觸控輸入。它們不大好使是吧?因為到你看到手指輸入所產(chǎn)生的視覺反饋或者聽到聽覺反饋時,你還會有意識地控制手的輸入動作?!?/SPAN>
他說,未來,對于智能手機用戶而言已經(jīng)標準化的操作動作最終可能會應用于增強現(xiàn)實當中。對于這種界面,很多人都會聯(lián)想到科幻電影,一系列的手勢可以用于執(zhí)行復雜的計算任務。
▍計算機的問題
不過,更好的界面不僅僅要在技術(shù)上具有可行性。它們還要能夠取悅用戶。出色的設(shè)計讓iPhone感覺很直觀,盡管有吸引力的界面可能比直觀的界面來得更加重要。例如,當基于手勢的界面不是很直觀的時候,有一整個研究社區(qū)致力于對其進行改良。
杜克大學的機器人專家卡明斯認為,這不一定是好事。她說,人類習慣于將手勢當做是強調(diào)某事的方式,但除了需要打手語的人之外,“我們實際上有多經(jīng)常使用手勢呢?”她補充道,“那種方式實際上增加了你的心理工作負荷,因為你必須要記住所有不同手勢的意思?!?/SPAN>
另外,并不是說鍵盤特別直觀?,F(xiàn)在,它們對于很多人來說或許是第二天性,但以往情況則不一樣?!跋胂肟?,即便是現(xiàn)在,你是在使用水平的指向設(shè)備,鼠標與屏幕是呈垂直關(guān)系?!倍趴舜髮W的另一位機器人專家邁克爾·克拉曼表示,“這種交互很怪異。然后觸控屏出現(xiàn)了,一定程度上解決了那一問題,但其分辨率受限于你的手指的寬度,每一次你觸摸屏幕,你都會覆蓋它的一部分。盡管這些界面都變得更好了,但它們?nèi)源嬖诰窒扌?。?/SPAN>
“計算機的問題在于,它仍然是人類與他們想要做的事情之間的中介者?!彼a充道。
▍人機直接通訊
在沙爾克位于紐約奧爾巴尼的實驗室,科學家們正致力于開發(fā)界面來支持大腦與計算機之間的直接通訊。他們的主要挑戰(zhàn)之一是,開發(fā)更好的方式來實時估量大腦在做什么,以理解這背后的含義。沙爾克和他的同事已經(jīng)證明,從大腦活動推知意義理論上是可能的,這一想法對于人機交互的未來有著令人驚訝的意義。
“如果你能夠通過某種方式與計算機直接交互,繞過你的感知運動系統(tǒng)帶來的種種限制,那你就可以讓人的所有感覺、觀念和欲望能夠被技術(shù)直接訪問?!彼f,“你可以完全消除這種通訊瓶頸,在技術(shù)和大腦之間打造一種共生關(guān)系?!?/SPAN>
我們有理由相信這終有一天有可能會實現(xiàn)?!拔覀円呀?jīng)能夠?qū)⒋竽X信息轉(zhuǎn)化成完整的句子。”他說道,“通過觀察大腦信號,我們可以分辨你是在說某個詞,還是在想象說某個詞。這并非科幻小說。這是已經(jīng)刊登的、且經(jīng)過同行評議的論文?!?/SPAN>
然而,如果有某種新界面不久之后改變我們與機器通訊的方式,那它不大可能會是直接的人機連接。目前,沙爾克和他的同事在研究因為臨床原因大腦被植入電極的病患。即便那樣,他們的研究也容易出錯。沙爾克說,他正期待的是,有更好的技術(shù)出現(xiàn),使得大腦活動的精密測量無需侵入體內(nèi)的大腦植入物。他說,這如果發(fā)生的話,“那我們將非常接近于顛覆整個世界?!?/SPAN>
▍結(jié)語
只需要想一想就能讓計算機執(zhí)行你的指令。用戶只需要用自己的意愿就能控制一群智能家電、開關(guān)面板、機器人、無人機等等。不但是對智能家居,對整個社會的潛在影響也是匪夷所思的,無可否認,下一個界面將遠遠超越人類迄今為止借助技術(shù)對社會所做的事情。