蘋果內(nèi)部機(jī)器人技術(shù)研究團(tuán)隊(duì)近日發(fā)布了一篇?jiǎng)?chuàng)新論文,推出了一項(xiàng)名為“ELEGNT”的框架,專為日?;?dòng)中的非人形機(jī)器人設(shè)計(jì),旨在賦予機(jī)器人實(shí)用性與情感表達(dá)能力。這一研究通過一款智能臺(tái)燈機(jī)器人,生動(dòng)展示了機(jī)器人如何通過肢體語言與用戶進(jìn)行細(xì)膩互動(dòng)。
這款臺(tái)燈機(jī)器人集成了LED光源、攝像頭、揚(yáng)聲器、麥克風(fēng)和激光投影儀等多種組件,能夠與用戶進(jìn)行手勢(shì)、語音、觸摸和投影等多種形式的交互。它不僅具備點(diǎn)頭、搖尾巴、低頭、坐下、躲避和接近等基本動(dòng)作,還能展現(xiàn)出緊張、失望、凝視和強(qiáng)調(diào)等多種情緒狀態(tài)。
蘋果團(tuán)隊(duì)認(rèn)為,非語言行為在人類交流中至關(guān)重要,能傳達(dá)內(nèi)心狀態(tài)。因此,在機(jī)器人設(shè)計(jì)中融入表達(dá)性元素,如意圖、注意力和情感,對(duì)于實(shí)現(xiàn)更自然的人機(jī)交互至關(guān)重要。而“ELEGNT”框架正是基于這一理念,結(jié)合了功能性驅(qū)動(dòng)和表達(dá)性驅(qū)動(dòng)兩種設(shè)計(jì)思路。
具體來說,“ELEGNT”框架包括意圖可視化、注意力引導(dǎo)和情緒共鳴三個(gè)方面。通過22個(gè)運(yùn)動(dòng)基元編碼,將底層需求轉(zhuǎn)化為可讀的身體語言;利用多軸關(guān)節(jié)實(shí)現(xiàn)類人注視行為,如預(yù)報(bào)天氣時(shí)自動(dòng)轉(zhuǎn)向窗外;開發(fā)情感狀態(tài)機(jī),讓機(jī)器人根據(jù)對(duì)話語境展現(xiàn)微表情。
為了驗(yàn)證“ELEGNT”框架的有效性,蘋果團(tuán)隊(duì)進(jìn)行了一系列對(duì)照實(shí)驗(yàn)。實(shí)驗(yàn)表明,在多個(gè)場(chǎng)景下,表達(dá)性臺(tái)燈機(jī)器人在實(shí)現(xiàn)目標(biāo)過程中的運(yùn)動(dòng)表現(xiàn)明顯優(yōu)于功能性臺(tái)燈機(jī)器人。例如,在用戶對(duì)物品進(jìn)行拍攝時(shí),表達(dá)性臺(tái)燈機(jī)器人會(huì)靈活移動(dòng),主動(dòng)幫助用戶尋找最佳光照角度;而功能性臺(tái)燈機(jī)器人則移動(dòng)遲緩。
表達(dá)性臺(tái)燈機(jī)器人在面對(duì)用戶錯(cuò)誤指令時(shí),會(huì)多次嘗試并略帶歉意地?fù)u頭表達(dá)無法完成任務(wù);而功能性臺(tái)燈機(jī)器人則直接表達(dá)任務(wù)失敗。在充當(dāng)社交伴侶時(shí),表達(dá)性臺(tái)燈機(jī)器人會(huì)根據(jù)用戶詢問的天氣情況,興奮地建議用戶進(jìn)行戶外活動(dòng);在被拒絕后,則會(huì)垂頭喪氣地表現(xiàn)出失落情緒。而功能性機(jī)器人則無法與用戶、環(huán)境產(chǎn)生除了語言之外的互動(dòng)。
表達(dá)性臺(tái)燈機(jī)器人還能積極提醒用戶喝水,找到水杯并推到用戶眼前,然后抬頭盯著用戶喝水;喝水完成后,繼續(xù)為用戶正在閱讀的書籍照明。相比之下,功能性機(jī)器人則只能通過燈光照射在杯子上對(duì)用戶進(jìn)行提醒。表達(dá)性臺(tái)燈機(jī)器人還能充當(dāng)“眼里有活”的項(xiàng)目助手,主動(dòng)變換角度進(jìn)行照明,并提供教程投影。
這項(xiàng)研究表明,表達(dá)性動(dòng)作能顯著提升用戶對(duì)機(jī)器人的好感度和互動(dòng)投入感,尤其在社交性任務(wù)中效果更為顯著。蘋果團(tuán)隊(duì)計(jì)劃根據(jù)研究成果整合出一個(gè)全新的生成式框架,讓非人形機(jī)器人能根據(jù)不同場(chǎng)景自動(dòng)生成既能完成任務(wù)又能“有溫度”地表達(dá)意圖的動(dòng)作。這一研究不僅展示了蘋果在機(jī)器人領(lǐng)域的創(chuàng)新能力,也為未來人機(jī)交互的發(fā)展提供了新的思路。