我個人一直把 AI 炒作當(dāng)成休閑娛樂的好素材
一臺機(jī)器人不可能自己學(xué)習(xí)如何玩層層疊游戲。首先承認(rèn),我沒讀推文鏈接中的文章,但毫無疑問的是,有一幫家伙打算讓一臺機(jī)器人學(xué)會玩層層疊。人類,付出了巨大的努力,構(gòu)建起一套復(fù)雜的系統(tǒng),使得機(jī)器人能夠利用某種數(shù)據(jù)進(jìn)行自主學(xué)習(xí)。這些數(shù)據(jù)一般來自人類的親身試驗,或者由人類通過適當(dāng)設(shè)置進(jìn)行強化,從而確保機(jī)器人能夠在“自己玩”的過程中掌握其中的訣竅。換言之,這一切,都需要人類的參與。
同樣的,到 2020 年,汽車也不可能全面實現(xiàn)無人駕駛,語音識別也無法接近人類的水平。“Alexa”根本不能作為真正的交談對象,計算機(jī)視覺無法回答一切視覺問題,我們也沒必要擔(dān)心機(jī)器人產(chǎn)生自我意識并到處追殺人類。
有些人意識到了在熱火朝天的 AI 發(fā)展背后,種種樂觀甚至公正的預(yù)測都沒能及時成為實現(xiàn),這也導(dǎo)致了“AI 寒冬”理論的出現(xiàn)。但實際情況恐怕也不會朝這個方向前進(jìn)。AI 寒冬說的來源,在于 AI 領(lǐng)域存在著太過夸張的炒作與期望,而其發(fā)展?jié)摿s并沒那么可觀?,F(xiàn)在,是時候來一波撥亂反正了。人們把 Alexa 視為一種會話代理,但它在本質(zhì)上就是一款更先進(jìn)的麥克風(fēng),是一套基于規(guī)則但設(shè)計目的更為廣泛的系統(tǒng),并由深層神經(jīng)網(wǎng)絡(luò)提供更好的語音識別效果?!哆B線》在文章中將深度學(xué)習(xí)描述為貪婪、脆弱、不透明且淺薄的事物——這些說法都是對的,但即使存在種種限制,其仍然能夠完成很多很多重要的工作。
所謂實用性 AI,更多關(guān)注我們應(yīng)該如何總結(jié)問題以及能夠收集哪些數(shù)據(jù),而非強調(diào)那些花哨奪目的新模型。這里得多提一句,當(dāng)下人們對于新模型有點關(guān)注過度,甚至把它捧得與久經(jīng)考驗的網(wǎng)絡(luò)、系統(tǒng)以及數(shù)據(jù)庫一樣高。事實上,它就是一種新算法,而且最終需要歸于人類。
人類的表現(xiàn),就是超級 AI 的效能基準(zhǔn)(報道中就總會說某些方法已經(jīng)能夠在某些具體問題上達(dá)到人類的水平)。然而,人類真正關(guān)注的內(nèi)容,卻往往被這些超級 AI 所忽視。但沒關(guān)系,隨著 AI 成果在邁向?qū)嶋H應(yīng)用的過程中不斷受矬,研究人員們最終會重拾這些關(guān)注核心,并將其作為新的探索前沿。而只要能夠從這個角度思考問題,炒作之聲也將自然消散。畢竟無人駕駛汽車目前只能在擁有良好照明條件的主干道路上行駛,而人類司機(jī)則能夠?qū)ふ页丝?、給車輛加油、動手處理一些小的機(jī)械故障、確保醉酒的乘客安全抵達(dá)以及將身體不適的老年乘客及時送往醫(yī)院等等。
我們開始逐漸擺脫大肆宣傳 AI 能夠重現(xiàn)人類表現(xiàn)的階段,繼而轉(zhuǎn)向更實用主義、也更加以人為本的機(jī)器學(xué)習(xí)應(yīng)用道路。如果說炒作的外露冰山正在快速融化,那么偉大的以人為本應(yīng)用理念就是支撐這一切的水下基座。
統(tǒng)計模式識別與人類非確定性
幾天之前,我曾在推特上提到,如果我們不再使用“AI”這種表述,而是使用更具體更準(zhǔn)確的“統(tǒng)計模式識別”這一術(shù)語,那么炒作問題是否能夠隨之消散。
其他人對此有著不同的見解——Judea Pearl 認(rèn)為我們需要新的方法實現(xiàn)因果推理,Pedro Domingos 致力于尋找“主算法”,也有不少人希望實現(xiàn)“與動物能力相仿的認(rèn)知功能優(yōu)化”并逐步推進(jìn)至人類智能重現(xiàn)。
無論這一切要如何實現(xiàn),相關(guān)討論都客觀存在,因為“AI”這個詞本身就傳達(dá)出一種智能概念——而當(dāng)前的方法,顯然無法實現(xiàn)與人類相當(dāng)?shù)闹悄芩?。我們的系統(tǒng)缺乏常識,無法跨領(lǐng)域進(jìn)行類比、推理因果關(guān)系,也不具備與充滿非確定性的人類進(jìn)行交互時所必需的其它智能要素 [1]。
但我們必須承認(rèn),單是統(tǒng)計模式識別就堪稱一種極為強大的工具。要想充分加以利用,我們需要努力找到那些特別典型而且特別重要的問題,以確保 SPR 能夠良好運作。立足于現(xiàn)有人機(jī)交互及其固有方法的起效方式,我們的實現(xiàn)思路可以總結(jié)為:發(fā)現(xiàn)重要問題 ->將其映射為計算機(jī)易于處理的解決方案 ->收集有意義的數(shù)據(jù)集 ->設(shè)計出對人類有意義的交互方式。
人機(jī)交互(以及人類在 AI 當(dāng)中訓(xùn)練產(chǎn)生的人機(jī)交互方法)的存在,正是我認(rèn)為 AI 不會進(jìn)入寒冬,而只會走向秋季的原因所在。能夠運用 ML 解決真實人類問題的從業(yè)者,將成為下一階段中最為關(guān)鍵的技術(shù)力量。隨著各類易于使用的算法庫的出現(xiàn),功能強大的 ML 將逐步實現(xiàn)民主化普及;如果大家希望保持依靠地位,那么必須得掌握與人機(jī)交互相關(guān)的各項技能。
如果你的目標(biāo)在于順利度過寒冬,并希望有朝一日能夠開發(fā)出真正具有智能的 AI 方案,那么請擺脫深度學(xué)習(xí)與實際應(yīng)用的束縛,勇敢探索更為遠(yuǎn)大的目標(biāo)。
但如果你的目標(biāo)是獲得看得見、摸得著的回報,那么人機(jī)交互將是后續(xù)研究當(dāng)中無法回避的核心。
人機(jī)交互,收獲 AI 果實的工具
人機(jī)交互的力量源自多個學(xué)科——其中至少包括計算機(jī)科學(xué)、設(shè)計以及行為科學(xué)(心理學(xué)、認(rèn)知科學(xué)等)。熟練掌握人機(jī)交互的從業(yè)者,能夠通過各種以人為本的方法理解現(xiàn)有方案,設(shè)計并實現(xiàn)未來方案,同時對其加以驗證。與大多數(shù)研究領(lǐng)域一樣,一部分從業(yè)者可能專注于研究用戶對于當(dāng)前技術(shù)的使用方式,也有些人會專門負(fù)責(zé)設(shè)計可能具有發(fā)展前景的未來方案,或者構(gòu)建出未來技術(shù)系統(tǒng)的原型框架以供人們體驗。
以下,是我認(rèn)為人機(jī)交互(及其相關(guān)領(lǐng)域)研究與實踐方法中,有望真正收獲到 AI 果實的部分領(lǐng)域。而且無論未來幾十年中真正的智能機(jī)器能夠取得怎樣的發(fā)展,這些領(lǐng)域都將長期擁有非常重要的學(xué)科地位:
用于支持人類的智能應(yīng)用
隨著機(jī)器學(xué)習(xí)方法的理解門檻不斷下降,并被更好地整合至現(xiàn)成工具當(dāng)中,最大的挑戰(zhàn)將轉(zhuǎn)變?yōu)槿绾卫盟鼈兘鉀Q真正的人類問題。而這,正是人機(jī)交互最擅長的方向所在!
正如 Vannevar Bush 在《As We May Think》(https://www.theatlantic.com/magazine/archive/1945/07/as-we-may-think/303881/)中所提到,在發(fā)展初期,智能機(jī)器的重點在于智能增強(簡稱 IA)。雖然我們將 Douglas Engelbart 視為鼠標(biāo)之父,但他實際上將主要精力投入到了“一切演示之母”項目當(dāng)中,即探索如何利用計算技術(shù)以普遍方式增強人類智能。曾有一段時間,這方面議題被稱為“智能用戶界面”,并被直接作為一大重要相關(guān)會議的名稱。如今,隨著 AI 技術(shù)局限性(以及 AGI,即人工通用智能,幾成發(fā)展死胡同)的坐實,“人類增強”概念正在重新流行起來。由于其中諸多見解至今仍然具有深刻的現(xiàn)實意義,我們?nèi)匀挥斜匾J(rèn)真拜讀技術(shù)先驅(qū)者留下的寶貴思想。
人機(jī)交互的當(dāng)前任務(wù),在于找出那些能夠幫助人類解決的重要難題——即收集并擴(kuò)展新的數(shù)據(jù)集,找到能夠?qū)崿F(xiàn)人類與機(jī)器間協(xié)作的新方式,發(fā)明出能使設(shè)備與人類世界更易于訪問的新系統(tǒng),創(chuàng)造出 ML 支持型傳感繁育,將成果應(yīng)用于交互與健康領(lǐng)域,并致力于幫助人們更好地構(gòu)建 ML 模型等。
這一領(lǐng)域中的種種挑戰(zhàn)與影響,反映出的是這樣一項基本事實——最重要的是創(chuàng)造并解決新問題,而非改進(jìn)現(xiàn)有解決方案。因此,我們需要遵循發(fā)現(xiàn)并驗證問題,不斷提出潛在的解決方案與原型設(shè)計并加以改進(jìn),最終驗證解決方案是否能夠?qū)嶋H解決預(yù)期問題這一完整的基本流程。
隨著機(jī)器學(xué)習(xí)算法的商品化,那些能夠立足整體機(jī)器學(xué)習(xí)應(yīng)用場景統(tǒng)籌全局的人才,將成為新時代下的 VIP。
設(shè)計與 AI
長期以來,人機(jī)交互工作者一直在考量人類應(yīng)該如何與 AI 實現(xiàn)相互作用,以及如何開展工作以切實達(dá)成這種作用。早在上世紀(jì)九十年代,Pattie Maes 與人機(jī)交互先驅(qū) Ben Schneiderman 就曾在“代理與直接操縱”(https://www.lri.fr/~mbl/ENS/FONDIHM/2013/papers/ShneidermanMaes-Interactions97.pdf)這場經(jīng)典的辯論當(dāng)中體現(xiàn)出這樣的思維。Ben 后來又發(fā)現(xiàn),信息可視化探索實際上是一種方法論反應(yīng),其希望解決的是人類如何直接與日益豐富、日益復(fù)雜的數(shù)據(jù)世界進(jìn)行交互這個問題。
很久之前,同時涉及 AI 與人機(jī)交互領(lǐng)域的從業(yè)者們就已經(jīng)意識到,構(gòu)建包含“AI”元素的用戶界面時,其基本思路應(yīng)該有所不同;這主要是因為 AI 往往存在不確定性,且正確率往往有待商榷。Eric Horvitz 和其他一些研究者將此稱為“混合主動交互”。大家可以在這篇 經(jīng)典論文(CHI 1999 http://erichorvitz.com/chi99horvitz.pdf)當(dāng)中讀到相關(guān)論點,此外我還推薦大家參考由 AI 大師 James Allen(會話交互)發(fā)表的另一篇文章(https://www.microsoft.com/en-us/research/wp-content/uploads/2016/11/mixedinit.pdf)。Eric 曾與 Saleema Amershi 等其他作者在他們的 CHI 2019 論文《人類 -AI 交互指南(Guidelines for Human-AI Interaction)》當(dāng)中對此做出更新陳述。
在某種程度上,人類好像更傾向于在接近終點時才真正開始認(rèn)真考慮問題,但這無疑為時已晚。一位我覺得不太適合公布姓名的同事曾經(jīng)把目前 AI 行業(yè)的工作,描述成“努力給 AI 這頭豬涂上口紅,希望讓它變得漂亮一點”。也正因為如此,目前設(shè)計與 AI 的前沿體現(xiàn)為探索設(shè)計師們該如何將機(jī)器學(xué)習(xí)作為一種設(shè)計素材。這項工作的核心要點,在于教會設(shè)計師們?nèi)绾慰创龣C(jī)器學(xué)習(xí)。這不僅是要思考如何在界面當(dāng)中向用戶呈現(xiàn)確定性較差的 AI 結(jié)果;相反,其核心應(yīng)該是如何找出需要解決的問題,歸納出能夠使 ML 方法與人類期望相匹配的問題內(nèi)容,最后確定哪些問題可以被轉(zhuǎn)換為已經(jīng)得到良好解決特定用例。
設(shè)計要素,正迅速成為同類產(chǎn)品之間的關(guān)鍵差異化因素;換言之,那些能夠更好地運用機(jī)器學(xué)習(xí)成果的設(shè)計師,最終將為我們帶來最大的技術(shù)價值。
計算社會科學(xué)
機(jī)器學(xué)習(xí)正在探索我們所做的一切,因此我們應(yīng)當(dāng)認(rèn)真考慮機(jī)器學(xué)習(xí)的含義,以及我們可以采取哪些措施來減輕其負(fù)面影響。計算社會科學(xué)家們帶來的方法,傾向于更多以面向人類的方式進(jìn)行研究,使用人機(jī)交互中體現(xiàn)出的各類技術(shù),并立足調(diào)查、訪談、日志分析以及民族志等素材從心理學(xué)及認(rèn)知科學(xué)等基礎(chǔ)領(lǐng)域借鑒寶貴經(jīng)驗。
這些技術(shù)已經(jīng)對用戶如何理解(或者誤解)作為其交互對象的算法(例如 Facebook 的新聞推送、可能導(dǎo)致極端主義思潮的 YouTube 推薦系統(tǒng)、識別社交媒體內(nèi)虛假新聞傳播活動的機(jī)制、用戶界面元素如何影響在線會話以及用戶對于網(wǎng)絡(luò)隱私問題的認(rèn)知等等)給出了深刻的見解。
人機(jī)交互在識別或解決這些問題方面并不具備壟斷能力,但考慮到我們自身既是創(chuàng)造者也是設(shè)計師,人機(jī)交互在揭露與干預(yù)此類問題當(dāng)中確實擁有著不可替代的獨特地位。
以上只是我個人對于人機(jī)交互相關(guān)工作以及即將到來的 AI 之秋趨勢的簡要概括。
總結(jié)陳詞
“只要保質(zhì)保量把工作做好,一切就都會好起來!”……在 AI 領(lǐng)域,人們越來越清醒地意識到 AI 之秋即將來臨,因此要想在這一領(lǐng)域保有必要的技能與存在感,人機(jī)交互絕對是個不容忽視的重要領(lǐng)域。
[1] 這句表述援引自 Gierad Laput(http://jeffreybigham.com/blog/2019/the-coming-ai-autumnn.html),我并不確定其在技術(shù)層面是否準(zhǔn)確,但我認(rèn)為它能夠很好地向計算機(jī)科學(xué)家們解釋,為什么計算機(jī)科學(xué)很難重現(xiàn)人類天然具有的種種能力。
【來源:AI 前線】