文章目錄
從大廠動(dòng)向看今年的全球 ai 三大發(fā)展趨勢(shì)
① 人工智能將更趨向于模擬真人
② 人工智能將越來越有用
③ 人工智能與人類:替代與協(xié)同
9 月 15 日舉行的“百度世界 2020”大會(huì)展現(xiàn)了百度過去一年的 ai(人工智能)布局及成果,為國(guó)際 ai 大廠年度“交作業(yè)”補(bǔ)上了一片重要的拼圖。
谷歌、微軟、亞馬遜等實(shí)力雄厚的科技巨頭,是全球 ai 產(chǎn)業(yè)的重要驅(qū)動(dòng)力量。這些頭部公司大多會(huì)每年一次集中發(fā)布新技術(shù)和新產(chǎn)品,每次都成為預(yù)測(cè)全球 ai 趨勢(shì)的風(fēng)向標(biāo)。
受疫情影響,今年的谷歌和 facebook 開發(fā)者大會(huì)取消,但是蘋果、微軟 和亞馬遜等還是分別在線上發(fā)布 ai 相關(guān)進(jìn)展。通過巨頭們今年的各項(xiàng)技術(shù)發(fā)布,全球 ai 業(yè)界的三個(gè)主要發(fā)展趨勢(shì)也逐漸清晰起來:
ai 將更趨向于模擬真人,包括模擬語(yǔ)音、動(dòng)作和性格。
ai 在不斷訓(xùn)練之下會(huì)變得更有用,可靠性更高;同時(shí)越來越不依賴云端,而是在本機(jī)和低功耗設(shè)備上運(yùn)行。
ai 將從事更多重復(fù)的事務(wù)性工作,人類與 ai 的分工合作也同時(shí)增加。
今年的“百度世界”都發(fā)布了什么
“百度世界 2020”定檔 9 月,是國(guó)內(nèi)疫情防控常態(tài)化的又一標(biāo)志。3 個(gè)小時(shí)的大直播與央視新聞聯(lián)合呈現(xiàn),由康輝坐鎮(zhèn)主持,多位央視新聞名嘴作為“ai體驗(yàn)官”全程參與。
讓媒體感到新奇的是,百度安排大家在“分會(huì)場(chǎng)”——一家電影院的 imax 廳觀看直播,這不禁讓人想起去年央視攜手全國(guó)影院以 5g 4k 直播國(guó)慶 70 周年閱兵式的情景。
會(huì)上的主要發(fā)布包括:
(1)無人駕駛:百度 apollo 在首鋼園區(qū)現(xiàn)場(chǎng)演示了完全無人駕駛所包含的三大要素:前裝量產(chǎn)車、ai 老司機(jī)(即不配備安全員的“主駕無人駕駛”)、5g“云代駕”。當(dāng)路面路況有變動(dòng)或交通管制等情形時(shí),車輛可由云端駕駛員遠(yuǎn)程控制來“平行駕駛”。
(2)小度助手:小度助手(dueros)版本升級(jí)到 6.0,公布數(shù)據(jù)稱月交互次數(shù)超 58 億次,有 4.2 萬名開發(fā)者和 4000 多個(gè)優(yōu)秀技能。大會(huì)展示了小度的三個(gè)主要場(chǎng)景即家庭、酒店地產(chǎn)、車載。此外發(fā)布了首款搭載小度的真無線智能耳機(jī),為小度補(bǔ)充了第四個(gè)場(chǎng)景——隨身。
(3)百度移動(dòng)生態(tài)的服務(wù)化、人格化:大會(huì)介紹了百家號(hào)、智能小程序、托管頁(yè)的相關(guān)進(jìn)展。百度知道、文庫(kù)等 u/pgc 平臺(tái)正陸續(xù)和百家號(hào)體系打通。專家、達(dá)人通過百家號(hào)開設(shè)的直播會(huì)在百度搜索結(jié)果頁(yè)優(yōu)先展示。百家號(hào)創(chuàng)作者數(shù)量已達(dá) 340 萬。
大會(huì)還發(fā)布了創(chuàng)新搜索產(chǎn)品“度曉曉”,這款手機(jī)上的養(yǎng)成類虛擬助理app建立在小度助手的能力基礎(chǔ)上。隨著用戶的使用,“度曉曉”可以形成不同的性格。
(4)百度大腦 6.0:大會(huì)展示的終端虛擬人“小康”“小李”融合了視覺、語(yǔ)音、語(yǔ)言、知識(shí)等多模態(tài)的百度大腦 ai 技術(shù)。和同類產(chǎn)品相比,它們的“認(rèn)知能力”有很大提升,生成和展示門檻也大大降低,有助于打造具有人情味的下一代虛擬客服。
百度大腦目前開放了 270 多項(xiàng)能力,聚集了 230 萬開發(fā)者。飛槳深度學(xué)習(xí)平臺(tái)和昆侖通用 ai 處理器,標(biāo)志著百度掌握了 ai 核心底層技術(shù)。會(huì)上還展示了山東電力、森林防火、央視新聞等 ai 應(yīng)用案例。
可以明顯地感受到,現(xiàn)在提及全球范圍的 ai 巨頭時(shí),人們?cè)絹碓筋l繁地提到百度。有些時(shí)候,百度還可以作為其中唯一的中國(guó)企業(yè)代表。去年《哈佛商業(yè)評(píng)論》中文版發(fā)布的《2019 人工智能專項(xiàng)調(diào)研報(bào)告》顯示谷歌、蘋果、微軟、百度、亞馬遜為 2019“全球 ai 五強(qiáng)公司”。
2019 全球 ai 五強(qiáng)公司
雖然當(dāng)今任何大型科技企業(yè)都會(huì)觸及 ai,不過很多巨頭的 ai 實(shí)踐是分散在主營(yíng)業(yè)務(wù)之內(nèi),隨業(yè)務(wù)的發(fā)展而發(fā)展。百度則很明確地以 ai 作為發(fā)展方向,其業(yè)務(wù)線均圍繞 ai 能力展開,并反哺 ai 能力的進(jìn)一步增強(qiáng)。
李彥宏在 2017 年表示百度“是一家人工智能公司”,此后多次承諾增加在 ai 方面的投入。即使受疫情影響,百度也沒有削減研發(fā)預(yù)算。2020 年 q1/q2,百度的研發(fā)費(fèi)用分別為 44.43 億元和 48.39 億元,與當(dāng)季總營(yíng)收的比值分別為 19.71% %u548c 18.59%%uff0c均是近年來的高位。
根據(jù)沙利文公司(frost & sullivan)《2019 中美人工智能產(chǎn)業(yè)及廠商評(píng)估》報(bào)告,百度、阿里、騰訊和華為等綜合型廠商在計(jì)算機(jī)視覺、自然語(yǔ)言處理、語(yǔ)音識(shí)別等核心技術(shù)領(lǐng)域均有布局,同時(shí)加速基礎(chǔ)層軟硬件的布局和追趕。
中美 ai 廠商布局表
在此基礎(chǔ)上,在智慧城市,智能客服與營(yíng)銷,智慧醫(yī)療,智能營(yíng)銷,智能制造,智慧能源,智能制造等方面,百度均有自有布局。至于 apollo 在出行方面的成就,更增添了百度 ai 版圖的完整度。
從大廠動(dòng)向看今年的全球 ai 三大發(fā)展趨勢(shì)
疫情改變了全球科技企業(yè)的新品發(fā)布節(jié)奏。受疫情影響,今年的谷歌 i/o 大會(huì) 和 facebook f8 開發(fā)者大會(huì)宣告取消,但是蘋果 wwdc、微軟 build 和亞馬遜 alexa live 2020 等還是在線上舉行。
今年已經(jīng)走過三分之二,此時(shí)召開的“百度世界 2020”可以說為國(guó)際 ai 大廠的年度“交作業(yè)”補(bǔ)上了一片重要的拼圖。接下來還會(huì)有微軟的 ignite 和 aws re:invent 等活動(dòng),蘋果還缺一場(chǎng)秋季發(fā)布會(huì);谷歌也計(jì)劃推出新的手機(jī)和智能音箱等。
今年各家 ai 巨頭都省略了開發(fā)者現(xiàn)場(chǎng)參會(huì)的環(huán)節(jié),變成視頻和“ppt發(fā)布”,有的直接群發(fā)新聞稿了事。總體上說,今年它們帶給開發(fā)者和市場(chǎng)的新東西都不多;更重要的是,疫情及遠(yuǎn)程辦公也降低了工作效率,拖慢了內(nèi)部研發(fā)和硬件制造的進(jìn)度。
除小度之外,幾大語(yǔ)音助手 alexa、siri、google assistant 也都趁機(jī)宣布了最新的用戶數(shù)、裝機(jī)數(shù)和開發(fā)者數(shù)量,但微軟的 cortana 則退出了消費(fèi)者端的競(jìng)爭(zhēng)。在用戶分布方面,中美兩國(guó)繼續(xù)保持著“劃江而治”的狀態(tài),尚未出現(xiàn)什么產(chǎn)品可以廣泛打入對(duì)方的市場(chǎng)。
看完百度世界 2020 之后,結(jié)合其它國(guó)際 ai 大廠今年的各項(xiàng)技術(shù)發(fā)布,全球 ai 業(yè)界的三個(gè)主要發(fā)展趨勢(shì)也逐漸清晰起來:
① 人工智能將更趨向于模擬真人
其實(shí) ai 每一年都在嘗試模仿真人的音容笑貌,但 2020 年可以說是廠商們?cè)跀M人 ai 研發(fā)方面取得突出進(jìn)展的一年。像是沙特“機(jī)器人公民”索菲亞那樣的“實(shí)體 ai”嘗試暫時(shí)消停了,但在屏幕內(nèi)出現(xiàn)的三維形象,則在飛速跨越擬人形象的“恐怖谷”,變得越發(fā)實(shí)用。
ai 對(duì)真人的模擬包括語(yǔ)音、動(dòng)作和性格。顯然,語(yǔ)音方面的擬人 ai 技能現(xiàn)在已經(jīng)“點(diǎn)滿”,ai 客服在日常生活中已被大量應(yīng)用。更多人會(huì)與 ai 互動(dòng),即使自己還沒有意識(shí)到;但反過來,在我們不認(rèn)識(shí) ai 的同時(shí),ai 會(huì)認(rèn)出我們。
2018 年,航通社參觀世界機(jī)器人大會(huì),對(duì)服務(wù)型機(jī)器人的進(jìn)展深感失望。迎賓、業(yè)務(wù)辦理、服務(wù)員等類人形機(jī)器人,幾乎無一例外的選擇特別低幼的,長(zhǎng)得像喜羊羊一樣的卡通臉,露出傻乎乎的,近似“面癱”的笑容。
如今,廠商們終于具備了跨越 “恐怖谷”,向人形 ai 這一高峰進(jìn)軍的決心和實(shí)力。過去一年誕生了眾多虛擬偶像(vtuber),而一些由人控制的 3d 形象,在需要采集人類動(dòng)作時(shí)也不需要大量的傳感器,只要用手機(jī)攝像頭,甚至是一些錄制好的視頻片段就可以了。
在百度世界大會(huì)宣布上線的虛擬助理“度曉曉”從 2019 年開始研發(fā),她的造型、動(dòng)作和語(yǔ)音都已經(jīng)非常自然,知識(shí)儲(chǔ)備更豐富,應(yīng)答也更接近真人。
百小度、小度、度曉曉
用戶見慣了多種 ai 助手之后,口味也更為挑剔。從 2015 年搜索框旁的機(jī)器人“百小度”,到語(yǔ)音形態(tài)存在,外形也是機(jī)器人的“小度”,再到 3d 人形 ip“度曉曉”,技術(shù)難度不斷加大。
對(duì)人類性格的模擬也將幫助ai越來越多地用于創(chuàng)建電影、音樂和游戲。2019 年五四青年節(jié)晚會(huì),百度幫助打造的虛擬主持人“小靈”亮相。一年以后,百度世界大會(huì)上的虛擬人“小康”技術(shù)水平又有了重大提升。
現(xiàn)在打造虛擬人不再需要錄制長(zhǎng)時(shí)間的視頻,只需要幾分鐘現(xiàn)成的視頻資料即可,而且它的對(duì)話能力也更強(qiáng),兩個(gè)虛擬人之間可以“機(jī)機(jī)對(duì)話”。雖然還是略顯尷尬,但已經(jīng)不至于出現(xiàn)停頓和“亂碼”了。
今年很多家開發(fā)的 ai 助手在“認(rèn)人”方面都有了新進(jìn)展,認(rèn)出不同的家庭成員成了新的“基本功”。小度助手(dueros)6.0 增強(qiáng)了根據(jù)音色區(qū)分家庭中不同成員的能力,并且只需要錄入 20 句話,就可以模仿父母的聲音給孩子講故事。
此外,語(yǔ)音助手也在更努力地學(xué)習(xí)人類的交流邏輯,例如識(shí)別模糊化的指令。人與人交流的時(shí)候,對(duì)同一種事物有多種不同的表達(dá)方式,有時(shí)可能會(huì)相當(dāng)模糊,對(duì)這種模糊指令的識(shí)別一直是一個(gè)難點(diǎn)。
7 月 22 日,亞馬遜線上舉辦了 alexa live 2020 開發(fā)者大會(huì)。本次 alexa 發(fā)布了 31 個(gè)新功能,其中基于深度學(xué)習(xí)的多輪對(duì)話開發(fā)工具 alexa conversations,可以讓語(yǔ)音助手的交互體驗(yàn)更加自然。
基于此,用戶可以不用清晰記得技能的名稱,只要大概說關(guān)鍵字讓 alexa 推斷你的意圖,就可以調(diào)用技能,使用更輕松方便。如果 alexa 不能完全確定時(shí),將會(huì)與用戶確認(rèn),隨著持續(xù)深度學(xué)習(xí)和訓(xùn)練,效果會(huì)更精確。還有,現(xiàn)在 alexa 在執(zhí)行一項(xiàng)任務(wù)的同時(shí),還可以在中途暫停,等過段時(shí)間回來還會(huì)繼續(xù)原來任務(wù)的進(jìn)度。
② 人工智能將越來