分析:人工智能預測誰(shuí)是歌王,娛樂(lè )至死的背后還有更大野心
佚名 2016-04-12
()傳統企業(yè)的“互聯(lián)網(wǎng)+”轉型在今天已經(jīng)成為了一個(gè)重要話(huà)題,華為和YunOS都在搭建數據處理平臺,構建物聯(lián)網(wǎng)系統,幫助傳統企業(yè)和互聯(lián)網(wǎng)企業(yè)實(shí)現對接。這種在基礎和底層的布...人工智能預測誰(shuí)是歌王,娛樂(lè )至死的背后還有更大野心
你還記得6年前那只在南非世界杯上征服全球的章魚(yú)保羅嗎?章魚(yú)保羅在2008歐洲杯和2010世界杯兩屆大賽中,預測14次猜對13次、成功率飆升至92%,成為預測王。章魚(yú)保羅預言帝真實(shí)原因在于,好事者根據章魚(yú)的生理習性進(jìn)行了一定的引導。從實(shí)質(zhì)來(lái)講,章魚(yú)保羅僅僅只是一個(gè)符號,好事者的背后其實(shí)是德國奧伯豪森水族館的“公關(guān)營(yíng)銷(xiāo)”參謀團隊根據數據分析、情報展開(kāi)分析。
可以說(shuō),一切預測的背后,其實(shí)都是數據、情報作為支撐。數據越豐富,預測成功的概率就越大。阿爾法狗大戰李世石之后不到一個(gè)月的時(shí)間,恰逢一年一度的湖南衛視“我是歌手”歌王決賽即將上演。阿里云的人工智能小Ai預測歌王結果,可謂噱頭十足。
筆者曾在《從IT領(lǐng)袖峰會(huì )談話(huà)看人工智能的“三重門(mén)”》提到人工智能的三重境界——弱人工智能、強人工智能、超人工智能。預測歌王其實(shí)正是人工智能基于復雜場(chǎng)景展開(kāi)高強度的計算,屬于強人工智能的范疇。表面上看,這僅僅只是一次娛樂(lè ),其實(shí)背后潛藏了更多野心。
預測歌王戰勝棋王,兩者誰(shuí)才技高一籌
一個(gè)是預測歌王,一個(gè)是挑戰棋王。兩個(gè)人工智能,誰(shuí)才技高一籌?這的確令人費解。不過(guò),按照人工智能“三重門(mén)”的層級劃分來(lái)看,阿爾法狗還是屬于弱人工智能,預測歌王這種基于復雜場(chǎng)景的判斷可能更加復雜,屬于強人工智能。
“弱人工智能”其實(shí)在學(xué)界的定義是指,模仿人的深度神經(jīng)網(wǎng)絡(luò ),來(lái)進(jìn)行機器的計算。強人工智能的背后,需要強大的數據服務(wù)作為支撐。
很多人都在說(shuō),圍棋不同于象棋,圍棋背后有著(zhù)深刻的文化、情感因素,圍棋強調全盤(pán)考慮,對于人工智能而言,十分復雜。還有人說(shuō),阿爾法狗和1997年的深藍有著(zhù)很大的區別——深藍是靠硬算,其能力是固定的;阿爾法狗會(huì )根據盤(pán)面自主學(xué)習,其能力在不斷增強。
谷歌的阿爾法狗戰勝李世石,背后其實(shí)是“大數據+算法”的方式進(jìn)行計算。阿爾法狗對生物神經(jīng)系統有種模擬或近似,但阿爾法狗的下棋邏輯是非常簡(jiǎn)單的。每下一步棋,阿爾法狗都是在對每一步棋的勝率進(jìn)行反復計算,選擇在勝率最大的點(diǎn)進(jìn)行落子。其實(shí),這種計算思路與1997年的深藍并無(wú)本質(zhì)區別,阿爾法狗只是利用了實(shí)時(shí)運算的能力將更多棋譜納入其背后的數據資源之中。
那么強人工智能呢?強人工智能指的是AI與大數據、云平臺、機器人、互聯(lián)網(wǎng)及物聯(lián)網(wǎng)等場(chǎng)景深度融合,真正與產(chǎn)業(yè)結合,扮演基礎性的角色。
“我是歌手”這樣的歌唱比賽雖然談不上產(chǎn)業(yè),但是卻存在復雜場(chǎng)景,AI要在這種環(huán)境中預測勝負成敗,其實(shí)存在很大的困難。某種意義上看,AI預測這樣一場(chǎng)比賽,已經(jīng)是在挑戰強人工智能。
“我是歌手”這樣的賽事,背后的賽制和冠軍產(chǎn)生機制非常嚴謹和復雜,還要考慮到歌手臨場(chǎng)發(fā)揮、出場(chǎng)順序、選曲、個(gè)人喜好等不確定因素的影響。這是湖南衛視節目組、所有電視觀(guān)眾、500位大眾評審、7位明星歌手共同創(chuàng )造的一個(gè)充滿(mǎn)隨機性的巨大謎題。
人工智能要在這種環(huán)境中去預測“誰(shuí)是歌王”,其復雜性在于,情感和變數——音樂(lè )是情感因素十分復雜的一個(gè)事物,評委和現場(chǎng)選手又是存在諸多變數的變量,現場(chǎng)觀(guān)眾更是無(wú)力掌控的可變函數。
阿爾法狗只需要去打敗一個(gè)人,它在單點(diǎn)進(jìn)行計算,進(jìn)行突破,就可以完成自己的任務(wù)。而小AI需要預測“誰(shuí)是歌王”,它面對的是千千萬(wàn)萬(wàn)個(gè)具有情感的還在不斷變化的人,它需要理解每個(gè)人的心理變化,現場(chǎng)的氣氛轉向,其復雜性其實(shí)遠高于阿爾法狗。
強人工智能的背后,復雜場(chǎng)景才是目標
如果打一個(gè)不恰當的比喻,阿爾法狗畫(huà)的是直線(xiàn),預測誰(shuí)是歌王的小AI走的是迷宮。
目前的弱人工智能只能運用在下下棋、寫(xiě)寫(xiě)消息、翻譯文本等這些相對較為簡(jiǎn)單和實(shí)用的內容上。
但是,人工智能存在的目的絕非僅僅只是做這些相對固定、機械甚至是缺乏實(shí)用性的事情。今年的IT領(lǐng)袖峰會(huì )上,李彥宏就談到,讓機器學(xué)下圍棋是容易,讓人去下棋、拿到圍棋九段很難;讓機器開(kāi)車(chē)很難,但人去拿到一個(gè)駕照很容易。
李彥宏的本意是,人工智能真正的運用場(chǎng)景是,需要面對非常復雜的使用場(chǎng)景,比如說(shuō)自動(dòng)駕駛、比如說(shuō)再金融、電商等各個(gè)領(lǐng)域進(jìn)行數據分析,為人們提供決策依據。
由此看來(lái),強人工智能才是人工智能未來(lái)真正發(fā)展的方向,因為人工智能最終還是要走向實(shí)用。
放在復雜場(chǎng)景中來(lái)看,“我是歌手”這樣的賽事上去預測歌王,考驗的就是人工智能對復雜場(chǎng)景的應對能力,需要基于神經(jīng)網(wǎng)絡(luò )、社會(huì )計算、情緒感知等原理工作,其背后是阿里云的大數據作為支撐。除此之外,小Ai在預測之前,“海補”了幾百萬(wàn)首歌提升音樂(lè )品味和鑒賞能力,基于阿里音樂(lè )數據庫從歷史賽事和海量資料中尋找影響比賽結果的變量因子,訓練出一個(gè)實(shí)時(shí)動(dòng)態(tài)模型進(jìn)行預測,比如歌曲、歌手、粉絲、現場(chǎng)氛圍、網(wǎng)友討論等維度,每種維度都通過(guò)機器學(xué)習提取海量特征。這些特征有的是靜態(tài)的,有的跟隨比賽不斷變化,需要現場(chǎng)實(shí)時(shí)計算,最終給出預測排名。
原英特爾中國研究院院長(cháng)吳甘沙在面對媒體媒體采訪(fǎng)時(shí)就曾直言,這個(gè)預測的技術(shù)要求甚至高于Nate Silver的奧斯卡預測,因為數據大、維度極多、大量是非結構化數據,沒(méi)有足夠多的歷史數據來(lái)訓練模型。
其實(shí),在未來(lái)的實(shí)際運用中,強人工智能面臨的復雜場(chǎng)景也是如此。強人工智能在金融、電商、無(wú)人駕駛等領(lǐng)域的實(shí)際運用之中,其實(shí)面臨的復雜場(chǎng)景和預測“我是歌手”的歌王一樣,都會(huì )遇到數據大、緯度多、變數大等問(wèn)題。
谷歌這場(chǎng)的阿爾法狗大戰李世石的棋局,更多還是噱頭。谷歌自己也清楚,人工智能真正的場(chǎng)景在于復雜的實(shí)體產(chǎn)業(yè)。
這種復雜場(chǎng)景才是未來(lái)產(chǎn)業(yè)運用中將要面臨的常態(tài)。以金融領(lǐng)域為例,有人說(shuō),未來(lái)國家金融監管部門(mén)可能會(huì )引入人工智能,對復雜的經(jīng)濟系統提供決策支撐。所以說(shuō),這次“我是歌手”預測誰(shuí)是歌王,表面上看只是人工智能在一個(gè)娛樂(lè )節目中的嘗試,很多人都會(huì )被其外表的“娛樂(lè )”所蒙蔽,甚至稱(chēng)其“娛樂(lè )至死”。但這場(chǎng)實(shí)驗其背后真正的目的在于,挑戰人工智能發(fā)展的高度,指明強人工智能的實(shí)際運用。
DT時(shí)代的大背景下,未來(lái)應用前景幾何
強人工智能其應用前景其實(shí)和一家公司的數據能力密不可分。曾有一種理論談到,在人工智能領(lǐng)域,缺乏數據的公司,未來(lái)很難提供真正可用的服務(wù)。
聯(lián)想到馬云多次公開(kāi)談到過(guò)的DT時(shí)代的論述,其實(shí)很容易發(fā)現這樣趨勢。馬云說(shuō),這一次技術(shù)革命是IT時(shí)代走向DT時(shí)代,是真正的大大的釋放……這個(gè)時(shí)代核心資源已經(jīng)不是石油,而是數據。
人工智能背后的資源其實(shí)就是大數據,缺乏數據的人工智能是無(wú)法生存的,在未來(lái)的應用場(chǎng)景之中,數據為成為支撐人工智能的核心資源。
數據資源來(lái)自何處?對于阿里巴巴而言,數據資源來(lái)源于淘寶、天貓的購物數據,支付寶上的支付信用數據,微博、釘釘上的社交數據;對騰訊而言,數據資源來(lái)源于社交數據;對百度而言,數據資源可能來(lái)源于搜索數據…….
而在未來(lái),人工智能會(huì )在大數據的支撐下,對于貸款、保險、廣告、營(yíng)銷(xiāo)、電商、物流、健康、醫藥、安全等各行各業(yè),都展開(kāi)改造。實(shí)際上,這種改造早已經(jīng)悄然開(kāi)展。小Ai各個(gè)模塊已經(jīng)積累了大量實(shí)戰經(jīng)驗——幫助交通部門(mén)預測未來(lái)道路擁堵情況,幫助光伏電廠(chǎng)預估發(fā)電產(chǎn)能減少能耗,幫助水利監管部門(mén)預測水庫水位以預防災害發(fā)生、幫助金融機構的客服人員接電話(huà)、幫助阿里音樂(lè )預測音樂(lè )黑馬等。
未來(lái),人工智能可能會(huì )成為各行各業(yè)的基礎性資源,在各行各業(yè)之中發(fā)揮作用。如果在配合“云管端”的戰略來(lái)看,會(huì )發(fā)現阿里的野心可能更大。
傳統企業(yè)的“互聯(lián)網(wǎng)+”轉型在今天已經(jīng)成為了一個(gè)重要話(huà)題,華為和YunOS都在搭建數據處理平臺,構建物聯(lián)網(wǎng)系統,幫助傳統企業(yè)和互聯(lián)網(wǎng)企業(yè)實(shí)現對接。這種在基礎和底層的布局,其實(shí)正在成為未來(lái)物聯(lián)網(wǎng)、5G時(shí)代連接一切的重要資源。人工智能作為催化劑注入其中,可能會(huì )帶來(lái)更大的想象力。(來(lái)源:微信公眾號“深幾度” 編選:中國電子商務(wù)研究中心)