柳傳志也以自己的經(jīng)歷,勉勵創(chuàng )業(yè)者保持“專(zhuān)注”:
身邊很多朋友賺了很多錢(qián),我也可以賺很多錢(qián)。當年96、97年民生銀行投資的時(shí)候,我被認為最有可能第一個(gè)投資的,但我沒(méi)投。據別人替我估算,如果當時(shí)投了那 1 億多,現在的回報是 2000 多億,我覺(jué)得我不必后悔,身邊不斷有這樣的事兒出現,你說(shuō)它是好事,它是壞事?這還真不好說(shuō),因為我投資賺了這筆錢(qián)以后,我也許會(huì )想去投房地產(chǎn)、去做別的更多的事,電腦這條路可能做不成,也許到最后什么都可能做不成。
李開(kāi)復談?wù)Z(yǔ)音識別技術(shù)
李開(kāi)復是第二名上場(chǎng)的嘉賓。眾所周知,李開(kāi)復是著(zhù)名語(yǔ)音識別技術(shù)專(zhuān)家,談到語(yǔ)音識別,當然少不了由他來(lái)現身說(shuō)法。
事實(shí)上,在訊飛發(fā)布會(huì )之前,李開(kāi)復曾在微博上對市面上存在的眾多“中國 Siri”提出四個(gè)疑問(wèn):
1)智能手機主界面是手觸,語(yǔ)音助手解決了什么真正用戶(hù)需求和痛處?2)如何克服后臺海量數據學(xué)習技術(shù)門(mén)檻?全球只有一個(gè)公司有這個(gè)技術(shù)。3)應用誰(shuí)開(kāi)發(fā)?自己開(kāi)難擴張,用別人的應用整合不佳影響體驗,4)語(yǔ)音服務(wù)器和帶寬成本較大,如何克服?
今天發(fā)布會(huì )結束后,李開(kāi)復更新微博:“訊飛語(yǔ)點(diǎn)推出后,2、4由訊飛解決了”。
事實(shí)上,在之前科大訊飛向愛(ài)范兒提供的獨家稿件中,訊飛一一回答了四個(gè)問(wèn)題,3 月 22 日發(fā)布會(huì )用實(shí)際產(chǎn)品進(jìn)行了回應。詳細內容見(jiàn)文末引用部分。
李開(kāi)復的“爐邊談話(huà)”提供了很多“專(zhuān)家式”的內容。簡(jiǎn)單整理成問(wèn)答形式如下。
問(wèn):我們看到訊飛語(yǔ)音識別的技術(shù)已經(jīng)非常成熟,那么你認為“應用”的空間在哪里,未來(lái)語(yǔ)音識別技術(shù)還有什么挑戰?
李開(kāi)復:云端識別技術(shù),訊飛已經(jīng)解決了。“應用”在哪里?這并不是一些專(zhuān)家在實(shí)驗室里拍腦袋就能想到的。大家可以來(lái)試,可以在訊飛的云平臺上試一試,可能成功的會(huì )比較少,但能夠摸索到成功的應用的概率也會(huì )增加。
語(yǔ)音技術(shù)方面,主要挑戰還有三方面:
一、語(yǔ)音識別相對容易,但語(yǔ)義理解相對困難。讓軟件聽(tīng)懂容易,但理解會(huì )比較難。
二、如果能在一定程度上做到語(yǔ)義理解,那么怎么樣讓開(kāi)發(fā)者介入不用太花時(shí)間?
三、用戶(hù)體驗的期望值。語(yǔ)音是人類(lèi)最自然交流的方式——與多點(diǎn)觸摸不同,一旦人們開(kāi)始使用語(yǔ)音交互,會(huì )有比較大的心理預期:我愛(ài)怎么說(shuō)就怎么說(shuō),你應該能理解,這是一個(gè)比較長(cháng)久的挑戰。這中間,應該有巧妙方式來(lái)降低這種感受。
問(wèn):語(yǔ)音技術(shù)里面,是不是使用的人越多,語(yǔ)音技術(shù)也會(huì )愈加成熟?
李開(kāi)復:當然了,更多人參與,獲得更多自動(dòng)回饋,可以實(shí)現一個(gè)良性的正向循環(huán)方。一個(gè)人能力有限,一億用戶(hù),每人使用 3 秒鐘,就是 3 億秒,這個(gè)數據量是龐大的。實(shí)際應用中,正確的輸入可以被視作是“一次正確訓練和學(xué)習”,吸收改進(jìn);一個(gè)錯誤的結果,比如訂餐時(shí)識別錯誤取消訂單,可以視作“不正確的學(xué)習”,同樣吸收改進(jìn)。
但這個(gè)比“聽(tīng)寫(xiě)”更困難:錯了,是語(yǔ)音錯了還是語(yǔ)義錯了,或者其中一個(gè)正確、一個(gè)錯誤;對了,是語(yǔ)音對了語(yǔ)義對了,或者其中一個(gè)正確、一個(gè)錯誤。當回饋量大于累計量和使用量,可以讓我們邁出一大步。
問(wèn):什么樣的語(yǔ)音應用是用戶(hù)期待和接受的?
李開(kāi)復:我認為有三個(gè)方向。1,相對是語(yǔ)音識別,而非深度語(yǔ)義理解的應用,或者說(shuō)“淺語(yǔ)義,深語(yǔ)音”。比如聽(tīng)寫(xiě)(Demo 中有提到教育領(lǐng)域的聽(tīng)寫(xiě)測試、KTV 評分、發(fā)短信、日程提醒),——輸入法也很重要,這個(gè)比較保險。
2,娛樂(lè )性應用,比如 Siri 這樣的調侃調戲類(lèi)應用。這種識別錯了也無(wú)傷大雅,很愛(ài)使用。蘋(píng)果很聰明,用調侃 Siri 錄了很多語(yǔ)音,然后慢慢把真正的應用做好。
3,在一些“眼忙手忙”的場(chǎng)景,這個(gè)時(shí)候語(yǔ)音需求就會(huì )很大,比如駕車(chē)的時(shí)候,這時(shí)候是不能多點(diǎn)觸控的,這算一個(gè)“剛性需求”的場(chǎng)所。
在這里我建議開(kāi)發(fā)者:想把語(yǔ)音放進(jìn)來(lái)的時(shí)候,不是那么容易,因為語(yǔ)音的 API 和語(yǔ)音的用戶(hù)體驗,比一般的 API 要難很多,比如百科全書(shū)類(lèi)、地圖、本地商家,O2O,線(xiàn)上模式拉來(lái)線(xiàn)下消費,因為有語(yǔ)義部分在里面,要花很多時(shí)間去把它調好,不能用簡(jiǎn)單的 API 隨便聯(lián)接起來(lái)。
附:科大訊飛對李開(kāi)復“中國 Siri 路在何方”的回應稿件
第一,語(yǔ)音助手能夠解決什么真正的用戶(hù)需求?
大多數人提到 Siri,第一印象就是調戲 Siri,但如果一個(gè)產(chǎn)品只是用來(lái)“調戲”,那這個(gè)產(chǎn)品充其量只能算是玩具,而不是人們所必須使用的語(yǔ)音助手。所以,Siri 的定位應該是解決用戶(hù)的真正需求和痛處。
可惜,目前 Siri 的模仿者大多視這個(gè)需求而不見(jiàn),而是關(guān)注如何才能更好的“調戲”用戶(hù)。相信只有真正做到解決用戶(hù)需求的產(chǎn)品,才能夠獲得用戶(hù)長(cháng)久的喜愛(ài),希望國內的開(kāi)發(fā)者能夠注意這個(gè)問(wèn)題。
Siri 想要實(shí)用,就必須調用開(kāi)放數據的平臺,而中國卻沒(méi)有 Wolfram Alpha 這種引擎,所以中文 Siri 想要真正解決用戶(hù)需求,只能一家一家去談,比如找大眾點(diǎn)評、百科等。這是創(chuàng )業(yè)公司做不來(lái)的,而大公司(百度、騰訊等)來(lái)做,可能又存在利益沖突。
第二,如何克服后臺海量數據學(xué)習技術(shù)門(mén)檻?
雖然李開(kāi)復老師說(shuō)全球只有一個(gè)公司有這個(gè)技術(shù),而我們也不知道這個(gè)公司具體是指哪一個(gè)。但據我了解,在語(yǔ)音識別方面,科大訊飛是做的不錯的,訊飛語(yǔ)音輸入法的識別率已經(jīng)達到 85% 以上。而且他們的語(yǔ)音識別是基于云計算實(shí)現的,應該是具備數據學(xué)習能力的。
除了語(yǔ)音識別,還有一個(gè)難題是語(yǔ)義理解,這也是中文 Siri 的核心難題。讓機器真正理解人的語(yǔ)言,這是一件很困難的事。就目前來(lái)看,蘋(píng)果在英文方面都沒(méi)有很好解決,不然也不會(huì )有用戶(hù)要告蘋(píng)果虛假宣傳了。但蘋(píng)果可以依靠“調戲”用戶(hù)獲得大量語(yǔ)料,然后學(xué)習后提升可用度。
原文轉自:http://kjueaiud.com