在今年8月召開的百度技術(shù)創(chuàng)新大會上,百度CEO李彥宏重磅拋出“框計算”這一全新技術(shù)理念,并成為行業(yè)、企業(yè)以及學(xué)術(shù)界持續(xù)熱議的話題。近日,哈爾濱工業(yè)大學(xué)信息檢索中心主任、中國中文信息處理領(lǐng)域?qū)W術(shù)帶頭人劉挺對這一理念發(fā)表了自己的看法。
他指出,“框計算”理念的提出,將大力推動中文信息處理技術(shù)的研發(fā)進(jìn)程,給自然語言處理的研究者帶來機(jī)會。
所謂“自然語言處理”,就是用計算機(jī)去處理語言文字。隨著互聯(lián)網(wǎng)的大規(guī)模應(yīng)用,其所呈現(xiàn)出爆炸式增長的數(shù)據(jù)量在客觀上推動了對語言信息處理的需求。語言信息處理的中心目標(biāo)是讓機(jī)器理解人類的語言,但互聯(lián)網(wǎng)上過大的信息量往往造成處理速度的延遲,導(dǎo)致語言處理只能采用分詞這樣的最簡單的處理方法,把漢語的句子切分成詞,然后進(jìn)行檢索。
劉挺指出,2000年前后業(yè)內(nèi)便已提出“開放域問答系統(tǒng)”這樣的課題,試圖理解用戶的提問,并給出精準(zhǔn)的答案。如果系統(tǒng)無法理解清楚用戶的搜索請求,還可以自動產(chǎn)生反問,在交互中尋求解答。但由于技術(shù)難度非常大,離實際應(yīng)用還很遠(yuǎn),不太容易做好。而百度目前基于“框計算”技術(shù)所提供的諸如“火車時刻表”等搜索服務(wù),通過簡捷的交互方式提供了一個實用的“問答系統(tǒng)”應(yīng)用范例。
“可以說,框計算把我們原來有點破滅的開放域問答的理想激活了,同時又啟示了我們真正的應(yīng)用應(yīng)該是什么樣子的?!眲⑼Ρ硎?,受框計算的啟發(fā),自己接下來將重點研發(fā)開放問答系統(tǒng),這其中包括三部分:問題的理解、文檔片段的檢索和答案抽取,而其中又將把“問題的分類與理解”作為重中之重。
在劉挺看來,框計算不只是極大地擴(kuò)展了搜索引擎的概念,更具有與操作系統(tǒng)緊密結(jié)合的可能。“原來我們認(rèn)為搜索引擎就是信息獲取的一個工具,用戶要找什么信息,搜索引擎就提供什么信息給他,但是在框計算理念下,未來的框就相當(dāng)于用戶的一個助手,不光能回答問題找尋信息,還可以幫助用戶執(zhí)行具體操作?!?/P>
比如,如果用戶的冗余文件過多,現(xiàn)在的做法是打開資源管理器,手動輸入指令;但是在未來,用戶一開機(jī)彈出來的就是相當(dāng)于用戶助手的框,它不光能回答問題,還可以幫助用戶執(zhí)行具體操作。比如輸入“請你幫我把**文件刪除”、“請你對**文件進(jìn)行排序”、“請你給我預(yù)定去**的航班”等語句,框就能自動幫用戶完成這些需求。 不過他也指出,要想真正實現(xiàn)這一過程,還需要解決許多難點,因為漢語的形態(tài)和應(yīng)用要比英語靈活多變,這也為句法和語義分析的準(zhǔn)確性提出了很高的挑戰(zhàn)。
“框計算背后對應(yīng)的就是互聯(lián)網(wǎng)的智能人機(jī)交互界面、一站式和集中式的服務(wù)等理念,它的出現(xiàn)是歷史發(fā)展的必然。百度目前已經(jīng)找對了方向?!眲⑼υu價認(rèn)為,中國的互聯(lián)網(wǎng)信息處理領(lǐng)域?qū)目蛴嬎阒惺芤?,框計算把相關(guān)應(yīng)用都提升到了新的高度,而這“也得益于百度CEO李彥宏的戰(zhàn)略眼光”。
為了更好地實現(xiàn)框計算技術(shù)向?qū)嶋H應(yīng)用的轉(zhuǎn)化,劉挺特別建議稱,百度應(yīng)當(dāng)和高校、研究所等學(xué)術(shù)研究機(jī)構(gòu)緊密合作,結(jié)合雙方的優(yōu)勢來共同開發(fā)“框計算”,以便更好地滿足用戶需求。
|