5月21日-22日,由中國電子學(xué)會主辦的"2016全國模式識別技術(shù)應(yīng)用大會"在北京召開,來自全國各地智能技術(shù)企業(yè)和科研院所的科研代表和行業(yè)開拓者蒞臨大會并進(jìn)行技術(shù)分享和交流。會議分享內(nèi)容圍繞模式識別和人工智能應(yīng)用技術(shù)及產(chǎn)業(yè)化發(fā)展,包含了相關(guān)各個領(lǐng)域的研究與實踐,包括機器人視覺、人工智能的認(rèn)知、智能駕駛、文本理解挖掘、生物特征識別等。其中,搜狗搜索首席科學(xué)家許靜芳博士以其在國內(nèi)第二大搜索引擎公司的實際工作經(jīng)驗為基礎(chǔ),帶來了《搜索中的文本理解與挖掘》主題分享,受到參會者好評。
(搜狗搜索許靜芳博士演講照片)
搜索產(chǎn)品作為日常生活中最常用的互聯(lián)網(wǎng)產(chǎn)品之一,包含了幾乎全網(wǎng)的信息,并積累了海量的用戶大數(shù)據(jù),而搜索產(chǎn)品需要連接人與數(shù)據(jù)的性質(zhì)也讓其成為了"讓機器讀懂文本"先驅(qū)產(chǎn)品。許靜芳博士的演講基于搜狗搜索的技術(shù)探索及5.6億用戶產(chǎn)生的大數(shù)據(jù)積累,對文本搜索核心的查詢理解、文檔理解以及查詢與文檔匹配等幾個方面進(jìn)行了講解,尤其是配合會議主題,對查詢理解和文檔理解的具體方式進(jìn)行了深度解析。
不論是用戶輸入的"查詢詞理解"還是用戶想要查詢到的遍布于互聯(lián)網(wǎng)上的"文檔理解",數(shù)據(jù)挖掘+機器學(xué)習(xí)(Data Mining + Machine Learning)都是其最基本的工具。搜狗搜索通過數(shù)據(jù)挖掘+機器學(xué)習(xí)進(jìn)行同義詞(組)挖掘、查詢糾錯、查詢分析,并進(jìn)行查詢相似度計算、查詢糾錯和查詢擴展以及意圖理解,讓搜索引擎對查詢文本進(jìn)行理解。
(搜狗搜索許靜芳博士演講PPT)
許靜芳博士詳細(xì)講解了基礎(chǔ)查詢分析、查詢詞權(quán)重計算、緊密度計算、同義詞、查詢意圖識別的等每個小分類具體的實現(xiàn)方式。例如在進(jìn)行查詢意圖識別時,有實體機類型挖掘、通用意圖識別、基于RNN-LSTM的意圖識別、詞表示學(xué)習(xí)等不同的層面,而每個具體層面背后都需要有嚴(yán)密的思考和技術(shù)實力。
(搜狗搜索許靜芳博士演講PPT)
許靜芳博士的演講既生動又詳實,不僅講解技術(shù)原理,還結(jié)合搜狗搜索的具體產(chǎn)品功能和用戶在搜索時常見的問題,對問題進(jìn)行了分析,結(jié)合問題向參會者講解具體解決方案和思考邏輯。參會者普遍表示這次分享極為精彩,將復(fù)雜的搜索技術(shù)講得深入淺出。
除搜狗搜索的許靜芳博士外,本次參會者還包括了IBM、科大訊飛、騰訊、阿里巴巴等知名企業(yè)的領(lǐng)導(dǎo)和專家,極具業(yè)界影響力。中國電子學(xué)會作為中國科學(xué)技術(shù)協(xié)會的組成部分,是由電子信息界的科技工作者和有關(guān)企事業(yè)單位自愿結(jié)成的非營利性法人社團,積極倡導(dǎo)"團結(jié)、創(chuàng)新、求實、奉獻(xiàn)"的精神,促進(jìn)電子信息科學(xué)技術(shù)的繁榮和發(fā)展。在中國電子學(xué)會的積極推動下,召集了各界最知名的專家,才保障了本次"2016全國模式識別技術(shù)應(yīng)用大會"成功舉辦。
(推廣)