《騰訊工程師提議用中文索引算法創(chuàng)建DNA搜索引擎》文章已經(jīng)歸檔,站長之家不再展示相關(guān)內(nèi)容,下文是站長之家的自動(dòng)化寫作機(jī)器人,通過算法提取的文章重點(diǎn)內(nèi)容。這只AI還很年輕,歡迎聯(lián)系我們幫它成長:
現(xiàn)在中國第三大搜索引擎、騰訊旗下搜搜(SOSO.com)的一位計(jì)算機(jī)科學(xué)家王亮(WangLiang)提出應(yīng)用中文索引算法去檢索生物信息...
王亮指出,中文的每個(gè)字之間沒有留下間隔,因此索引中文文檔的一種方法是將文本分解成N個(gè)片段(n-grams),N代表字?jǐn)?shù),1-grams表示一個(gè)漢字,2-grams表示兩個(gè)漢字,3-grams表示三個(gè)漢字,一些中文搜索引擎就只索引2-grams...
......
本文由站長之家用戶“Solidot”投稿,本平臺(tái)僅提供信息索引服務(wù)。由于內(nèi)容發(fā)布時(shí)間超過平臺(tái)更新維護(hù)時(shí)間,為了保證文章信息的及時(shí)性,內(nèi)容觀點(diǎn)的準(zhǔn)確性,平臺(tái)將不提供完整的內(nèi)容展現(xiàn),本頁面內(nèi)容僅為平臺(tái)搜索索引使用。需閱讀完整內(nèi)容的用戶,請(qǐng)聯(lián)系作者獲取原文。
(舉報(bào))