書名: 解密搜索引擎技術(shù)實戰(zhàn)
作者: 羅剛編著
出版社: 電子工業(yè)出版社
出版日期
文摘: 本書主要包括總體介紹部分、爬蟲部分、自然語言處理部分、全文檢索部分以及相關(guān)案例分析。爬蟲部分介紹了網(wǎng)頁遍歷方法和如何實現(xiàn)增量抓取,并介紹了從網(wǎng)頁等各種格式的文檔中提取主要內(nèi)容的方法。自然語言處理部分從統(tǒng)計機器學(xué)習(xí)的原理出發(fā),包括了中文分詞與詞性標(biāo)注的理論與實現(xiàn)以及在搜索引擎中的實用等細(xì)節(jié),同時對文檔排重、文本分類、自動聚類、句法分析樹、拼寫檢查等自然語言處理領(lǐng)域的經(jīng)典問題進行了深入淺出的介紹并總結(jié)了實現(xiàn)方法。在全文檢索部分,結(jié)合Lucene 3.0介紹了搜索引擎的原理與進展。用簡單的例子介紹了Lucene的最新應(yīng)用方法。
大學(xué)教程-解密搜索引擎技術(shù)實戰(zhàn)
158資源整合網(wǎng):提供各類學(xué)習(xí)資源,名師講座視頻,培訓(xùn)課程視頻,音頻,文檔等···各類教程下載觀看。
推薦:只需¥98 充值開通(終身VIP會員)就可以
終身免費下載學(xué)習(xí)全部資源,非常超值!
【點擊立即開通】