全文檢索

維基百科，自由的百科全書

本條目存在以下問題，請協助改善本條目或在討論頁針對議題發表看法。

此條目可參照英語維基百科相應條目來擴充。 (2019年5月15日)
若您熟悉來源語言和主題，請協助參考外語維基百科擴充條目。請勿直接提交機械翻譯，也不要翻譯不可靠、低品質內容。依版權協議，譯文需在編輯摘要註明來源，或於討論頁頂部標記{{Translated page}}標籤。

此條目的語調或風格或許不適合百科全書。 (2019年5月15日)
請根據指南協助改善這篇條目，並在討論頁討論問題所在，加以改善。

此條目應避免有陳列雜項、瑣碎資料的部分。 (2019年5月15日)
請協助將有關資料重新編排成連貫性的文章，安置於適當章節或條目內。

此條目沒有列出任何參考或來源。 (2019年5月15日)
維基百科所有的內容都應該可供查證。請協助補充可靠來源以改善這篇條目。無法查證的內容可能會因為異議提出而被移除。

從文字或資料庫中，不限定資料欄位，自由地萃取出訊息的技術。

執行全文檢索任務的程式，一般稱作搜尋引擎，它將用戶隨意輸入的文字，試圖從資料庫中，找到符合的內容。

全文索引的相關議題

語根處理 (stemming)
符素解析器 (token parser) 1-gram, 2-gram , n-gram
斷詞/分詞 word segmentation
反向索引 inverted index

演算法、搜尋策略之模型

布林式 boolean
統計模型 Probabilistic model
向量空間模型 vector base model
隱性語義模型 Latent semantic model

評量之準則

查全率(recall rate)，查準率(precision)

開放原始碼之全文檢索系統

和中文有關的議題

斷詞
語法解析
古籍議題
多語言混合

優化

剔除字(Stopwords)
詞性標註
權威檔(authority file)
知識體系，本體論(ontology)
超連結分析(page rank)技術

歷史及未來之趨勢

自由陳述式搜尋

參考

取自 "https://zh.wikipedia.org/w/index.php?title=全文檢索&oldid=54423734"

分類：

隱藏分類：