WordNet

維基百科,自由的百科全書

WordNet是一個由普林斯頓大學認識科學實驗室在心理學教授喬治·A·米勒的指導下建立和維護的英語字典。開發工作從1985年開始,從此以後該項目接受了超過300萬美元的資助(主要來源於對機器翻譯有興趣的政府機構[1]

由於它包含了語義信息,所以有別於通常意義上的字典。WordNet根據詞條的意義將它們分組,每一個具有相同意義的字條組稱為一個synset(同義詞集合)。WordNet為每一個synset提供了簡短,概要的定義,並記錄不同synset之間的語義關係。

WordNet的開發有兩個目的:

  1. 它既是一個字典,又是一個辭典,它比單純的辭典或詞典都更加易於使用。
  2. 支持自動的文本分析以及人工智能應用。

WordNet的數據庫及相應的軟件工具的發放遵照BSD許可證書,可以自由的下載和使用,亦可在線查詢和使用。

WordNet內部結構

在WordNet中,名詞動詞形容詞副詞各自被組織成一個同義詞的網絡,每個同義詞集合都代表一個基本的語義概念,並且這些集合之間也由各種關係連接。(一個多義詞將出現在它的每個意思的同義詞集合中)。在WordNet的第一版中(標記為1.x),四種不同詞性的網絡之間並無連接。WordNet的名詞網絡是第一個發展起來的。

名詞網絡的主幹是蘊涵關係的層次(上位/下位關係),它佔據了關係中的將近80%。層次中的最頂層是11個抽象概念,稱為基本類別始點(unique beginners),例如實體(entity,「有生命的或無生命的具體存在」)和心理特徵(psychological feature,「生命有機體的精神上的特徵)。名詞層次中最深的層次是16個節點。

外部連結

  1. ^ WordNet发展概况. 北京大學中國語言學研究中心. [2018-09-27]. (原始內容存檔於2018-09-27) (中文).