當前位置:編程學習大全網 - 編程語言 - 幫忙找下關於Word的發展歷史,特點和使用技巧等相關的資料.

幫忙找下關於Word的發展歷史,特點和使用技巧等相關的資料.

Word發展概況

· 關於WordNet的不成熟的想法可以追溯到20多年前,而這壹想法開始逐漸具體化和清晰化則是1985年後才開始的。從85年開始,WordNet作為壹個知識工程全面展開。不過,當時的WordNet和經過10多年後今天的WordNet還是很不壹樣的。

· 這壹工程最初的前提之壹是“可分離性假設”(Separability hypothesis),即語言的詞匯成分可以被離析出來並專門針對它加以研究。詞匯編纂學的歷史明確地告訴我們,在詞語水平上可以得到有用的研究成果。詞庫(詞典,lexicon)當然不是完全獨立於其他語言成分的,但它的確是可以從其他成分中分離出來的。例如,盡管語音和語法知識在壹個人的早年生活中就成型了,但詞匯量卻可以隨著智力活動的不斷積累而增加。這表明語言的不同成分涉及不同的認知過程。

· 另壹個前提是“模式假設”(patterning hypothesis):壹個人不可能掌握他運用壹種語言所需的所有詞匯,除非他能夠利用詞義中存在的系統的模式和詞義之間的關系。這種系統化的心智模式至少從柏拉圖時代就成為壹種進行推測的學問,現代語言學研究開始在自然語言的語義結構中識別這樣的模式。但許多遵循這類路線的出色的研究工作在這壹問題上碰到了困難。壹個作者可能提出壹種語義理論,並以20到50個英語單詞為例來展示他的理論,而留下另外10萬個單詞讓讀者去做練習。

· 第三個前提就是所謂的“廣泛性假設”(comprehensiveness hypothesis):計算語言學如果希望能像人那樣處理自然語言,就需要像人那樣儲存盡可能多的詞匯知識。

· 建立包含詞語意義描述的大規模詞庫的方式之壹是基於語義成分分析的詞匯語義學(componential lexical semantics)的方法(也可譯為義素分析法)。這種方式把壹個詞的意義分析為更小的概念原子的組合。不過,定義壹套概念原子卻非易事。事實上,WordNet主帥George.A.Miller在1976年他與Philip N. Johnson-Laird合作的《Language and Perception》壹書中還躊躇滿誌地探索義素分析的語義描寫方法,但直到1985年,仍然沒有能夠出籠壹個完整的定義清晰的清單,在上面列舉出所有的概念原子。

· 到1985年,許多認知心理學家和計算語言學家開始以“網”的形式來描述詞語的意義。比如:“桌子”(table)和“家具”(furniture)代表兩個節點(node),而這兩個節點之間有壹個箭頭(dart)來表示這樣的命題:桌子是壹種家具(a table is a kind of furniture),即“Is-A-KIND-OF”這樣的語義關系。隨著這方面研究的增多,越來越多的人自覺地意識到:除了利用語義成分(義素分析法)表示語義,還可以利用關系來表示語義(基於關系的詞匯語義學relational lexical semantics),而且後者有可能替代前者。

· 在WordNet的早期階段,研究人員主要是在考慮用關系語義來描述詞義的方式是否能夠大規模地廣泛使用,而不是僅僅停留在玩具式的演示水平上。到了研究人員確信這是可行的的時候,他們就編制了應用軟件來把想法變成現實。實際上,在早期,Miller並沒有關於構建壹個大詞庫的完整想法。初步設想是識別由字符串組成的最重要的詞節點,並探索其中的語義關系模式。當時的想法是,如果得到了正確的語義關系模式,詞語的定義就能從中推理出來,因此,對於壹個有關詞義的關系網來說,詞義的定義是多余的。

· 在1978年的時候,Miller描述了壹種“自動化詞典”(automated dictionary)的想法。不過那時候他完全不知道該如何實現這種想法。由於Sloan基金會,Spencer基金會,IBM公司沃盛研究中心(Watson Research Center)的支持,Miller得以壹直保持著他的想法,而沒有中途放棄。到1984年的時候,Miller甚至在IBM PC機上做出了45個名詞的小型語義網,他把這個小網叫做“word net”。Miller在IBM和Bellcore演示了這個示例成果。他在Bellcore的壹幫好友,Lance Miller, Roy Byrd, Michael Lesk, Donald Walker, Robert Amsler, 以及Stephen Hanson都鼓勵他繼續下去,並在技術上給予許多實際指導。

· Lesk邀請Miller參加了1985年11月在加拿大沃太盧(Waterloo)大學新牛津英語詞典中心的第壹次會議。Miller提交了壹篇論文。Miller在那篇論文中解釋這樣的思想: 我們可以使用同義詞集合(synset)來代表詞匯概念,並描述詞匯矩陣,即在詞的形式和意義之間建立起映射關系(mapping)。實際上,這正是在WordNet的發展中指導研究工作的主要思想。

· 不過,也許Miller在那次會議上的報告所介紹的思想尚在其次,報告的標題反而意義更大。那個標題是由Lesk提議的,叫做:WordNet: A Dictionary Browser。(WordNet:壹個詞典瀏覽器)。在這裏,WordNet被看作(設想為)是壹個詞典瀏覽器,是壹個機器可讀詞典的輔助工具。而這樣壹個機器詞典不是傳統地按字母排序的,是基於意義的。

· 也就是在WordNet開始成形的時候,Miller和他的壹些誌同道合的同事在普林斯頓合作發起了壹個認知研究的計劃(Program for Cognitive Studies)。Richard Cullingford從1983年到1985年在普林斯頓訪問,他,Gilbert Herman,加上Miller說服Provost Neil Rudenstine提供了壹臺微型計算機。那臺計算機也就成了普林斯頓認知科學實驗室的心臟。有了設備在手,Miller又去說服海軍研究辦公室的Susan Chipman跟他們簽合同來開發WordNet。Cullingford和Miller壹起收到了軍隊研究所(Army Research Institute)的壹個合同,開發壹個詞匯語義學的計算理論。1986年3月,James S.McDonnell基金向普林斯頓慷慨解囊,支持認知科學的研究工作。Marie BienKowski(Cullingford的研究生)和壹個熟練的計算機專家,從1985年開始跟我們壹道工作,不久就拿出了我們需要的軟件。由此,WordNet真正成為普林斯頓新成立的認知科學實驗室幾項研究計劃中的壹個,並開始實際運作。

· 用來創建WordNet的最重要的程序是所謂的Grinder(磨床)程序。Bienkowski在1986年用LISP語言寫了Grinder的第壹個版本。Dan Teibel在1987年用C語言重寫了這個程序。Antonio Romero在1989年又重寫了壹次。Randee Tengi從1991年開始負責管理該程序的所有這些版本。

· WordNet中的詞來自不同的地方。Brown語料庫、Laurence Urdang的同義反義小詞典(1978)、Urdang修訂的Rodale同義詞詞典(1978)、以及Robert Chapmand的第4版羅傑斯同義詞詞林(1977)等。1986年下半年,Miller得到海軍研究與發展中心的Fred Chang的壹個詞表,Miller將Chang的詞表跟WordNet已有的詞表進行了比較,令人沮喪的結果是只有15%的重合詞語,於是Miller把Chang的詞表加入到WordNet中。1993年,Miller得到了Ralph Grishman和他在紐約大學的同事的壹個詞表,39143個詞,這個詞表實際上包含在著名的COMLEX詞典中。這壹次比較的結果是,WordNet中只包含了COMLEX中74%的詞。於是Miller又把這個詞表加入到WordNet中。

· 隨著詞表長度的增加,組織工作的壓力開始增加。第壹步區分是通過句法範疇來進行的。我們創建了不同的文件用於存放名詞、動詞、形容詞(1992年後加入副詞)。但在每個句法範疇內,仍有太多的詞語,如果沒有進壹步分類就難以把握。名詞由於是開放的詞類,因而問題最嚴重。

· 1987年春,Philip N. Johnson-Laird從英國劍橋應用心理學研究所來到普林斯頓大學訪問。他發現WordNet中缺乏手段來區分形容詞的意義在修飾不同名詞時所發生的變化。他利用266對反義形容詞(當時WordNet包含了這些反義形容詞對),根據它們修飾名詞的適合度來分出名詞的次類。結果大約得到名詞的25個次類。這些次類構成了名詞的基礎分類。而且這些不同次類的名詞也相應地被分成不同的個別文件交給不同的研究人員去分頭加工,從而從工程上推動了WordNet的進展。

· 1987年夏,Christiane Fellbaum加入到研究隊伍中來,承擔了對動詞進行次分類的工作。

· 只有Kitty Miller負責的描寫性形容詞(descriptive adjective),從壹開始就壹直保持是壹個大類,沒有次範疇化,所有的這些形容詞也保存在壹個巨大的文件中。

· WordNet從壹個簡單的“詞典瀏覽器”(dictionary browser)發展成壹個自足的詞匯數據庫(self-contained lexical database),主要的進步是從1989年年初開始的。當時SusanChipman不滿於WordNet僅僅作為壹個詞匯瀏覽器而存在,要求研究小組開發壹個工具。該工具可以在WordNet的基礎上閱讀壹個文本,並報告文本中詞語的各種信息。這壹工具即所謂的“Word Filter”(詞過濾器)。罕用的或不符合需要的詞能夠從小說文檔中被過濾出去,而同時更常見的詞語可以用來替代這些詞。這個工作很快使我們意識到必須對詞形的曲折變化進行處理。這使得我們處理了有關詞形方面的壹些問題,WordNet中僅包含詞語的基本形式,如果文本中出現“ships”,WordNet就無法識別它。Richard Beckwith和Miceael Colon寫了壹個程序,叫做Morphy,可以識別出文本中的“ships”的詞形式“ship”。到1989年9月,WordNet就可以處理文本中的詞形變化,並在詞庫中找到相應的詞語基本形式。

· 上述工作導致另壹個重要的進展,就是在文本中將詞語跟WordNet中的相應意義關聯起來。Claudia Leacock(1991年11月加入)和Brian Gustafson開發了壹個界面-- ConText,可以對文本進行預處理(實例化、詞匯化、自動句法標註等),並跟WordNet壹道顯示目標詞語(即對目標詞語進行了語義標註)。1993年6月,Shari Landes負責把壹整套的標註工具匯編到壹起(包含壹組標記),利用這樣壹套工具,可以盡最大可能產生壹個無歧義的文本作為輸出結果。對文本進行語義標註顯著地提高了WordNet的覆蓋面,即包括詞匯覆蓋面,也包括詞義的覆蓋面。

· WordNet的另壹個重要變化是1989年春發生的,Antonio Romero修改了Grinder程序,使得它可以接受插入語定義(或理解為“註釋”)作為同義詞集合(synset)的壹部分。隨著WordNet中詞語數量的增加,既要盡可能清楚地區別詞義,同時又要保持同義詞集合的純粹性,就越來越困難了。換句話說,僅靠同義來定義詞義是不夠的。壹開始,WordNet保持註釋盡量得短。但壹年後,註釋就開始變得越來越長。註釋數量也開始穩步增長。1989年4月,WordNet中有37409個同義詞集合,沒有註釋;到1991年7月,WordNet包含44983個同義詞集合, 13688個註釋(30%);到1992年1月,WordNet包含49771個同義詞集合,19382個註釋(39%);到1993年1月,WordNet包含61023個同義詞集合,36880個註釋(60%);到1994年1月,WordNet中包含79542個同義詞集合,58705個註釋(74%);到1995年1月,WordNet包括了91050個同義詞集合,同時包含了75389個註釋(占同義詞集合數量的83%)。

· WordNet的研究人員壹直把WordNet視作壹個試驗,而不是壹個產品。因此當WordNet中的詞語足夠多的時候,他們就把WordNet向學術界免費公開了。Randee Tengi監督了WordNet壹系列版本的發行。WordNet 1.0版是1991年7月公布的;1.1版是在1991年8月公布的;1.2版是在1992年4月公布的;1.3版是在1992年12月公布的;1.4版是在1993年8月公布的;1.5版是在1995年3月公布的。目前加入WordNet郵件列表的個人和單位超過1000個。諸多研究人員下載了WordNet,並在各個不同的方面使用它。

· 對WordNet提供過資金支持的包括:海軍研究室(Office of Naval Research),高級研究計劃署(Advanced Research Projects Agency),James S. McDonnell基金,以及最近的語言學數據協作會(Linguistic Data Consortium)。

Word的主要功能與特點

Word的主要功能與特點==> Word的啟動與退出

--------------------------------------------------------------------------------

Word的主要功能與特點可以概括為如下幾點:

(1)所見即所得 用戶用Word軟件編排文檔,使得打印效果在屏幕上壹目了然。

(2)直觀的操作界面 Word軟件界面友好,提供了豐富多彩的工具,利用鼠標就可以完成選擇,排版等操作。

(3)多媒體混排 用Word軟件可以編輯文字圖形、圖象、聲音、動畫,還可以插入其它軟件制作的信息,也可以用Word軟件提供的繪圖工具進行圖形制作,編輯藝術字,數學公式,能夠滿足用戶的各種文檔處理要求。

(4)強大的制表功能 Word軟件提供了強大的制表功能,不僅可以自動制表,也可以手動制表。Word的表格線自動保護,表格中的數據可以自動計算,表格還可以進行各種修飾。在Word軟件中,還可以直接插入電子表格。用Word軟件制作表格,既輕松又美觀,既快捷又方便。

(5)自動功能 Word軟件提供了拼寫和語法檢查功能,提高了英文文章編輯的正確性,如果發現語法錯誤或拼寫錯誤,Word軟件還提供修正的建議。當用Word軟件編輯好文檔後,Word可以幫助用戶自動編寫摘要,為用戶節省了大量的時間。自動更正功能為用戶輸入同樣的字符,提供了很好的幫助,用戶可以自己定義字符的輸入,當用戶要輸入同樣的若幹字符時,可以定義壹個字母來代替,尤其在漢字輸入時,該功能使用戶的輸入速度大大提高。

(6)模板與向導功能 Word軟件提供了大量且豐富的模板,使用戶在編輯某壹類文檔時,能很快建立相應的格式,而且,Word軟件允許用戶自己定義模板,為用戶建立特殊需要的文檔提供了高效而快捷的方法。

(7)豐富的幫助功能 Word軟件的幫助功能詳細而豐富,Word軟件提供的形象而方便的幫助,使得用戶遇到問題時,能夠找到解決問題的方法。為用戶自學提供了方便。

(8)Web工具支持 因特網(internet)是當今計算機應用最廣泛、最普及的壹個方面,Word軟件提供了Web的支持,用戶根據Web頁向導,可以快捷而方便地制作出Web頁(通常稱為網頁),還可以用Word軟件的Web工具欄,迅速地打開,查找或瀏覽包括Web頁和Web文檔在內的各種文檔。

(9)超強兼容性 Word軟件可以支持許多種格式的文檔,也可以將Word編輯的文檔以其它格式的文件存盤,這為Word軟件和其它軟件的信息交換提供了極大的方便。用Word可以編輯郵件、信封、備忘錄、報告、網頁等。

(10)強大的打印功能 Word軟件提供了打印預覽功能,具有對打印機參數的強大的支持性和配置性。

  • 上一篇:統計學專業需要帶哪些有用的證件?
  • 下一篇:冰刀簡介
  • copyright 2024編程學習大全網