浅谈我国电子词典的种类、特点及其应用

您所在的位置:网站首页 什么是子类型语言学 浅谈我国电子词典的种类、特点及其应用

浅谈我国电子词典的种类、特点及其应用

2024-07-13 10:08| 来源: 网络整理| 查看: 265

语言学及应用语言学 07级 王 莉

摘要:电子词典是指以光盘、磁盘及芯片等光电磁介质作为载体,并可借助微型处理器及相关设施进行查询和阅读的辞书。经过近40年的长足发展,我国电子词典呈现出种类繁多、功能较为齐全、应用范围广泛的发展趋势。我们可以根据不同的标准将电子词典分为不同的种类,本文在给电子词典进行分类的基础上,按种类分别介绍了它们的功能特点以及所能应用的领域。

关键词:电子词典;种类;特点;应用

“电子词典”这一概念的提出,始于20世纪40年代末期美国人对自然语言处理和机器翻译的研究。我国的电子词典也同样起源于自然语言处理和机器翻译的研究,始于20世纪70年代,在80年代得到国家的高度重视。80年代中期有了阶段性成果,内容包括句法分析和句子短语的理解。到90年代初期,机器翻译的研究得到国内同行专家的普遍重视,相继有一些成果推出。例如,军事科学院的“科译一号”,中国计算机软件总公司的“译星英汉电脑翻译系统”和“汉英、汉日机译系统”,铁道部情报所的“TECM英汉机译系统”。随后,一些大学的研究机构在该领域的研究也取得了一定的成果,如哈工大的“汉英MT系统”,华中理工大学的“E-RTV系统”和复旦大学的“FDM T英汉翻译系统”等。进入21世纪以后,随着计算机技术的不断提高,语言本体知识研究的不断深入,我国的电子词典又有了日新月异的发展。

所谓电子词典是指以光盘、磁盘及芯片等光电磁介质作为载体,并可借助微型处理器及相关设施进行查询和阅读的辞书。它是存储在电子媒体上的语言知识库,包括词的语义属性、句法属性和语用属性。从存储介质的角度来看,广义的电子词典包括各类光盘词典、芯片词典、网络词典和(语言或文字处理系统中的)机载词典(或“机器词典”),而狭义的电子词典一般是指光盘词典和芯片词典。

经过近40年的长足发展,我国电子词典呈现出种类繁多、功能较为齐全、应用范围广泛的发展趋势。根据不同的标准,我们可以把电子词典分为不同的类型。其中根据其用途可以分为两大类:一是供机器翻译或自然语言处理用的编码计算机语言词典(即机器词典),二是供人查阅的非编码自然语言词典(即普通电子词典或机读人用词典)。按照承载介质的不同,普通电子词典又可以分为微型芯片词典(“掌上电子词典”或“袖珍电子词典”)、光盘电子词典和计算机网络词典(或“在线词典”)。下面分类别依次介绍一下这几种类型词典的特点和用途。

1、机器词典(“机载词典”)

机器词典是机器翻译系统的核心部件,包括静态语言信息和各种动态信息两大部分。静态信息部分在翻译过程中提供语法和语义规则上的支持,动态信息则用来运算、理解并表述话语的语义特征。机器词典构造的是语言翻译的知识库而不是数据库,其词条是具有完整意义的单词所代表的简单概念或词素和具有完整意义的非自由短语所代表的复杂概念或句素,而由这些概念所形成的层级化、秩序化的语义网络,能够充分揭示中外语言单位之间的内在逻辑联系,为计算机理解词义、句义及篇章义奠定了基础。(姚天顺,1995)。机器词典可以说是一种智能化的词典,它不但要求正确揭示和表述语词的各种属性,还要建立语词表示的概念与概念、属性与属性之间的内在联系,以及语词在另一种语言中的表述方法。

早在20世纪40年代中期,美国的科学家就研制出机器词典,到了80年代在国际上开始进入繁荣发展的阶段。到了90年代,我国专家也研究和成功开发了多种专门用途的机器词典。除了一般通用词典和专业词典外,我国目前已研制出具有深层语义和句法处理功能的词典,如:《现代汉语语法信息词典》、《现代汉语语义词典》、《信息处理用汉语语义词典》、《现代汉语述语动词机器词典》、《汉语高频词语法信息词典的研制》、《现代汉语新词语信息(电子)词典》等等。

根据机器词典在翻译系统中的功能,我们可以将机器词典分为基本词典(主词典)、概念词典(语义词典)、专业词典(专科词典)、语法词典、对译词典。

(1) 基本词典(主词典)

它收录一种语言的基本词汇,并把这些词汇的基本属性和语言规则描述出来,充分展现了这些词的特性和用法,构成语言的基本体系。也就是说,以词库的方法来表述每个词的语言知识,形成一个词汇知识库系统。基本词典描写的是静态属性。

(2)概念词典(语义词典)

它构造语词的概念层级和概念之间的系统关系,建立某种语言的词汇语义分类体系,其直接目标是为自然语言处理和机器翻译系统提供语义信息上的支持。概念词典既具有静态属性,又有动态属性。我国的概念词典有《现代汉语语义词典》、《信息处理用汉语语义词典》、中文的“知网”等。

(3)专业词典(专科词典)

专业词典可以提供专业词汇知识,保障专业术语翻译的准确性,还可以提供满足语篇上下文分析所要求的词汇。一般的翻译系统都配有强大的专业词典,如《金山快译2003》除了有512个行业词库外,还全部收录了全国科学技术名词审定委员会公布的49种专业术语。

(4)语法词典

它为语言信息处理建立最基本的语法规则库,包括词法信息和句法信息两部分。词法信息部分建立词法生成规则集,用于描述语词的基本功能属性,分析和划分自然语篇的词汇单位(即汉语分词)。句法信息部分用于描述语词的句法模式、搭配和组合关系等各种固有的语法属性,以及属于同一范畴的各个语词之间相互区别的语法属性,以便计算机对自然语言中各类句子实现自动分析与自动生成。北京大学的《现代汉语语法信息词典》就是为实现汉语的自动分析和目标语的自动生成而开发的一部语法词典。

(5)对译词典

它记录源语和目标语的对译词汇,描述两种语言的对等关系。对译词典是保证机器翻译得以实现的语词知识库。按词目词的收录形式或关键词的索引可以分为:词形词典、词位词典和词干词典。

2、微型芯片词典(“掌上电子词典”或“袖珍电子词典”)

微型芯片词典,又称为“掌上电子词典” 或“袖珍电子词典”,是指把词典内容固化于芯片内,置入相应的信息处理硬件设备中,通过一定的界面来查询和阅读的电子词典。

世界上最早的掌上电子词典诞生于1983年,而我国最早开始研制并生产的是1989年创立的香港权智国际有限公司,第一部涉及汉语的电子词典“快译通”于1989年12月推出。到了20世纪90年代,国内掌上电子词典得到迅猛发展。

目前,市场上的掌上电子词典的系列和品种繁多,我们按照不同的标准,可以把掌上电子词典分为不同的类别。按收词的规模,掌上电子词典可分为小型、中型、大型三类;按词典功能,又可以分为一般用途电子词典、专门用途电子词典和多功能词典;按所涉及的语言数量(即语种),又可分为单语、双语和多语词典;按源语和目标语的解释关系,可分为单向词典、双向词典和多向互动词典;按查阅方式可以分为单向查询、双向查询、多向查询词典;按词汇信息种类可分为单词词典、短语词典和句典;按词典知识信息的来源可分为自编词典和内置现有印刷本词典等;按功能扩展方式有单一词典、网络连接词典和插卡式词典。

“快译通”掌上电子词典、“好易通”掌上电子词典和“文曲星”掌上电子词典是我国掌上电子词典市场上的主流产品,占据了绝大部分市场份额。此外还有“名人”电子词典、“雷登智典”电子词典、“诺亚舟”电子词典、“联想”电子词典、“锦囊”电子词典、“步步高”电子词典、“佳能酷易典”电子词典、“信利”电子词典、“无敌”互动学习词典等等。

目前市场上的掌上电子词典,不仅品种繁多,而且功能各有特色。但是其基本功能大致相似,归纳起来有:词典信息功能、词典的多种查阅功能(含英汉互查)、发音和录音功能、信息存储功能、计算功能、个人理财功能、资料功能、游戏功能、PC互连功能等等。一般来说,掌上电子词典因其特殊性,相对于其他电子词典来说,特有功能和附加功能要多一些。

掌上电子词典经过三代更新以后,技术不断进步,编纂日趋完善,价格也呈现多样化,正朝着有利于学习者的方向发展。与纸质词典和光盘词典相比,掌上电子词典具有便于携带,可以随时使用的优势。我们相信未来的掌上电子词典的编纂将更加人性化,成为语言学习不可或缺的工具。

3、光盘电子词典

光盘词典是依托计算机技术设计开发的另一类电子词典,它存储在CD-ROM上,并可由使用者直接安装在个人PC上,每次使用时一般无须再运行光盘。目前国内常见的光盘词典的编纂发行者主要为享有盛誉的图书出版公司,由于它们是专业的词典编纂人员,相比较而言,辞书编辑严谨,质量可靠,在依托计算机技术后,实现了词典编纂领域的突破。

欧美电子词典从20世纪60年代起开始发展电子词典,80年代末至90年代初期开始出现电子词典出版的高峰。这些词典进入中国市场时都是以光盘的形式出现的,因此被称作“光盘词典”。从20世纪90年代初期开始,港台地区编辑或出版的光盘电子词典开始进入内地市场,主要有:《译典灵人声语言英汉辞典》、《21世纪多媒体英汉双向辞典》、《莱思康综合有声词典》、《远东图解英汉词典》、《远东英汉百科大辞典》、《牛津高阶英汉双解词典》等。随后,我国内地也相继推出了一批电子词典,如《即时通英汉汉英双向词典》、《在线英汉词典》、《朗道电脑字典》等。此外,我国的光盘电子词典还包括软件版辞书,是指以软件形式发行,在使用过程中不通过互联网传送数据的数字化辞书,如《汉语大词典》(光盘版)、《中国大百科全书》(光盘版)、《儿童辞海》(光盘版)、“金山词霸”等。

按储存信息的方式,光盘词典可以分为只读光盘和交互式光盘两种;从用途来讲,可以分为参考工具词典和翻译类电子词典。只读光盘和交互式光盘为以数字化形式综合存储和处理语音、视频、图像、文字、数据等多媒体信息提供了有利条件。利用多媒体技术,可以在光盘上储存一个具有检索和管理功能的多媒体数据库。

光盘词典携带和使用方便,可以在微型计算机、袖珍式数据光盘播放器、交互式光盘驱动器上使用。与传统的印刷版词典相比,光盘词典显示出极大的优势这主要表现在以下几个方面:

首先,光盘词典大都具备边输入边检索的功能。随意输入一个字母,检索窗内即显示相应的词条,随着输入的字母的增加,词条会做相应的变化,点击检索窗内的词条,右侧的显示窗内即出现查询结果。

其次,多数词典支持模糊查询。使用者可使用通配符进行模糊检索,对于检索记忆不清或同根词等尤为方便(目前许多便携式词典和在线词典也具备该功能),这是传统词典所不具备的优点。

再次,光盘词典通常都具备高级检索与二次检索的功能。如剑桥高级学习者词典(Cambridge Advanced Learners’Dictionary)使用界定词条用法的方式检索,高级检索对话框内提供了category、part of speech、grammar、usage、region、topic等六个栏目供使用者界定检索范围,使用者在第七个word栏目中输入单词,点击Find按钮,即可查询到诸如动词短语、成语、俗语等语汇。韦氏大学词典(Merriam-Webster’s Collegiate Dictionary)使用组合功能键AND、OR、NOT,使用者首先在对话框内选定查找词条的检索特点或在词典中出现的位置,然后通过三个功能键的组合界定检索范围,点击Search完成检索。

另外,绝大多数光盘词典还具备诸如屏幕取词、全文检索等其它检索方式,让使用者可以快速查找到需要检索的词条。值得一提的是,由于安装后不需要计算机运行光盘,因此用户可以同时调用多部光盘词典,有些光盘词典还具备word的嵌入、复制词条、打印等功能,这些优点大大提高了使用的便利性,成为传统词典无法超越的优势。

4、网络电子词典(在线词典)

互联网的发展拉近了人与人之间的距离,使人们沟通起来更加方便。为了网络阅读的需要,网络词典在互联网发展的同时便应运而生了。

网络电子词典,又称“在线词典”,是指依附在一个网站上,供人随时以Web方式调用查阅的电子词典。典型的网络词典就是一个网站。按其“寄宿”方式和用途,网络词典可以分为单一词典网站、集合词典网站、网络翻译词典网站。

网络电子词典还包括网络版辞书,是指在使用时通过互联网来控制数据传送的数字化辞书,如《汉语大词典》(网络版2.0)、《中国大百科全书》(网络版)、《辞海》(网络版1.0)等。

目前互联网上的在线词典不仅种类繁多,数量巨大,而且语种较为齐全,专业性较强,已经形成一个各类词典的资源库。在线词典还具有更新快、专业性强、词典门类丰富的特点,在开通网络连接的条件下,可以用来查询专业词汇、传统词典暂时未收录的新、难词汇等;可以在线比较选择适用于自己语言水平和专业特点的词典,使词典的使用更有目的性和针对性;可以利用在线词典的多样性和各自的特色,查询到含有丰富的文化内容的语汇,起到大型综合性词库的作用。

除了以上的划分角度外,我们还可以根据用途、目的的不同,将电子词典分为三种主要类型:

二是学习型词典。目前市场上销售最多的词典。主要包括单语、双语,单学科和百科词典等。学习型词典是人们学习时获取知识的助手,它是传统纸介质词典的电子化形式,只是介质形式不同,释义内容没有任何变化。而真正意义上的电子词典,不仅是介质的变化,介质的变化还带来了内容、查询方式、结构体系等一系列变化的可能性。

三是机用型词典。机用型词典是专门为计算机提供语言学知识的词典,主要用于自然语言信息处理、机器翻译等领域。与其他类型词典最大的不同就是,词典中不仅包含语言学信息,还包含如何操作处理这些语言学信息的知识,即操作知识。

四是研究型词典。研究型词典的形式结构、内容、检索方式是传统纸介质词典所不能实现的。按内容可分为两个子类型:(1)供语言学工作者研究语言的工具。对使用者来说,既是一种研究语言材料的工具,同时又是使用者研究的对象。(2)供语言信息处理工作者开发语言信息产品使用的语言知识库。

研究型电子词典虽然具有一定的探索性质,但是它却体现了电子词典编纂思路的根本性转变,它们将词汇语义的最新东西与计算机信息处理的最新技术应用于词典编纂。研究型电子词典在深入探讨词位系统和词义系统的语义结构层次和语义关系的基础上,以语义场、词群、框架语义学、语义配价、并置理论、语义网络等新的理论为指导,开创性地提出了很多编制原则,代表了电子词典未来的发展趋势。其最大的特点就是先有一个尽量统括全民族词汇的知识库,典型的研究型电子词典如国外著名的英语“WordNet”,俄语的“词汇信息库(全俄科学技术信息研究所)”,四卷本“当代法语详解组合词典”、“俄语详解组合词典”MindNet、FrameNet等,我国国内北京大学仿照WordNet制作的CCD,山西大学的CFN,董振东、董强创立的中文的“知网”(HowNet)等也是。

就目前来看,研究型电子词典是最前沿的,它探索出来的新的编纂思路和方法会在传统型、学习型、机用型电子词典中具体体现出来。

“电子词典需要有电子技术的介入,但归根到底它还是词典。也就是说,电子词典只能是词典学与计算机结合的产物,忽略了任何一个方面都不可能编纂出高质量的电子词典来。”(章宜华,1996)我国的电子词典发展到现在,已经达到了一定水准,而且呈现出种类繁多、学科门类丰富、功能较为齐全、应用范围广泛的发展趋势,可以说步入了稳定发展的成熟期。但是从目前我国的电子词典市场来看,商业行为占主导地位,有些词典释义混乱,连词典的基本体例也没有;有些电子词典只不过是印刷本词典的翻版,界面单一,查阅也十分不便。诸如此类的现象直接影响了电子词典功能的发挥和应用。

与欧美同类电子词典相比,我国的电子词典,尤其是内地出版的电子词典,不仅在词典知识结构的组织和词汇信息处理方面,而且在界面的设置方面,都还存在着一定的差距。因此,我们需要吸取国际上成功电子词典中有益的东西,并结合我国电子词典的实际情况,在界面友好性和词典的信息内容上下工夫,不断加快我国电子词典的开发,大力提高电子词典的编纂质量。

注释:

[1]姚天顺等.自然语言理解——一种让机器懂得人类语言的研究[M].北京:清华大学出版社,1995

[2]章宜华.电子词典的现状和发展趋势[J].辞书研究(6),1996

参考文献:

[1]陈菊.浅谈电子语言词典的现状[J].集美大学学报(哲学社会科学版),2000

[2]陈群秀.一个在线义类词库:词网WordNet[J].语言文字应用,1998(2)

[3]董振东,董强.知网简介,1999

[4]冯建明.电子词典的种类及结构分析[J].吉林工程技术师范学院学报,2008(4)

[5]高永伟,李洁.因特网与词典编纂[J].

[6]黄建华.词典论[M].上海辞书出版社,2001

[7]亢世勇.《现代汉语新词语信息(电子)词典》的研究与实现[J].中文计算机语言学刊,2002(2)

[8]林杏光.现代汉语属于动词机器词典[M].北京:北京语言学院出版社,1994

[9]卢华国.袖珍电子词典现状与英语教学现代教育[J].

[10]秦明,吴家玲.试论在线辞书的局限性[J].

[11]司敬新.在线词典的特点分析[J].中国电化教育,2005

[12]王惠,詹卫东,刘群《现代汉语语义词典》的概要和设计[J].1998中文信息处理国际会议论文集,1998

[13]姚天顺等.自然语言理解——一种让机器懂得人类语言的研究[M].北京:清华大学出版社,1995

[14]源可乐.词典的突破——谈谈光盘电子词典的特殊检索功能[J].

[15]张小龙,姚天顺.用于理解的语义词典的构造和设计[J].

[16]章宜华.电子词典的现状和发展趋势[J].辞书研究(6),1996

[17]章宜华,黄建华.语言学理论对词典释义的影响[J].现代外语,2000

[18]章宜华.计算词典学与新型词典[M].上海:上海辞书出版社,2004

[19]章宜华,雍和明.当代词典学[M].北京:商务印书馆,2007



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3