李葆嘉等

您所在的位置:网站首页 粤语常用词汇量 李葆嘉等

李葆嘉等

2024-07-05 20:46| 来源: 网络整理| 查看: 265

目前世界上种类最丰富的幼儿语料资源,是美国认知科学家、加利福尼亚大学圣地亚哥分校教授贝茨(Elizabeth Ann Bates, 1947–2003)主持研制的“儿童语言数据交流系统”(Child Language Data Exchange System, https://childes. talkbank.org)。该资源中汉语普通话语料库有两个(北京幼儿语料库,大致两周一次,记录了10名20~26个月幼儿日常活动中的语言;南京幼儿语料库,按照预设情境,记录了50名14~48个月幼儿与其母亲的对话)。通行的语料采集方法,或引导幼儿在场景中围绕所设计话题说话,或按照预先设计的母子游戏方案进行对话。此种方法受制于实验取向和次数限制,采集语料有限。也有一些研究者采用追踪记录法,比如,对一名幼儿在16~22个月年龄段加以观察,但是仅记录21次,这种间断性采集难免数据稀疏。也许这些方法及语料适合于某个专题研究,但针对幼儿语言成长的系统研究,则需要长时期跟踪、连续性采集的语料。

幼儿词汇发展水平是衡量语言能力的基本尺度。国内学者的研究:①或仅仅分析部分词类,或给出某年龄段的词汇量,多未能列出较为完整的幼儿词汇清单;②或所列词类不全,或仅给出某年龄段的部分词语,甚至涉及1~5岁幼儿掌握的部分实词,但未提供分年龄段的词汇清单。我们看到的,仅有黄锦芬等(1988)分三个阶段(3~4岁、4~5岁、5~6岁)列出的词汇清单。由于未见汉语幼儿2~6岁(13~72个月)长期跟踪的连续性语料,不但迄今尚无一份完整的汉语幼儿(2~6岁)常用词汇发展表,而且某一年龄段的常用词汇也未见相对一致的清单。

近20年来,语料库语言学已成为语言研究主流方向,基于大规模真实语言文本和相应软件工具,研究幼儿语言成为新的趋势。我们采用自然状态录音法,坚持“三不原则”(不设计录音内容,不限制录音场景,不规定录音次数),长期跟踪采集幼儿日常会话,研制“汉语幼儿(2~6岁)日常会话跟踪语料库”,然后提炼各年龄段常用词表并建构其词汇语义系统,为进一步探索幼儿的话语结构和话语行为能力的成长提供基础。该研究主要任务是耗时费力的基础工作:跟踪录音→加工语料→分词统计→提炼常用词汇→建构语义系统。换而言之,幼儿语言学理论或跨学科(认知、心理、社会、文化、交际等)研究并非本研究的重点,尽管李葆嘉(2002, 2005, 2008, 2010)提出并采用了一系列相应的理论方法,但是在没有充分的基础研究之前,纯粹的理论研究可以缓行。

二、历程

衡量幼儿语言能力发展的明显指标是词汇量。依据语言学的层级性元语言理论,元语言符号包括:习义元语言词元系统(幼儿日常概念)、释义元语言基元系统(辞书释义基元)、析义元语言义元系统(语义分析元素)和认知元语言知元系统(语言认知元素)。其中,习义元语言词元系统由基于幼儿语言认知能力形成的日常概念构成,是个体语言成长为“成人语言”的内核或底座。

要了解幼儿语言能力的发展,基础工作就是在自然状态下对其日常会话跟踪录音。我们团队尚无针对多个对象同时并举的条件,只能以个案方式进行,走一步是一步。实践表明,某年龄段的“纯幼儿语料”只要达到一定规模(两岁段10万字;三岁段15万字;四岁到六岁段各自达到20~25万字),所提取的常用词就可以满足该年龄段幼儿的日常语言交流。本研究不涉及所谓“尽可能大的语料库”(尽管我们团队的语料库已是目前规模最大的)。我们信奉的哲理就是“一叶知秋”(中国古代哲理)、“一滴水可以折射太阳的光辉”(西方古代哲理),即“共性与个性皆寓于个别之中”。有兴趣的同道,可以建立新的跟踪语料库,凭借新的研究补正我们的数据。

根据现有语料统计和提炼,汉语幼儿常用词汇量大体如下:两岁段628个、三岁段1376个(递增748个)、四岁段1847个(递增471个)、五岁段2227个(递增380个)、六岁段2938个(递增711个)。三岁段出现最高递增峰,四岁段持续,五岁段词量递增度放缓,而句子组织和表达能力日趋提高。六岁段出现第二个词量递增峰,个体日常语言趋于成熟。此外,幼儿话说结构句的统计结果显示,与成人“话说结构范畴匹配框架”(框架63种)相比,四岁段幼儿语料中未见的仅6种,五岁段幼儿语料中未见的仅4种(与幼儿的认知水平和社会知识有关)。幼儿话语行为效能的研究显示,两岁段幼儿59种,三岁段76种,四岁段已掌握78种。

个体语义系统的不断成长反映了个体认知对象世界程度的不断提高。通过幼儿词汇语义系统的建构,可以全面深入地了解幼儿语义系统的成长状态。如果列出的幼儿词表,仅满足于传统语法的词语分类,或简单的语义分类,也就不可能窥见幼儿成长的足迹。基于幼儿日常认知能力和语言知识挖掘(充分利用上下文和语境),本研究建构了前后衔接的两套语义系统。前一套是2~4岁的语义系统,分为4大类(指称类、陈述类、描绘限制类、情态功能类)15~16中类,可根据年龄段调适。后一套是5~6岁的语义系统,分为7大类(指称类、陈述类、描绘类、限定类、标记类、情态类、呼应类)29中类(即29个语义词类)。语义系统建构采取基于范畴化心理联想机制的词汇语义类聚法,就像拼图游戏一样,将其碎片进行从小到大的局部组合,以期最终拼出一幅相对完整的画面。通过不同年龄段常用词汇语义系统的对比,可以呈现汉语幼儿词汇语义的逐步成长轨迹。

根据所采集幼儿语料(城市文化背景、父母大学毕业、家庭氛围良好;绝大部分是女孩,喜欢说话和录音;父母有耐心,对通过录音保留幼儿语言生活感兴趣)的统计分析,当前汉语幼儿词汇发展水平比其父母(20世纪70年代出生)幼儿时期的状况提前约半年。如今两岁段幼儿的词汇量(13~24个月DD9.6万纯幼儿语料中,共出现词语2830个,频率5次以上的约684个,频率10次以上的约436个),相当于过去两岁半幼儿的词汇水平。如今三岁段幼儿的词汇量(26~36个月XX 18万纯幼儿语料中,共出现词语3413个,频率5次以上的约1593个,频率10次以上的约1046个),相当于过去三岁半幼儿的词汇水平。促成当代幼儿(独生子女)词量高增的因素可能有:①交流对象的成人化,三岁前幼儿的交流对象以成人为主;②智力开发的早期化,促使语言交流起步早;③启蒙媒介的多样化,除了图画卡、图画书,电子作品、电视节目等成为幼儿的日常视听材料。

南师大语言学团队的幼儿语言能力发展研究得到关注。《扬子晚报》记者蔡蕴琦前来采访,刊发整版报道《专家研制幼儿会话语料库探寻孩子学说话之谜》(2012年12月27日A8),中国网、人民网、未来网、腾讯网、科学网、中教网、深圳妈妈网、四川在线、新浪博客等纷纷转载。江苏教育电视台也做过专题采访报道。近年来,还有智能科技公司前来联系,希望合作开发幼儿自动会话系统,或索取语料样本。我们希望有机会建立共享平台,分期分批发布幼儿会话语料,以推进幼儿语言研究进展,为提升国民语言能力服务。

《扬子日报》2012年12月27日A8版

三、辛劳

“汉语幼儿日常会话跟踪语料库”从2005年启动,到2015年告一段落。录音语料库总时长35442分钟,包括18个子库(两岁幼儿3个、三岁幼儿4个;四岁幼儿4个、五岁幼儿5个和群体1个、六岁幼儿1个)。其中已转写的(时长30709分钟)建成11个文本语料库,约360万字(纯幼儿语料145万字)。尚未转写的7个录音语料库(时长4733分钟),可转写约56万字。全部转写后,预计总规模约420万字(纯幼儿语料165万)。

作为汉语幼儿自然语料库,本语料库的建成,首先是十几位幼儿的双亲及陪护家人不辞辛劳地负责录音储存,有的连续录音几年。其次是众多研究生的参与。已建成的11个文本语料库的负责人是:薛松馨、嵇红英、祁文慧、王彤、张霞、李云芳、张洋梵、李尧。参与转写的还有:王婷婷、钱韵然、孙杨、施书宇、徐丽、李文涛、马子恩、王瑶、李小敏、宋纯、黄晓晓、陈瑞琴、李玲、张彩琪、姚志勇、徐夫梅、黄小莉、朱振华、王悦、颜明、陈秀利等。也就是说,负责录音储存的十几位幼儿家人和参与转写的研究生29位,共有40余人。

日常会话具有模糊性、重复性和跳跃性,文本转写工作繁重。1分钟的录音语料转写为文本,大约需要6分钟(先听录音语料,熟悉内容约1分钟;听一句转写一句,听写交替操作约3分钟;初步转写好,再听1分钟,核对所转写的文字标点等;这些程序之间的间隙约1分钟)。以此效率计算,30709分钟录音语料转写为汉字,需要花费184254分钟,约为3070个小时。如以1人1天转写4个小时计算(转写工作极易疲劳,中间需要休息),需要768天。如果以每周工作5天计算,则需要153周。如果按一年为52周计算,也就是1人需要工作3年。本资源是分期分批邀请29人转写的,也就是每人平均5周半(即40天)。

实际上,不可能连续工作,耳朵和眼睛都吃不消,只能断断续续转写。除了初次转写,还有校对编辑等也都费力耗神。如果支付劳务费,以1人计算,月工资6000元,三年则216000元。实际上能付给转写者、校对者、编辑者的报酬极其菲薄,参与其中的大多数人并无任何酬劳。语音采集对象的这些小朋友,负责录音储存的幼儿家人都是无偿奉献,最多,过儿童节给小朋友送点小玩具。如果凡参与合作者都付给相应报酬,该语料库的研制费用约60万元。

做别人想到而不做的,做别人认为不可能做的,做别人未想到要做的—多年来的幼儿语言探索,仅是此类“边缘化探索”的尝试之一。从2000年之前的一意孤行到其后的结伴而行,作为主持人和研究者,我在此要反复强调—此为团队合作成果!

本文摘自李葆嘉、王彤等:《幼儿语言的成长:常用词汇语义系统建构》,

科学出版社出版

今日责编:朱迪返回搜狐,查看更多



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3