1、定义
短语是由语法上能够搭配的词组合起来的没有句调的语言单位,又叫词组。
词语是词和语的合称,文字组成语句文章的最小组词结构形式。
2、内容
短语是单词的一个群组,两个或更多词的组合(区别于单词),如“新社会,打扫干净,破除迷信”。
词语包括单词、词组及整个词汇。包括:
① 单纯词:由一个语素组成词,自由的单音节语素和所有的双音节、多音节语素都可以组成单纯词。如:山、水、天、地、人、有、土、红、凑;仿佛、苍茫、水果、蜈蚣、琉璃、参差、蹉跎、敌敌畏、阿司匹林、萨克斯、麦克风等。
② 合成词:由两个或两个以上的语素组成的词。
3、分类
短语可以从多种角度去观察,从而分出各种不同的类型。最重要的有以下两种分类:
① 结构类
② 功能类
按照短语构成要素是否凝固来分类,可分为:?
① 固定短语
② 非固定短语
词语从词性来看,可以分成:
① 实词,有实际意义的词。?
② 虚词,没有实在意义的词。
③ 汉语中的一词多义多用现象。
4、词语结构
词语结构分为单纯词、合成词:
①?单纯词整个词只能表示一个意思,不能拆开。
②?合成词是由几个语素组成的,拆开来仍旧有意义。
短语结构类型:
① 基本短语:主谓短语、动宾短语、偏正短语、中补短语(后补短语)、联合短语。
② 其他短语:连谓短语、兼语短语、同位短语、方位短语、量词短语、介词短语、助词短语。
百度百科-词语
百度百科-词组
百度百科-短语
高考语文病句修改专题例析 (2008-09-28 10:30:15)
标签:分析 高考 教育 语文 语言 专题 病句 杂谈 分类:病句解析
高考语文病句修改专题例析
病句是指不符合语言规范的句子。辨析病句,是考查对病句的识别与分析,有了这种能力才可能对病句进行修改。“正确使用词语”一条已有涉及;《考试说明》中列出的六种病句类型大致有如下情形:
1 语序不当
(1)名词修饰语
多项定语与中心语的正确次序一般是:①表领属性的或时间、处所的;②指称或数量的短语;③动词或动词短语;④形容词或形容词短语⑤名词或名词短语。
另外,带“的”的定语放在不带“的”的定语前。
例如:
一位优秀的有20多年教学经验的一位国家队的篮球女教练。
正确次序:国家队的(领属性的)一位(数量)有20多年教学经验的(动词短语)优秀的(形容)篮球(名词)女教练。
下面是多项定语次序不当的例子:
① 许多附近的妇女、老人和孩子都跑来看他们。(表数量的“许多”应紧靠中心短语)
② 在新中国的建设事业上,发挥着他们无穷的蕴藏着的力量。(表性质的“无穷的”应紧靠中心词)
③ 里面陈列着各式各样过去所使用的东西。(表性质的“各式各样”应紧靠中心词。)
下面是定语误放状语位置的例子:
① 夜深人静,想起今天一连串发生的事情,我怎么也睡不着。(“一连串”应修饰“事情”)
② 这种管子要不要换,在领导和群众中广泛地引起了讨论。(“广泛”应修饰“讨论”,“地”改为“的”)
下面是定语和中心语位置颠倒的例子:
我国石油的生产,基本供应国内。(“石油的生产”应为“生产的石油”)
(2)动词修饰语
多项状语次序比较复杂,须特别注意的是:
① 先时间后处所;②先介词结构后情态动词、形容词;③表示对象的介词结构一般紧靠中心语;④不要弄错修饰对象。
看下面的例子:
① 在这片神奇的土地上上一世纪曾发生过一场血战。(“上一世纪”应放在“这片神奇的土地上”前)
② 我们再也不是任意被列强欺侮的国家。(“被列强”应放在“任意”前)
③科学家急于对兰花在最有异域色彩的热带物种标本完全消失之前进行研究。(“对兰花”应放“进行”前)
④美国有15个洲禁止黑人在场所与白人享有平等的地位。(“与白人”应修饰“平等”)
⑤大家就工资问题交换了广泛的意见。(“广泛”应修饰“交换”)
⑥开考半个小时后,就有人陆续交卷。(“陆续”应修饰“有”)
(3)关联词语的位置
一般来说,两个分句同一个主语时,关联词语在主语后边;不同主语时,关联词语在主语前边。
下面句子是位置不当的例子:
①他如果不能实事求是,事业就会受到损失。(“他”应移到“如果”后面)
②要是一篇作品里的思想有问题,那么文字即使很不错,也是要不得的。(“即使”应移到“文字”前。照原句就变成了只是文字要不得,不是作品要不得。)
2搭配不当?
搭配不当是常见语病,是高考测试的重点,几乎每年高考都有此类语病题。
(1)主谓搭配不当
例如:
①我国棉花的生产,过去不能自给。(不能自给的是“棉花”而不是“生产”。)
②中国人民的解放在民族关系上起了基本的变化。(“中国人民的解放”没有“起变化”,“起变化”的是“民族关系”。正确的表达应是个兼语句,要改“在”为“使”)
③我觉得这个答复,和对这些问题的调查处理,都是一种不负责任的态度。(应该把“是”改做“表现出”。)
(2)动词和宾语搭配不当
例如:
①纪念三八节的到来。(“纪念”的只能是“三八节”而不是“到来”。)
②解放前,爸爸和哥哥两人挣来的钱还不够养活一家人的生活。(“养活”的只能是人,不能是“生活”。)
④ 但也存在着几个缺点需要我们努力。(我们所能“努力”的不是“缺点”,而是“改正”。)
(3)修饰语和中心语搭配不当
例如:
这次大会上,对工资问题交换了广泛的意见。(并不是意见广泛而是交换的范围广泛,应改为“广泛地交换了意见”。)
*这一类搭配不当常和语序不当有交叉的地方。
(4)一面与两面搭配不当
例如:
①做好生产救灾工作决定于干部作风是否深入。(“做好”是一面性的,“是否深入”是两面性的。此外“作风是否深入”也讲不通,应该是“干部是否深入群众”。这句话有两种改法:把第一个分句改成两面性的“生产救灾工作做得好不好,决定于干部是否深入群众”。或将第二分句改成一面性的,不过句子结构要调整为“干部深入群众是做好救灾工作的决定条件”。)
②艺人们过去一贯遭白眼,如今却受到人们的热切的青睐,就在这白眼与青睐之间,他们体味着人间的温暖。(“白眼”和“青睐”指相反的两面,但底下的“温暖”只适用于一面。)
(5)否定与肯定搭配不当
例如:
①我想这应该是不必叙述的,没有谁不会想象不出来。(“没有谁不会想象不出”等于说“谁都想象不出”,推测原意就是“谁也想象得出”。)
②我们并不完全否认这首诗没有透露出希望,而是说希望是非常渺茫的。(“不完全否认”等于“部分承认”,基本上还是承认。因此这句话说“我们承认这首诗没有透露出希望”,刚好和作者的本意相反。改法有两种“我们也承认这首诗也透露了一些希望……”或“我们并不否认这首诗也透露了一些希望……”)
③会员家属除凭发出的入场券外,并须有家属徽章,无二者之一不能入场。(“无二者之一即不能入场”从字面意思上推,可有“有二者之一即可入场”的意思。跟原意不符,应该说“二者缺一即不能入?”)
3 成分残缺或赘余
成分残缺
(1)缺主语
例如:
①由于他这样好的成绩,得到了老师和同学们的赞扬。(“得到”的主语是什么?改为“由于这样好的成绩,他得到了……”)
②十月十四日,抱着向航空系学习的想法,我们的黑板报也创刊了。(“抱着”的主语显然是蒙后的“我们”但后句的主语是“黑板报”,不是“我们”,应把后句改为“我们也办起了黑板报”。)
(2)缺谓语
例如:
①可见对工人阶级的关心负责的态度到何等的薄弱程度。(“到”在这里不能做谓语的主要成分,只能将“薄弱”提上来,可“态度”是不能薄弱的,句子应改为“……的关心和负责薄弱到何种程?”)
②最近又发动了全面的质量大检查运动,要在这个运动中建立与加强技术管理制度等一系列的工作。(“一系列的工作”是哪个动词的宾语呢?也许是“建立与加强”的?“建立与加强工作”又讲不通,在“建立”前少个谓语“完成”。)
(4)缺宾语
例如:
①虽然每天工作很忙,但还是抓紧和同学研究或自己看书。(“抓紧”什么?“时间”一词不能省。)
②我们要尽一切力量使我国农业走上机械化,集体化。(“走上”要求有一个名词做它的宾语,“机械化”、“集体化”都是动词,句子应是“走上……的道路”)
赘余
(1)堆砌
例如:
①要考虑我国政治与文化环境的需要,发展我们的出版业。(“环境”应删去。)
②现在渔民自己选出了行政组长,负责掌握渔民的生活及生产的管理。(“掌握”应删去。)
(2)重复
例如:
①一年来,妇女工作已打下了相当的工作基础,获得了一定的工作经验。(第二、第三个“工作”应删去。)
②其实这是过虑的想法。(“虑”就是想,应删去“的想法”。)
(3)可有可无
例如:
①不知不觉就走了十里路左右的距离,(应删去“的距离”。)
②父亲逝世离现在已整整九年了。(应删去“离现在”。)
(4)应删去"的"字
例如:
①出人意料的,今年三月,物价的下跌,后来慢慢的稳定了。(加了“的”,句子转为短语,意思也变了,不是物价稳定,而是“下跌”稳定了。)
②由于历代和气候的潮湿,几乎所有当时的绘画遭受毁灭。(“历代”和“”中间也可加“的”而没有加,为句子整齐,“气候”和“潮湿”中间就不必加“的”。)
4 结构混乱
这是一个很大的类句,这里谈的是不能用“主语”“宾语”等来归类的情形。这里最常见的是一句之内两种结构纠缠不清,有以下类型:
(1)举棋不定
作者时而要用这种结构,时而要用那种结构,结果两种结构都用了。
例如:
①多年来曾被***经济思想束缚下的人们也觉悟起来。(应该在“曾今……束缚的……”和“在……束缚下的……”两种格式中选用一个。)
②这慷慨悲歌的壮举的背后,还是自信心不够的表现。(应该在“……的背后还是自信心不够”和“……壮举还是自信心不够的表现”里选用一个。)
(2)藕段丝连
一句话的结构已经完整,却把他的最后一部分用做另一句的开头。
例如:
①我们向***提意见是人民的责任。(把“我们向***提意见”和“向***提意见是人民的责任”凑在一块儿,应该删去“我们”。)
②你可知道,要出版一本译作是要经过多少人的努力以后,才能与读者见面的。(是把“要出版……的努力”和“一本译作……见面的”凑在一块儿,用哪一句都可以。)
(3)中途易辙
一句话说了一半,忽然另起炉灶,重来一句。
例如:
①杜重远以《闲话***》这篇文章,认为是冒犯了日本皇帝,置之于狱,就是例子。(应该改作“因为杜重远写了……文章,就认为他是……”。原句使不知道这件事始末的人误认为杜重远把别人送进监牢,非常不妥。)
②中国人民自从接受了马列主义思想之后,中国的革命就在***同志领导下大大改了样子。(“中国人民……马列主义思想之后”就怎么样?作者不接下去说,却用“中国革命”另起一句。应该改为“自从中国人民……之后”。)
(4)反客为主
是指把上半句主语以外的成分用来做下半句的主语,因此而纠缠。
例如:
①因此,当匪徒们偷袭游击队的时候,被游击队反包围,歼灭了无数匪军。(“被游击队反包围”的主语是“匪军”,但“歼灭了无数匪军”的主语只能是游击队,作者却把它一气呵成,不加交待。应该把末一分句该作“歼灭了一大部分”或“不计其数”;这样“歼灭”是接着“被游击队”下来的,就连贯了。)
②分子的阴谋活动是应当加以揭露,而且能够把它揭露的。(就上半句说,谁“加以揭露”,当然是“我们”,但这个词隐而未现,正式主语应当是受揭露的“分子的阴谋活动”。可是下半句的“能够把它揭露的”主语就不可能换“;分子的阴谋活动”,而只能是“我们”。这一句应该在“是应当”前加“我们”。)
(5)结构含混
这样的句子可以有两种看法。
例如:
***真事的创作方法,近几年来曾提倡过,而且产生了许多***人真事的作品。(句中的“产生”可以算无主句,也可以拿“创作方法”做主语,作者的意思也许是第一种,那么上半句应该改作“近几年来曾倡导过***真事的创作方法”。)
5 表意不明
(1)指代不明
例如:
有人主张接受,有人反对,他同意这种主张。(“这种主张”指代不明)
(2)有歧义
例如:
①他请几个营的干部参加座谈会。(“几个”修饰“营”还是“干部”?)
②在休***的这段时间里,我们的体重逐日增加,最高的达五公斤。(很可能使人误会是逐日增加的量最高有五公斤,这当然不是事实,应把“逐日”改为“都有”。)
③现全渠已勘测完毕144华里。(没说全渠有多长,如果全长144华里,那么144华里只是全渠的一部分,那么不能说“完毕”,该说“现全渠已勘测了144华里”。)
④ 介绍菲律宾的一种权威著作。(可以解释为“介绍--菲律宾的一种权威著作”,也可以解释为“介绍菲律宾的--一种权威著作”。如果作者意思是后者,就不如把“一种”提到头上。)
6 不合逻辑
这里的“不合逻辑”指的是句子的意思在事理上讲不过去。例如:“学习有态度与方法之分”。这句话形式上跟“生物有动物、植物和微生物之分”是一样的,但“动物、植物和微生物”加起来等于“生物”,而“态度”和“方法”加起来不等于“学习”,所以这句话就是“不合逻辑”。
下面是一些逻辑上有问题的类型:
(1)自相矛盾
例如:
①他是多少个死难者中幸免的一个。(既然“幸免”,自然是没有死,怎么能说是“死难者中的一个”呢?应改为“多少人死难了,他是幸免的一个。”)
②这增强了中国人民与侵略者斗争的无比力量。(既然已经“无比”,如何还能“增强”?应删去“无比”。)
(2)范围不清
例如:
①从事业的发展上看,还缺乏各项科学专家与各项人才。(各项人才包括科学家,不宜并列,该说“各学科的专家与其他人才”。)
②他们一面拼命的往上爬,一面又不免跌落深渊。(“一面……一面……”表示两件事同时进行,句中的两件事显然不是同时的,应改为“他们虽然拼命的向上爬,但是终于不免跌落深渊。”)
(3)强加因果
例如:
①最近我这位朋友去了一趟南方回来,结果他的思想依然如故。(去了南方回来思想变了,可以说是去了一趟南方的结果,现在“思想依然如故”,怎么能说是去了一趟南方的“结果”呢?)
②因为他来自北方,思想根本上还是旧的一套。(为什么来自“北方”思想就旧?且“北方”到底是相对什么而言的?)
(4)主客倒置
例如:
①在那个时候,报纸与我接触的机会是很少的。(应该是“我和报纸的接触”。)
②去年的学习情绪和今年比较起来大不相同。(我们比较一先一后两件事,一般总是以后者为主体,应是“今年的学习成绩和去年……”。)
参考资料
从结构上分,句子可以分为单句和复句。
单句由一个短语或一个词构成,复句由两个或两个以上的分句(取消了独立性的单句)构成。我们一般所说的“句子”,指的是“单句”。
单句又可以分为主谓句和非主谓句。
如“明天晴天。”“这里风景优美。”“他来了。”是主谓句。
“好!”“严禁吸烟。”是非主谓句。
2.从语气上分,句子可以分为陈述句、疑问句、祈使句和感叹句。 例如:
A.理想是前进的灯塔。(陈述句)
B.你上哪儿?(疑问句)
C.请勿吸烟!(祈使句)
D.多么可爱的秋色啊!(感叹句)
从结构上对句子划分得出的类型叫句型,从语气上对句子的划分得出的类型叫句类。句型和句类是对句子作不同角度的划分得出的类型,因此,一个句子总是兼属这两种性质不同的类型。例如:
A.理想是前进的灯塔。(主谓句、陈述句)
B.你上哪儿?(主谓句、疑问句)
C.请勿吸烟!(非主谓句、祈使句)
D.多么可爱的秋色啊!(非主谓句、感叹句)
E.你真了不起!(主谓句、感叹句)
三、单句句型
单句可以分为主谓句和非主谓句。
(一)主谓句
由主谓结构构成的句子叫主谓句。
1.名词性谓语句
由名词性词语充当谓语的句子叫名词性谓语句。名词单独充当谓语的情况较少,较多的情况是名词性偏正结构。例如:
A.今天阴天。 B.明天中秋。
C.鲁迅浙江人。 D.赣,江西省的简称。
E.猪肉两斤半。 F.他两个儿子。
G.这部***去年出版的。 H.他圆圆的脸,大大的眼睛。
I.老李好眼力。
2.动词性谓语句
由动词性词语充当谓语的句子叫动词性谓语句。例如:
A.他去了吗?(单个动词作谓语)
B.我喜欢这绚丽的秋色。(动宾结构作谓语)
C.她急忙告诉我去月亮湖就在这里上岸。(双宾结构作谓语)
D.他讲得很清楚。(动补结构作谓语)
E.水生昨天从北京出发。(动词性偏正结构作谓语)
3.形容词性谓语句
由形容词性词语充当谓语的句子叫形容词性谓语句。例如:
A.冬天冷,夏天热。 B.这声音清脆、响亮。
C.小伙子壮壮实实的。 D.地里的小麦绿油油的。
E.他的学习成绩很好。 F.时机和条件都已成熟。
G.老李高兴得合不上嘴。
4.主谓谓语句
由主谓结构充当谓语的句子叫主谓谓语句。例如:
A.他一个字都不会写。 B.我什么苦都吃过。
C.中国人死都不怕。 D.整个晚上眼都没眨一下。
E.我们上海也去过。 F.这个困难,我们一定能克服。
G.北京我没有去过。 H.这种专业,报考的人不多。
I.你那种说法,我认为有些片面。 J.鲁迅的文章,我读过很多。
K.庐山风景秀丽。 L.这部**,女主角是刘小庆。
M.他态度和谒。 N.孩子们心早就飞到动物园了。
O.甲班五个人一间住房。 P.他的孩子,一个胜过一个。
Q.他们谁也不理谁。 R.这个问题,我们一定要***取积极的态度。
S.新兴的边缘科学,他的兴趣十分浓厚。
T.田间管理,他的经验很丰富。 U.这次比赛,你得的分最高。
5. 主谓句中的省略句
A.去北京。(省略句,省去了主语“我”)
B.说吧!(省略句,省去了主语“你”)
(二)非主谓语句(无主句)
非主谓句是由单个的词或主谓结构以外的其他结构构成的句子。可分为名词性的、动词性的和形容词性的三种。
1.名词性的非主谓语句,如:
A.王老师!(称呼)
B.春天。大龙须沟。(背景说明)
C.票!(表示祈使)
D.多美的风光!(赞叹)
E.一声汽笛。(表示事物的呈现)
2.动词性的非主谓语句,如:
A.出太阳了。(说明自然现象)
B.有人找你。(说明出现的情况)
C.祝你生日快乐!(表示祝愿)
D.严禁攀折花木。(表示禁止)
E.多谢!(表示恭敬)
3.形容词性的非主谓语句,如:
A.好极了!(表示评价)
B.多美呀!(表示感叹)
C.好吧!(表示同意)
4.叹词、象声词也可以构成非主谓句,如
“唉!”“哎哟!”“哗”“轰!”。
注意:省略句不是非主谓句。省略句是由于语言环境(包括上下文)的帮助而省略了某些成分;省略的成分是确定的,如果要补出来,可以准确地补上。而非主谓句本身是完整的,不需要添上任何成分去理解。例如:
A.严禁吸烟!(非主谓句,本身是完整的,不需要添上主语去理解。即使要添上主语,也无法准确地补出。)
B.别抽烟。(省略句,可以准确地补上主语“你”)
C.出太阳了!(非主谓句,句意本身是完整的,不需要添加什么成分)
D.好大的胆子!(同上)
四、单句的成分
为了简化关于句法成分的内容,通常只提主语、谓语、宾语、定语、状语和补语。这六种句法成分,在词组里是词组成分,在句子里是句子成分。
(一)主语
1.主语的类型
主语表示陈述的对象,能回答“谁”或“什么”之类的问题。从语义关系上看,主语可以是动作的施事、受事、工具、范围、时间、处所等。例如:
他吃了西瓜(施事) 西瓜被他吃掉了(受事)
那个筐子啊,只能装***(工具) ***访工作,他的经验很丰富(范围)
以前发生过这样的事(时间) 墙上挂着一幅画(处所)
从构成材料上看,主语可以由名词性词语充当,也可以由动词性词语充当。
①最常见的是名词性词语(特别是名词)充当主语。例如:
A.老师马上就到 B.中国人民有自己的民族自尊心和自豪感
C.我借来一台录音机 D.三个人坐一条凳
E.九是三的三倍 F.一斤等于十两
②
其次是动词性词语作主语,其谓语一般是形容词,或是由“是”“使”等非动作性动词构成的词组。例如:
A.说说容易,做起来就难了 B.开车不容易
C.干净最重要 D.坚持说英语很有必要
E.谦逊是一种美德 F.虚心使人进步,骄傲使人落后。
③ 时间主语和处所主语
时间名词、处所名词跟一般人物名词(包括代名词,下同)一样,也可作主语。如:
A.小王去了深圳(人物名词作主语)
B.昨天来了一位新老师(时间名词作主语)
C.屋里能住十个人(处所名词作主语)
(二)谓语
谓语和主语是相对的,是用来陈述主语的,能回答“怎么样”或“是什么”之类的问题。从构成材料上看,谓语有动词性的,也有形容词性的。最常见的是动词性词语充当谓语。例如:
A.会议开始了(动词谓语) B.***作报告(动词谓语)
C.秋收即将结束(动词谓语) D.我们把敌人打得落花流水(动词谓语)
E.大伙儿坐在台前看表演(连动谓语) F.我们选他当代表(兼语谓语)
G.这酒劲儿大 (形容词谓语) H.北方干燥,南方潮湿(形容词谓语)
名词、数词、量词、一部分代词以及以名词为中心的偏正词组充当谓语,并且一般是肯定形式。例如:
A.他广东人 B.这间屋子三扇门
C.今天星期三 D.他厚脸皮
E.那个战士挺高的个儿 F.每人刚好两本
G.他才二十岁 H.这间屋子就三扇门
(三)宾语
1.宾语的类型
宾语是谓语动词的支配成分,能够回答“谁/什么”之类的问题。表示动作行为的受事、施事对象、结果、处所、工具等。宾语是动词性成分后边表示人物或***的成分,能够回答“谁/什么”之类的问题。宾语与动词性成分相对待。从语义上看,宾语可以是动作的受事、施事、工具、处所、结果等。例如:
A.他读英语 (受事)
B.我家里来了客人 (施事)
C.他写毛笔 (工具)
D.我住四楼 (处所)
E.巴斯卡(Blaise Pascal)发明计算机 (结果)
一个及物动词可以带各种各样的宾语,如“打球”的“打”,就可以有:“打篮球、打半尝打联防、打主攻手、打时间差、打短平快、打奥运会、打北京队、打决赛、打世界冠军”等等,其中好些宾语很难叫个什么名目。
A.喜欢英语 喜欢学英语
B.爱书 爱热闹
C.担心他 担心出事
D.研究方案 研究怎样安排工作
E.赞成他的做法 赞成去黄山春游
F.开始新的生活 开始上课
2.双宾语
双宾语指的是一个谓语带两个宾语,这两个宾语分别叫直接宾语(近宾语)和间接宾语(远宾语),双宾语由直接宾语和间接宾语组成。
双宾语一般是前一个指人,叫近宾语,后一个指事物,叫远宾语。如“她教我们数学”“我们”是近宾语,“数学”是远宾语。能带双宾语的动词如“问、教、欠、还、交、租、给、送、赠、输、赔、奖、告诉、请教、称、骂、托”等。
①他给我一支笔。
②那位老人昨天给我们讲了一个故事。
③他发放店员一些钱。
④我送她一束花。
⑤小王告诉我们,火车明天上午九点开出。
巩固练习:
判断下列句子是否是特殊的双宾句。
①我借了图书馆两本书。 ( )
②我要了他一张纸。 ( )
③会计收了我30元钱。 ( )
④老李租了旅馆一间房子。 ( )
判断方法:看近宾语是不是远宾语的定语,是定语就不是双宾语,反之就是双宾语。
(四)补语
补语是动词性词语后边起补充说明作用的成分,表示“怎么样”或“多久”等意思,或者表示程度,常常由“得”引出。
1.补语的类型
从语义上看,补语可以是动词性成分的结果、趋向、情态、数量等。
(1)结果补语
听得<清楚> 听<不清楚> 喝得<醉> 喝<不醉>
写得<完> 写<不完> 看得<懂> 看<不懂>
(2)趋向补语
送得<去> 送<不去> 传得<过去> 传<不过去>
爬<上>山<去> 跑<下>楼<来> 放<回>动物园<去>
拿<出>一支钢笔<来> 拿<出来>一支钢笔 拿一支钢笔<出来>
注意:“起来”“下去”用在谓词后面,有时不表示趋向,而分别表示动作或状态的开始或继续。例如:
打<起来> 说<下去> 冷<起来> 胖<起来> 冷<下去> 瘦<下去>
(3)情态补语
说得<好> 说得<很好> 说得<不好>
累得爬<不起来>了 洗得<干干净净> 弄得<到处是水>
这项工作做得<很好> 你有经验,这项工作你一定做得<好>
(4)数量补语
表示动作的量,由动量结构和时量结构充当,分别称为动量补语和时量补语。例如:
看<一遍> 去<一趟> 打<一拳> 砍<一刀>
成立了<两年> 等了<老半天> 那件衣服在外边晒了<两天>。
我来到天津<八个月>了。
(5)程度补语
在谓语(主要是形容词和表示心理活动的动词)的后面表示程度,可分为两类:
A.不带“得”的,一般由“极、透、多、死”等词充当,后面必须带上“了”:
好<极>了 糟<透>了 好<多了 讨厌<死>了 恨<死>了
B.带“得”的,一般由“很、多、慌、厉害、要命、要死、不行、不得了、了不得”等词语充当。例如:
乱得<很> 懒得<多> 闷得<慌> 疼得<厉害> 痒得<要命>怕得<要死>
困得<不行> 忙得<不得了> 高兴得<不得了>
另外,动词可以同“得来”“不来”“得了”“不了”“得”或“不得”组成补充结构。例如:
合得<来>合<不来>解决得<了> 解决<不了> 去<得> 去<不得>
2.数量结构充当补语与充当宾语的区别
数量结构既可作补语又可作宾语,其区别是:
表物量的是宾语,表动量的是补语,表时量的既可以是宾语也可是补语,但表时点的是宾语,表时段的是补语。
①看了他一眼(“一眼”作 语,语义上指向“看”)
②井挖了三眼(“三眼”作 语,语义上指向“井”)
③新书买了五本(“五本”作 语,语义上指向“新书”)
④新书买了两次(“两次”作 语,语义上指向“买”)
⑤到八时才下班(“八时”是时点,作 语)
⑥等了八小时才来(“八小时”是时段,作 语)
⑦工作到半夜才下班(这里的“半夜”指***,是时点,作 语)
⑧工作了半夜(这里的“半夜”是“半个夜晚”的意思,是时段,作 语)
(五)定语
定语是用来修饰、限定、说明名词或代词的品质与特征的。定语用在主语或宾语前,常带“的”,表示“谁(的)”“什么样(的)”“多少”等意思。与定语相对的成分是定语中心语。定语对中心语的修饰大致有四种情况:
第一,对中心语进行限定,一般可称为“限制性定语”。 例如:
(三好)学生 (科学)画报 (你今年订)的杂志 (人)的喊叫
第二,对中心语加以描述,一般称为“描述性定语”。 例如:
(多么幸福)的家庭 (紫红色)的裙子 (雷厉风行)的人 (高尚)的情操 (平平常常)的事情
第三,表示领属关系,可以称为“领属定语。 例如:
(他)的钢笔 (我)爸爸 (图书馆)的书 (老李)的房子
第四,定语与中心语的语义关系比较特殊。 例如:
(他)的字写得不错。 (比尔)的汉语说得很流利。
他没有帮过(我们)的忙。 别开(老李的玩笑。
附:多项定语的排列顺序:
多层定语之间一般按照与中心语关系的密切程度排列顺序,关系越密切的定语越靠近中心语。多层定语从远到近的顺序一般是:
①表领属关系(谁的)
②表示时间、处所(什么时候、什么地方)
③指示代词或数量短语 (多少、哪一个)
④动词、动词性短语(表示怎样的)
⑤形容词、形容词性短语 (什么样的)
⑥表性质的名词 (什么)
▲口诀:领时代数动形名
但不能完全机械地套用,要根据语境随时调整。
▲下列多项定语打乱了顺序,请你给其恢复原位,正确的顺序是:
①新分配来的 ②中文系 ③女 ④戴眼镜的 ⑤那位
1. ②⑤①④③ 老师
①蓝呢子 ②那件 ③他姐姐 ④去年买的
2. ③②④① 或 ③④②① 大衣
①昨天上午 ②我 ③从北京寄来的 ④两封 ⑤收到的
3. ②①⑤③④ 感谢信
①那几个 ②门口 ③穿黑色西装的
4. ②①③ 学生
①光荣的 ②这几名 ③师部 ④参加过抗美援朝的
5. ③②④① 老战士
①优秀的 ②有二十多年教学经验的 ③一位 ④国家队 ⑤女 ⑥篮球
6. ④③②①⑥⑤ 教练
(六)状语
状语附加在谓语中心语的前面,是动词或形容词前面的连带成分,用来修饰、限制动词或形容词,表示动作的状态、方式、时间、处所、条件、对象、肯定、否定、范围、程度或语气等。例如:
①他(已经)走了。 (时间)
②咱们(北京)见。 (处所)
③歌声(把王老师)带入深沉的回忆。 (对象)
④科学〔终于以伟大的不可抑制的力量〕战胜了神权。 (方式)
⑤连长〔眉梢带笑地〕介绍说 (情态)
⑥***〔非常〕喜欢彭雪枫将军。 (程度)
⑦《最炫民族风》〔全都〕是我们童年曾经看过的动画片! (范围)
⑧“红楼追'梦'人”〔对《红楼梦》〕已经走火入魔了。 (对象)
⑨台湾宝岛〔一定〕会回到祖国的怀抱。 (肯定)
⑩贾宝玉为何〔偏偏〕喜欢林黛玉。 (语气)
附:多项状语的排列顺序:
总的说来,多项状语的排列顺序要比多项定语的灵活得多。我们只能总结出一个大概的次序:
①表时间的介词短语
②表目的或原因的介词短语
③表处所的介词短语
④表语气的介词短语(副词)
⑤表情态的词
⑥表对象的介词短语一般紧挨在中心词前
到底 昨天 同领导 在办公室里 为了小李 认真地 又
昨天到底为了小李在办公室里又认真地同领导 谈了一次。
五、现代汉语句子的特殊结构
(一)连动句(具体参见前面连动短语)
连动短语由两个或两个以上的动词性词语或动词性词语和形容词性词语、或动词性词语和主谓短语连用,几个词语之间没有语意停顿或关联词语,特点是连用的两个谓词共用一个主语。
连动短语的结构常见的有几种:
第一是动词性词语连用。
①水生指着父亲的小房叫她小声一些。”
②张老师皱起眉头思索着。
第二是动词性词语和形容词性词语连用。
①我读了你的来信十分高兴。
②阿Q听到了很羡慕。
第三是动词和主谓短语连用。
③白茹笑着头一歪。
第四是主谓短语和动词性词语连用。
④他嘴笨不会说话。”
(二)兼语句(具体参见前面兼语短语)
兼语句是由兼语短语充当谓语或独立成句的句子。兼语句特点
第一、兼语句的谓语是由动宾短语套接主谓短语构成的,动宾短语的宾语兼做主谓短语的主语。
第二、兼语句多有使令的意思,所以句中前一个谓语多由使令动词充当。常见的使令动词有:“使”、“让”、“叫”、“派”、“命令”、“吩咐”、“禁止”、“请求”、“选举”、“教”、“劝”、“号召”等。此外,前一个谓语也可以是“有”字。
第三、兼语句中兼语的谓语(第二动词)是前边动作所要达到的目的或产生的结果,即兼语前后两个动词在语意上有一定联系。
①战士们迫使敌人放下武器。
②我们选他当班长。
③屋里有人在说话。
④她给女儿起了个名字叫莎莎。
⑤我嫌这件衣服太花哨。
⑥我感谢你告诉我一个好信息。
⑦谢谢你帮我修好了自行车。
句子成分歌诀
基本成分主谓宾,连带成分定状补。定语必居主宾前,谓前为状谓后补。
前置状语目时地,意义不变能复位。补语只能说前谓,定语才和后宾配。
介宾短语多状补,不能充当宾主谓。的定地状得是补,语言标志定是非。
一般完整的句子成分的排列顺序为:
〔状语〕, (定语) 主语 ︱〔状语〕 谓语 〈补语〉 (定语) 宾语
〔目的处所时间〕〔修饰主语〕 〔修饰谓语〕 〔补说谓语〕 〔修饰宾语〕
六种病句类型 1.语序不当
语序不当有多种情况,产生的原因也不同.下面列举几种常见的情况:
(1)定语位置不当
①定语和中心语位置不当
例如:玛丽安在路边的碎石堆里偶然发现了几个形状奇特的化石牙齿,兴奋异常,却始终认不出那是属于什么动物的.
句中定语中心语“化石”和定语“牙齿”的位置颠倒了,应改为“牙齿化石”. ②定语误放到状语的位置
例如:请柬的封套上古色古香地印着青铜器,上面整齐地排列着身披铠甲、手持盾牌的秦军战士.
“古色古香”不应修饰“印着”,应改为“印着古色古香的青铜器”. ③多项定语次序不当
多项定语的一般语序是:a.领属性定语,时间、处所定语;b.表指称数量的短语;c.动词或动词性短语;d.形容词或形容词性短语;e.名词或名词性短语.另外应当注意,带“的”的定语应放在不带“的”的定语之前.如:花园里(领属性的)那(指示代词)几朵(数量词)盛开的(动词)美丽的(形容词)红色(形容词)玫瑰花(名词)被人摘走了.
如果违反多项定语语序的一般规律,就会造成定语语序不当的错误. 例如:博物馆展出了宋朝时期新出土的一艘古船.
句中定语排列不当,“古船”前的三个定语正确顺序为“一艘”“新出土的”“宋朝时期的”,否则会产生歧义. (2)状语位置不当
①状语放在定语的位置
例如:“微山湖”号护卫舰迅速地在索马里海域***取行动,吓退了海盗;保护了被海盗追踪的商船.
“迅速地”作状语应放在谓语动词“***取”之前.
②多项状语语序不当
多项状语的一般语序是:a.表目的、原因或条件的介宾短语;b.表时间、处所的词或短语;c.表范围程度的短语;d.表情感的词或短语.另外,表对象的介宾短语一般紧挨在中心语前. 即:为了什么(表目的)→何时(表时间的名词)→何地(表处所的介宾短语)→范围(表范围程度的副词)→怎样(表情态的形容词)→同谁(表对象的介宾短语).
例如:许多教师今天早上(表时间)在会议室里(表处所)都(表范围)热情地(表情态)同他(表对象)交谈.
如果违反多项状语语序的一般规律,就会造成状语语序不当的错误.
例如:居里夫人艰辛地在简陋的工作室里经过漫长的研究,后来在那里发现了镭. 表处所的状语“在简陋的工作室里”和表时间的形容词“漫长”,应放在表情态的状语“艰辛”前面,改为“居里夫人在简陋的工作室里经过漫长的艰辛地研究”.
(3)词序不当
词序不当,指的是相关联的并列词语或短语顺序不当、虚词(关联词)位置不当等.
例如:地震发生后,困难和危险尽管很多,战士们仍然迅速及时地进入震区抢险救灾.
“尽管”的位置不当,应改为“尽管困难和危险……”. (4)分句位置不当
例 如:诚信教育已成为我国公民道德建设的重要内容,因为不仅诚信关系到国家的整体形象,而且体现了公民的基本道德素质.
后半部分两个分句为递进关系,且应先“公民”后“国家”.应改为“因为诚信不仅体现了公民的……,而且关系到国家的……”. 2.搭配不当
(1)主谓搭配不当
主要表现为谓语不能陈述主语,有时主语或谓语由联合短语充当,其中一部分不搭配.
例如:由于加强了生产过程中的生态环境监控,该基地每年的无公害蔬菜的生产量,除供应本省主要市场外,还销往河 南、河北等省.
“生产量”不能“供应”,能“供应”的应该是“无公害蔬菜”. (2)动宾搭配不当
动词和宾语要在意思上和语法上搭配,常见错误是:当由两个并列关系的动词共带一个宾语时,其中一个动词与宾语不搭配.
例如:根据意大利法律规定,贝卢斯科尼在总理任期内不能担任俱乐部***,否则他就有可能做有违公众利益的行为.
“做……行为”搭配不当,应改为“出现……的行为”. (3)主宾搭配不当
例如:五一路乒乓球馆是经体育局和民政局批准的专门推广乒乓球运动的团体.
主语“乒乓球馆”和宾语“团体”搭配不当,可把“团体”改成“机构”或者“单位”.
(4)附加成分与中心语搭配不当
例如:在翻阅中国话剧100周年纪念活动资料时,他萌生了创作一台寻找中国话剧源头的剧本的意念.
句中“一台”不能修饰“剧本”,应将“一台”改为“一个(部)”,或保留“一台”,将“剧本”改为“话剧”. (5)关联词语搭配不当
例如:人们认为,团队有效性的关键因素不只是个体贡献的简单相加,而是能使队员行动一致、互相配合的团队协作技能.
“不只是”不能与“而是”搭配,应把“不只是”改为“不是”,或把“而是”改为“而且是”. 3.成分残缺或赘余
(1)成分残缺
①主语残缺
例如:由于环境污染,常继发厌氧细菌的严重感染,极易发生破伤风,致使在当地或运送外地途中救治不及而死亡.
介词“由于”滥用导致主语残缺.
②谓语残缺
因句子较长,说(或写)到后面忘记前面的结构而致使句子缺谓语,是谓语残缺的主要原因. 例如:发射试验通讯卫星取得圆满成功,表明我国已经独立自主、自力更生地建成、研制、发射、跟踪、测控和试验地球同步通讯卫星工程体系的能力.
应该在“独立”前加“具备”,“具备……的能力”.
③宾语残缺
句子稍长,说(或写)到后面忽略了与前面成分的呼应,是造成句子宾语残缺的重要原因.近几年高考试题中出现的常是宾语中心语残缺. 例如:他潜心研究,反复试验,终于成功开发了具有预防及治疗胃肠病的药粥系列产品.
“具有”缺宾语中心语,在“胃肠病”后加“功用”.
④附加成分残缺
缺少必要的附加成分就会造成句子表意不严密等情况.
例如:要想取得优异成绩,必须付出劳动.
此例中“付出劳动”不一定就能“取得优异成绩”,应在“劳动”前加“艰苦且有效的”之类的限制语. ⑤介词残缺
例如:联合国设立“国际家庭日”的目的,是为了促进各国***和民众更加关注家庭问题,提高家庭问题的警觉性,促进家庭的和睦与幸福.
句中“提高家庭问题的警觉性”应改为“提高对家庭问题的警觉性”. (2)成分赘余
①主语多余
例如:我们的革命前辈,为了人民的利益,他们流了多少血,献出了多少宝贵的生命.
前边有了主语“革命前辈”,因而“他们”多余.
②谓语多余
例如:同学们正在努力复习,迎接高考到来.
“迎接”的是“高考”,而不是“到来”,故应删去“到来”. ③宾语多余
例如:市***决定配合奥运项目的实施,重点抓好地铁建设、危旧房改造、污水处理等工程工作,加快现代化大都市建设的进程.
“工作”多余,与“工程”重复.
④附加成分多余
例如:为精简字数,不得不略加删改一些.
“一些”与前“略加”重复,可以删掉一个. 试卷中常见的赘余的例子有:
(1)互相厮打 “厮”已含有“互相”的意思,应删去“互相”.
(2)这其中、这其间 “其”即“这”,应删去“这”.
(3)见诸于、付诸于 “诸”是文言中的一个兼词,是“之于”的合音,应删去“于”.
(4)亲眼目睹 “目睹”即“亲眼看到”,故应删去“亲眼”.
(5)共同协商 “协”意思是“共同合作”,因此,应删去“共同”. (6)非常嗜好 “嗜好”即“极度爱好”,故应删去“非常”.
(7)过度酗酒 “酗”已包含“无节制”之意,应删去“过度”.
(8)一致公认 “公”即“共同的”,“一致”意思为“相同无分歧”,两者重复,应删去“一致”.
(9)前来光顾 “顾”就是“到来”的意思,应删去“前来”.
(10)开始启动 “启动”指(仪器仪表等)开始工作,所以不必再用“开始”修饰. (11)无故旷课 “旷课”即“ 无故缺课”,再以“无故”限制,实属多余.类似的还有“多余的废话”.
(12)热切渴望 “渴望”就是“迫切地希望”,应删去“热切”.
(13)悬殊很大 “悬殊”即“相差很大”,故应删去“很大”.
(14)多年的夙愿 “夙”的意思是“一向有的,旧有的”,应删去“多年的”.[来源:学.科.网]
(15)无数莘莘学子 “莘莘”即“众多”,用“无数”修饰多余,应删去“无数”. (16)可堪称 “堪”已有“可以,能够”之意,应删去“可”.
(17)致信给 “致”已有“给”之意,应删去“给”.
(18)使人民生灵涂炭 “生灵涂炭”的意思是使百姓陷入泥沼,形容人民处于极端困苦的境地.已含“使人民”的意思,故删去“使人民”.
(19)留下的遗毒 “遗毒”中的“遗”已有“留下”之意,连用累赘.
(20)至少……以上 “至少”含有“最低”的意思,后面搭配的应是确数,无须再用模糊语“以上”. (21)万一若 “万一”表示可能性极小的***设,与“若”重复.
(22)切忌不要贪睡 “切忌”“不要”均表示否定,同时修饰“贪睡”不当,删去其中一个.
(23)涉及到 “涉及”中的“及”就是“到”的意思,删去“到”.
(24)被……所接受 文言句式“为……所……”即相当于现代汉语中的“被”.句中用了“被”字后,再用“所”字,多余. (25)年轻的小伙子 “小伙子”岂不是年轻人?用“年轻”修饰“小伙子”,纯属多此一举.
(26)并非是 “非”是书面色彩较浓的一个词,是“不是”的意思,因此,其后不必再加“是”.
(27)从心里由衷感谢 “由衷”就是“从心里”,故该词累赘.
(28)全身遍体鳞伤 “遍体”与“全身”重复.
(29)将近40%以上“将近”与“以上”两个模糊量词矛盾,保留一个即可. (30)囊括全部 “ 囊括”已含“全部”的意思.
(31)先进楷模 “楷模”本身就是“先进的”,故删去“先进”.
(32)突然恍然大悟 “恍然”指“突然清醒的样子”,故应删去“突然”.
(33)这个中原因 “个中”的意思是“这其中”,已含“这”,故应删去“这”. 4.结构混乱
(1)句式杂糅
句式杂糅是把两句话挤到一句话里,该结束的地方不结束,前后交叉错叠,句子结构混乱,形成病句.这一种病句类型已经成为近两年病句考查的热点.
例如:在技术革新中,公司组织有关人员围绕以提高产品质量为中心,对工艺设计、设备保养等部门进行了整顿. 句中“围绕提高产品质量”和“以提高产品质量为中心”表达的意思相同,却硬要组织在一起,从而造成句式杂糅.***用其中的一种说法即可.
下面列举几种常见的杂糅格式(括号内为正确形式):
①本着……为原则(本着……原则,以……为原则)
②是为了……为目的的(是为了……,以……为目的的)
③对于……问题上(对于……问题,在… …问题上)
④由于……下(由于……,在……下)
⑤原因是……造成的(原因是……,是由……造成的)
⑥经过……下(经过……,在……下) ⑦借口……为名(借口是……,以……为名)
⑧因为……的原因(因为……,是……的原因)
⑨靠的是……取得的(靠的是……,是靠……取得的)
⑩大多以……为主(大多是……,以……为主)
成分是……配制而成的(成分是……,由……配置而成的) 是由于……的结果(是由于……,是……的结果)(2)藕断丝连
结构完整的一句话的最后一部分用作另一句话的开头硬凑起来. 例如:你可知道,要出版一本译作是要经过多少人的努力以后,才能与读者见面的.
把“要出版……的努力”和“一本译作……见面的”凑在一块儿,用哪一句都可以.
(3)中途易辙
一句话说了一半,忽然另起炉灶,重来一句.
例如:中国人民自从接受了马列主义思想之后,中国的革命就在***同志领导下大大改了样子.
“中国人民……马列主义思想之后”就怎么样?作者不接下去说,却用“中国的革命”另起一句.应该改为“自从中国人民……之后”. 5.表意不明
(1)指代不明
例如:从第一回合枪击至此,总共不到15秒钟,人质中竟无一人受伤——这原本是不可能发生的事.
“这”指代不明确,究竟是指“枪击时间短”呢,还是指“无一人受伤”?
(2)歧义
例如:今年4月23日,全国几十个报社的编辑记者来到国家图书馆,参观展览,聆听讲座,度过了一个很有意义的“世界阅读日”.
“几十个”是指“报社”还是“编辑记者”有歧义. 6.不合逻辑
(1)概念混乱
互相并列的概念,应该是按同一标准划分的种概念,如果标准混乱,就会造成属(大)种(小)概念并列的错误.
例如:中华人民共和国公民在年老、疾病或者丧失劳动能力的情况下,有从国家和社会获得物质帮助的权利.
“年老”“疾病”与“丧失劳动能力”在概念上有交叉,不是并列关系,应在“丧失”前加“其他”,或者改“或者”为“等”. (2)两面对一面
一个句子中,前面包含正反两方面,后面只包含一个方面,句子前后不照应.(有时将其归入“搭配不当”)
例如:在交融与冲突并存的文化环境中,能否用东方雕塑语言来表达个性精神,恰恰是中国当代雕塑所欠缺的.
两面与一面,照应不当,去掉“能否”. (3)自相矛盾
同一个句子,应该保持语意逻辑前后的一致性;否则,就会自相矛盾. [来源:Z.xx.k***]
例如:他是多少个死难者中幸免的一个.
句中的“死难者”与“幸免的一个”前后矛盾. (4)主客颠倒
句子表述的对象有主客之分、主动者与被动者之分.有时表达不好,就会出现颠倒的现象.
例如:***战争以来的中国近代史,对于大多数中学生是比较熟悉的,重大的历史***都能说得一清二楚.
这个例句犯了主客颠倒的毛病,应该主对宾、人对物.正确的说法应为“大多数中学生对于***战争以来的中国近代史是比较熟悉的”. (5)否定失当
指为了增强表达效果,多次运用否定,结果将本意弄反了.导致此类语病的原因有两个:一是误用了否定副词,二是不理解反问句本身就表示了一重否定.
例如:一名韩国官员透露,有关成员国已达成一致意见,同意建立该项基金,以防止19***年那样的金融危机不要再次发生.
“防止……不要再次发生”否定不当,去掉“不要”. 又如:雷锋精神当然要赋予它新的内涵,但谁又能否认现在就不需要学习雷锋了呢?
反问句本身就是一重否定,再加上“否认”和“不”,意思成了否定学习雷锋.
(6)强加因果
复句中分句间总离不开某种关系,而这种关系的外在表现形式就是关联词的使用.在一些句子中,作者没有弄清分句中是否存在因果关系,就强加于句子,形成病句.
例如:由于我对学科有偏重,因而对数学不感兴趣.
例句中“对数学不感兴趣”是“对学科有偏重”的具体表现而非结果. (7)不合事理
指语句陈述的事实或表述的观点不符合生活的常理或人们普遍认同的事理.
例如:二百多救援战士,几千条胳膊,同暴雨洪水搏斗了一天一夜.
“二百多救援战士”怎么会有“几千条胳膊”?不合事理.
语序不当的类型:
1、多项定语次序不当
主语中心语、宾语中心语前若有多个定语,一般要按相关的语法要求排列,多项定语的排列顺序通常为:表领属或表时间、处所的词或短语;表指称或数量的词或短语;动词或动词性短语;形容词或形容词性短语;名词或名词性短语。可简化为:“属”“指(数)”“动”“形”“名”。
2、多项状语次序不当
多项状语排列顺序一般是:①表目的或原因的介宾短语;②表时间的名词或介宾短语;③表处所的名词或介宾短语;④表范围、程度或频率等的副词;⑤表情态的形容词或动词;⑥表对象的介宾短语。可简化为:“目(因)”“时”“处”“范(程、频)”“情”“对”。
3、定语、状语位置不当
也称“定语、状语错位”,通常包括两种情况:①定语误放在状语位置上,②状语误放在定语位置上。
4、虚词位置不当
虚词位置不当,主要是指副词和关联词的位置不当。
在复句中,如果两个分句的主语相同,那么主语应置于关联词之前;如果两个分句的主语不同,分句的主语应放在关联词之后。记忆技巧为:主语“同前异后”。
5、修饰语与中心语位置不当
修饰语与中心语位置不当,多指把两者互相弄反,或把修饰语误作中心语,或把中心语误作修饰语。
6、主客体颠倒
句子表述的对象有主客之分、主动被动之分。当句子中出现“为……所”“使”“对”“对于”等词时,往往会涉及主客的关系,此时要考虑主客***置是否存在颠倒的情况。若表达不好,会造成主客颠倒的错误。
7、并列词语或短语位置不当
在一个分句中有并列的词语或短语时,要注意其轻重、先后、大小的关系,要遵循一定的逻辑关系,否则容易造成位置不当的错误。
辨析时应重点注意以下技巧的应用:
①分析逻辑:认真分析并列词语之间的时间先后、空间距离、范围大小、程度轻重、情感流程、时局变化、数目常规、成绩名次、法定位置、对应承接等逻辑关系,看有无违反逻辑关系。
②倒序检查:对句中并列词语问题如一时无法判断,可将语序前后调换一下,如通顺,则说明原顺序有问题;反之,则无问题。因为组织并列词语时要按照一定的逻辑关系和语言习惯。
8、分句位置不当
复句一般由几个分句组成,各分句之间常有主次、轻重之分,存在因果、承接、递进关系等。如果颠倒了,就会造成分句间次序颠倒的错误。
例句
(1)她是我们学校的(表领属)一位(数量)有20多年教学经验的(动词短语)优秀的(形容词)数学(名词)女(名词)教师。
(2)我国(表领属)一座(数量)年产300万吨钢的(动词短语)大型(形容词短语)炼钢厂昨日开始上市。
(3)那位失主为表谢意(表目的)昨天(时间)在电视台(地点)又(副词)诚挚地(形容词)为他(表对象)点了一首歌。
(4)他为了记住这篇演讲稿(表目的),今天早晨(时间)在寝室里(地点)还(副词)仔细地(形容词)把它(表对象)看了一遍。
1. 引言
从50年代的机器翻译和人工智能研究算起,NLP(Natural
Langu***e Processing,自然语言处理)已有长达半个世纪的历史。 在
这个进程中,学术界曾提出许多重要的理论和方法,取得了丰富的成果
。笔者认为,近二十年在这一领域中堪称里程碑式的贡献有如下三个:
(1)复杂特征集和合一语法;(2)语言学研究中的词汇主义;( 3)
语料库方法和统计语言模型。这三个成果将继续对语言学、计算语言学
和NLP研究产生深远影响。为了更好地理解这些成果的意义, 先介绍与
此相关的两个事实。
2. 两个事实
2.1 事实之一——短语结构语法不能有效地描写自然语言
在自然语言处理中,为了识别一个输入句子的句法结构,首先要把
句子中的词一个一个地切分出来,然后去查词典,给句子中的每个词指
派一个合适的词性(part of speech);之后再用句法规则把句子里包
含的句法成分,如名词短语、动词短语、小句等,逐个地识别出来。进
而判断每个短语的句***能,如主语、谓语、宾语等,及其语义角色,
最终得到句子的意义表示,如逻辑语义表达式。这就是一个句法分析的
全过程。
本文要提到的第一个事实是:短语结构语法(Phrase Structure
Grammar,简称PSG)不能有效地描写自然语言。PSG在Chomsky语言学理
论中占有重要地位,并且在自然语言的句法描写中担当举足轻重的角色
。但是它有一些根本性的弱点,主要表现为,它使用的是像词类和短语
类那样的单一标记,因而不能有效地指明和解释自然语言中的结构歧义
问题。请看汉语中“V+N”组合。***如我们把“打击、委托、调查”等
词指派为动词(V);把“力度、方式、盗版、 甲方”等词视为名词(
N),并同意“打击力度”、“委托方式”是名词短语(NP), “打击
盗版”、“委托甲方”是动词短语(VP),那么就会产生如下两条有歧
义的句法规则:
(1)NP→VN
(2)VP→VN
换句话讲,当计算机观察到文本中相邻出现的“V+N”词类序列时,仍
不能确定它们组成的究竟是NP还是VP。我们把这样的歧义叫做“短语类
型歧义”。例如:
·该公司正在招聘〔销售V人员N〕NP。
·地球在不断〔改变V形状N〕VP。
下面再来看“N+V”的组合,也同样会产生带有短语类型歧义的规
则对,如:
(3)NP→NV 例:市场调查;政治影响。
(4)S→NV 例:价格攀升;局势稳定。
其中标记S代表小句。
不仅如此,有时当机器观察到相邻出现的“N+V”词类序列时,甚
至不能判断它们是不是在同一个短语中。也就是说,“N+V”词类序列
可能组成名词短语NP或小句S,也有可能根本就不在同一个短语里。 后
面这种歧义称为“短语边界歧义”。下面是两个相关的例句:
·中国的〔铁路N建设V〕NP发展很快。
·〔中国的铁路N〕NP建设V得很快。
前一个例句中,“铁路 建设”组成一个NP;而在后一个例句中,这两
个相邻的词却分属于两个不同的短语。 这足以说明, 基于单一标记的
PSG不能充分地描述自然语言中的句法歧义现象。 下面再看一些这样的
例子。
(5)NP→V N1 de N2
(6)VP→V N1 de N2
其中de代表结构助词“的”。例如,“〔削 苹果〕VP的刀”是NP;而
“削〔苹果 的 皮〕NP”则是VP。这里既有短语类型歧义,又有短语
边界歧义。比如,“削V苹果N”这两个相邻的词,可能构成一个
VP,也可能分处于两个相邻的短语中。
(7)NP→P N1 de N2
(8)PP→P N1 de N2
规则中P和PP分别表示介词和介词短语。例如,“〔对 上海〕PP 的印
象”是NP;而“对〔上海的 学生〕NP”则是PP。相邻词“对P上海N”
可能组成一个PP,也可能分处于两个短语中。
(9)NP→NumP N1 de N2
其中NumP表示数量短语。规则(9)虽然表示的是一个NP, 但可分别代
表两种结构意义:
(9a)NumP〔N1 de N2〕NP 如:五个〔公司的职员〕NP
(9b)〔NumP N1〕NP de N2 如:〔五个公司〕NP的职员
(10)NP→N1 N2 N3
规则(10)表示的也是一个NP,但“N1+N2”先结合,还是“N2+N3”
先结合,会出现两种不同的结构方式和意义,即:
(10a)〔N1 N2〕NP N3 如:〔现代 汉语〕NP词典
(10b)N1〔N2 N3〕NP 如:新版〔汉语词典〕NP
以上讨论的第一个事实说明:
·由于约束力不够,单一标记的PSG 规则不能充分消解短语类型和
短语边界的歧义。用数学的语言讲,PSG规则是必要的, 却不是充分的
。因此,机器仅仅根据规则右边的一个词类序列来判断它是不是一个短
语,或者是什么短语,都有某种不确定性。
·***用复杂特征集和词汇主义方法来重建自然语言的语法系统,是
近二十年来全球语言学界对此作出的最重要的努力。
2.2 事实之二——短语结构规则的覆盖有限
通过大规模语料的调查,人们发现一种语言的短语规则的分布符合
齐夫率(Zipf's Law)。Zipf是一个统计学家和语言学家。他提出,如
果对某个语言单位(不论是字母还是词)进行统计,把这个语言单位在
一个语料库里出现的频度(frequency)记作F,而且根据频度的降序对
每个单元指派一个整数的阶次(rank)R。结果发现R和F 的乘积近似为
一个常数。即
F[*]R≈const(常数)
或者说,被观察的语言单元的阶次R与其频度F成反比关系。在词频的统
计方面,齐夫律显示,不管被考察的语料仅仅是一本长篇***,还是一
个大规模的语料库,最常出现的100 个词的出现次数就会占到语料库总
词次数(tokens)的近一半。***如语料库的规模是100万词次, 那么其
中频度最高的100个词的累计出现次数大概是50万词次。 如果整个语料
库含有5万词型(types),那么其中的一半(也就是2.5 万条左右)在
该语料库中只出现过一次。即使把语料库的规模加大十倍,变成1000万
词次,统计规律大体不变。
有趣的是,80年代Sampson对英语语料库中的PSG规则进行统计,发
现它们的分布同样是扭曲的,大体表现为齐夫率(Aarts et al. 1990)
。也就是说,一方面经常遇到的语法规则只有几十条左右,它们的出现
频度极高;另一方面,规则库中大约一半左右的规则在语料库中只出现
过一次。随着语料库规模的扩大,新的规则仍不断呈现。Chomsky 曾提
出过这样的***设,认为对一种自然语言来说,其语法规则的数目是有限
的,而据此生成的句子数目是无限的。但语料库调查的结果不是这样。
这个发现至少说明,单纯依靠语言学家的语感来编写语法规则不可能胜
任大规模真实文本处理的需求,我们必须寻找可以从语料库中直接获取
大规模语言知识的新方法。
几十年来,NLP学界发表过大量灿烂成果,有词法学、语法学、 语
义学的,有句法分析算法的,还有许多著名的自然语言应用系统。而对
该领域影响最大的、里程碑式的成果应数下面三个。
3. 三个里程碑
3.1 里程碑之一:复杂特征集
复杂特征集(complex feature set)又叫多重属性(multiple
features)描写。在语言学里,这种描写方法最早出现在语音学中,后
来被Chomsky学派***用来扩展PSG的描写能力。现在无论是在语言学界还
是计算语言学界,几乎所有语法系统在词汇层的描写中均***用复杂特征
集,并利用这些属性来强化句法规则的约束力。一个复杂特征集F 包含
任意多个特征名f[,i]和特征值v[,i]对。其形式如:
F={…,fi=vi,…},i=1,…,n
特征值v[,i]既可以是一个简单的数字或符号, 也可以是另外一个复杂
特征集。这种递归式的定义使复杂特征集获得了强大的表现能力。如北
京大学俞士汶等(1998)开发的《现代汉语语法信息词典详解》,对一
个动词界定了约40项属性描写,对一个名词界定了约27项属性描写。
一条含有词汇和短语属性约束的句法规则具有如下的一般形式:
〈PSG规则〉:〈属性约束〉
:〈属性传递〉
一般来说,PSG 规则包括右部(条件:符号序列的匹配模式)和左部(
动作:短语归并结果)。词语的“属性约束”直接来自系统的词库,而
短语的“属性约束”则是在自底向上的短语归并过程中从其构成成分的
中心语(head)那里继承过来的。在Chomsky的理论中这叫做X-bar 理
论。X-bar代表某个词类X所构成的、仍具有该词类属性的一个成分。
如果X=N,就是一个具有名词特性的N-bar。当一条PSG 规则的右部匹
配成功,且“属性约束”部分得到满足,这条规则才能被执行。此时,
规则左部所命名的短语被生成,该短语的复杂特征集通过“属性传递”
部分动态生成。
20世纪80年代末、90年代初学术界提出了一系列新的语法,如广义
短语结构语法(GPSG)、中心语驱动的短语结构语法(HPSG)、词汇功
能语法(LFG)等等。 这些形式语法其实都是在词汇和短语的复杂特征
集描写背景下产生的。合一(unification )算法则是针对复杂特征集
的运算而提出来的。“合一”是实现属性匹配和赋值的一种算法,所以
上述这些新语法又统称为“基于合一的语法”。
3.2 里程碑之二:词汇主义
在NLP领域中,第二个里程碑式的贡献叫词汇主义(lexicali*** )
。语言学家Hudson(1991)曾宣称词汇主义是当今语言学理论发展的头
号倾向。其出现原因也同前面所观察的两个事实有关。词汇主义方法不
仅提出了一种颗粒度更细的语言知识表示形式,而且体现了一种语言知
识递增式开发和积累的新思路。
这里首先要解释一下这样一个矛盾。一方面,语言学界一向认为,
不划分词类就无法讲语法,如前面介绍的短语结构语法。也就是说,语
法“不可能”根据个别的词来写规则。但是另一方面,人们近来又注意
到,任何归类都会丢失个体的某些重要信息。所以从前文提到的第一个
事实出发,要想强化语法约束能力,词汇的描写应当深入到比词类更细
微的词语本身上来。换句话讲,语言学呼唤在词汇层***用颗粒度更小的
描写单元。从本质上来说,词汇主义倾向反映了语言描写的主体已经从
句法层转移到词汇层;这也就是所谓的“小语法,大词库”的思想。下
面我们来看与词汇主义有关的一些工作。
3.2.1 词汇语法(Lexicon-grammar)
法国巴黎大学Gross教授在20世纪60 年代就创立了一个研究中心叫
LADL,并提出词汇语法的概念( ladl. jussieu. fr/)。
·把12,000个主要动词分成50个子类。
·每个动词都有一个特定的论元集。
·每一类动词都有一个特定的矩阵,其中每个动词都用400 个不同
句式来逐一描写(“+”代表可进入该句式;“-”表示不能)。
·已开发英、法、德、西等欧洲语言的大规模描写。
·INTEX是一个适用于大规模语料分析的工具, 已先后被世界上五
十多个研究中心***用。
3.2.2 框架语义学(Frame Semantics)
Fillmore是格语法(Case Grammar)的创始人,他前几年主持了美
国自然科学基金的一个名为框架语义学的项目( icsi.
berkeley. edu/framenet)。该项目从WordNet上选取了2000个动词,从
中得到75个语义框架。例如动词“categorize”的框架被定义为:
一个人(Cognizer)把某个对象(Item)视为某个类(Category)。
同原先的格框架相比, 原来一般化的动作主体被具体化为认知者
Cognizer,动作客体被具体化为事物Item,并根据特定体动词的性质增
加了一个作为分类结果的语义角色Category。
项目组还从英国国家语料库中挑出相关句子50,000个, 通过人工
给每个句子标注了相应的语义角色。例如:
Kim categorized the book as fiction.
(Cog) (Itm) (Cat)
3.2.3 WordNet
WordNet是一个描写英语词汇层语义关系的词库,1990 年由普林斯
顿大学Miller开发( princeton. edu:80/~wn/),
到现在已有很多个版本,全部公布在因特网上,供研究人员自由下载。
欧洲有一个Euro-WordNet,以类似的格式来表现各种欧洲语言的词汇层
语义关系。WordNet刻意描写的是词语之间的各种语义关系, 如同义关
系(synonymy)、反义关系(antonymy)、上下义关系(hyponymy),
部分一整体关系(part-of)等等。 这种词汇语义学又叫做关系语义学
。这一学派同传统的语义场理论和语义属性描写理论相比,其最大的优
势在于第一次在一种语言的整个词汇表上实现了词汇层的语义描写。这
是其他学派从来没有做到的。其它理论迄今仅仅停留在教科书或某些学
术论文中,从来没有得到工程规模的应用。下面是WordNet的概况:
·95,600条实词词型(动词、名词、形容词)
·被划分成70,100个同义词集(synsets)
3.2.4 知网(How-Net)
知网是董振东和董强(19***)设计的一个汉语语义知识网(***:
//***.keen***e. com)。
·自下而上地依据概念对汉语实词进行了穷尽的分类。
·15,000个动词被划分成810类。
·定义了300个名词类,100个形容词类。
·全部概念用400个语义元语来定义。
知网的特点是既有WordNet 所描写的同一类词之间的语义关系(如
:同义、反义、上下义、部分-整体等),又描写了不同类词之间的论
旨关系和语义角色。
3.2.5 MindNet
MindNet是微软研究院NLP组设计的( microsoft.
com/nlp/)。其设计思想是试图用三元组(triple )作为全部知识的
表示基元。一个三元组由两个节点和一条连接边组成。每个节点代表一
个概念,连接这两个概念节点的边表示概念之间的语义依存关系。全部
三元组通过句法分析器自动获取。具体来说,就是通过对两部英语词典
(Longman Dictionary of Contemporary English和American Herit***e
Dictionary)及一部百科全书(Encarta)中的全部句子进行分析, 获
得每个句子的逻辑语义表示(logical form,简称LF)。而LF本来就是
由三元组构成的,如(W1,V-Obj,W2)表示:W1是一个动词, W2是其
宾语中的中心词,因此W2从属于W1,它们之间的关系是V-Obj。 比如(
play,V-Obj,basketball)便是一个具体的三元组。又如(W1,H-Mod
,W2),W1代表一个偏正短语中的中心词(head word),W2 是其修饰
语(modifier),因此W2从属于W1,它们之间的关系是H-Mod。
这种***完全是自动做出来的,所得的三元组不可能没有错误。但
是那些出现频度很高的三元组一般来说是正确的。MindNet 已经应用到
语法检查、句法结构排歧、词义排歧、机器翻译等许多场合。
3.3 里程碑之三:统计语言模型
第三个贡献就是语料库方法,或者叫做统计语言模型。如果用变量
W 代表一个文本中顺序排列的n个词,即W=w[,1]w[,2]…w[,n], 则统
计语言模型的任务是给出任意一个词序列W在文本中出现的概率P(W )
。利用概率的乘积公式,P(W)可展开为:
P(W)=P(w[,1])P(w[,2]│w[,1])P(w[,3]│w[,1]w[,2]).
..P(w[,n]│w[,1]w[,2]…w[,n-1]) (1)
式中P(w[,1])表示第一个词w[,1]的出现概率,P(w[,2]│w[,1])表
示在w[,1]出现的情况下第二个词w[,2]出现的条件概率,依此类推。不
难看出,为了预测词w[,n]的出现概率, 必须已知它前面所有词的出现
概率。从计算上来看,这太复杂了。如果近似认为任意一个词w[,i] 的
出现概率只同它紧邻的前一个词有关,那么计算就得以大大简化。这就
是所谓的二元模型(bigram),由(1)式得:
P(W)≈P(w[,1])Ⅱ[,i=2,…,n]P(w[,i]│w[,i-1]) (2)
式中Ⅱ[,i=2,…,n]P(w[,i]│w[,i-1])表示多个概率的连乘。
需要着重指出的是:这些概率参数都可以通过大规模语料库来估值
。比如二元概率
P(w[,i]│w[,i-1])≈count(w[,i-1]w[,i])/count(w[,i- 1
]) (3)
式中count(…)表示一个特定词序列在整个语料库中出现的累计次数。
若语料库的总词次数为N, 则任意词w[,i]在该语料库中的出现概率可估
计如下:
P(w[,1])≈count(w[,i])/N
同理,如果近似认为任意词w[,i]的出现只同它紧邻的前两个词有关,
就得到一个三元模型(trigram):
P(W)≈P(w[,1])P(w[,2]│w[,1])Ⅱ[,i=3,…,n]P(w[,i]
│w[,i-2]w[,-1]) (5)
统计语言模型的方法有点像天气预报。用来估计概率参数的大规模
语料库好比是一个地区历年积累起来的气象记录,而用三元模型来做天
气预报,就像是根据前两天的天气情况来预测当天的天气。天气预报当
然不可能百分之百正确。这也算是概率统计方法的一个特点。
3.3.1 语音识别
语音识别作为计算机汉字键盘输入的一种替代方式,越来越受到信
息界人士的青睐。所谓听写机就是这样的商品。据报道,中国的移动电
话用户已超过一亿,随着移动电话和个人数字助理(PDA)的普及, 尤
其是当这些随身携带的器件都可以无线上网的时候,广大用户更迫切期
望通过语音识别或手写板而不是小键盘来输入简短的文字信息。
其实,语音识别任务可视为计算以下条件概率的极大值问题:
W[*]=argmax[,W]P(W│speech signal)
=argmax[,W]P(speech signal│W)P(W)/
P(speech signal)
=argmax[,W]P(speech signal│W)P(W) (6)
式中数学符号argmax[,w]表示对不同的候选词序列W计算条件概率P (W
│speech signal)的值,从而使W[*] 成为其中条件概率值最大的那个
词序列,这也就是计算机选定的识别结果。换句话讲,通过式(6 )的
计算,计算机找到了最适合当前输入语音信号speech signal的词串W[
*]。
式(6)第二行是利用贝叶斯定律转写的结果,因为条件概率P (
speech signal│W)比较容易估值。公式的分母P(speech signal)对
给定的语音信号是一个常数,不影响极大值的计算,故可以从公式中删
除。在第三行所示的结果中,P(W)就是前面所讲的统计语言模型,一
般***用式(5)所示的三元模型;P(speech signal│W)叫做声学模型
到此,读者可能已经明白,汉语拼音输入法中的拼音—汉字转换任
务其实也是用同样方法实现的,而且两者所用的汉语语言模型(即二元
或三元模型)是同一个模型。
目前市场上的听写机产品和微软拼音输入法(3.0 版)都是用词的
三元模型实现的,几乎完全不用句法—语义分析手段。因为据可比的评
测结果,用三元模型实现的拼音-汉字转换系统,其出错率比其它产品
减少约50%。
3.3.2 词性标注
一个词库中大约14%的词型具有不止一个词性。而在一个语料库中
,占总词次数约30%的词具有不止一个词性。所以对一个文本中的每一
个词进行词性标注,就是通过上下文的约束,实现词性歧义的消解。历
史上曾经先后出现过两个自动词性标注系统。一个***用上下文相关的规
则,叫做T***GIT(1***1),另一个应用词类的二元模型,叫做CLAWS (
1987)(见Garside et al.1989)。两个系统都分别对100 万词次的英
语非受限文本实施了词性标注。结果显示, ***用统计语言模型的CLAWS
系统的标注正确率大大高于基于规则方法的T***GIT系统。请看下表的对
比:
系统名 T***GIT(1***1) CLAWS(1987)标记数 86 133方法 3000条CSG规则 隐马尔科夫模型标注精度 77% 96%测试语料 布朗 LOB
令C和W分别代表词类标记序列和词序列,则词性标注问题可视为计
算以下条件概率的极大值:
C[*]=argmax[,C]P(C│W)
=argmax[,C]P(W│C)P(C)/P(W)
≈argmax[,C]Ⅱ[,i=1,…,n]P(w[,i]│c[,i])P(c[,i]│c[,i
-1]) (7)
式中P(C│W)是已知输入词序列W的情况下,出现词类标记序列C 的条
件概率。数学符号argmax[,C] 表示通过考察不同的候选词类标记序列C
,来寻找使条件概率取最大值的那个词类标记序列C[*]。后者应当就是
对W的词性标注结果。
公式第二行是利用贝叶斯定律转写的结果,由于分母P(W)对给定
的W是一个常数,不影响极大值的计算,可以从公式中删除。 接着对公
式进行近似分析。首先,引入独立性***设,认为任意一个词w[,i] 的出
现概率近似只同当前词的词类标记c[,i]有关, 而与周围(上下文)的
词类标记无关。于是词汇概率可计算如下:
P(W│C)≈Ⅱ[,i=1,…,n]P(w[,i]│c[,i]) (8)
其次,***用二元***设,即近似认为任意一个词类标记c[,i] 的出现概率
只同它紧邻的前一个词类标记c[,i-1]有关。则
P(C)≈P(c[,1])Ⅱ[,i=2,…,n]P(c[,i]│c[,i-1]) (9)
P(c[,i]│c[,i-1])是词类标记的转移概率, 也叫做基于词类的二元
模型。
上述这两个概率参数都可以通过带词性标记的语料库来分别估计:
P(w[,i]│c[,i])≈count(w[,i],c[,i])/count(c[,i]) (
10)
P(c[,i]│c[,i-1])≈count(c[,i-1]c[,i])/count(c[,i-1]
) (11)
据文献报道,***用统计语言模型方法,汉语和英语的词性标注正确
率都可以达到96%左右(白拴虎1992)。
3.3.3 介词短语PP的依附歧义
在英语中,介词短语究竟依附于前面的名词还是前面的动词,是句
法分析中一种常见的结构歧义问题。下例表明怎样用语料库方法解决这
个问题,以及这种方法究竟能达到多高的正确率。
例句:Pierre Vinken, 61 years old, joined the board as a
nonexecutive director.
令A=1表示名词依附,A=0为动词依附,则上述例句的PP依附问题可表
为:
(A=0,V=joined,N1=board,P=as,N2=director)
令V,N1,N2分别代表句中动词短语、宾语短语、介宾短语的中心词,
并在一个带有句法标注的语料库(又称树库)中统计如下四元组的概率
P[,r]:
P[,r]=(A=1│V=v,N1=n1,P=p,N2=n2) (10)
对输入句子进行PP依附判断的算法如下:
若P[,r]=(1│v,n1,p,n2)≥0.5,
则判定PP依附于n1,
否则判定PP依附于v。
Collins & Brooks(1995)实验使用的语料库是宾夕法尼亚大学标注的
《华尔街日报》(WSJ)树库,其中包括:训练集20,801个四元组,测
试集3,0***个四元组。他们对PP依附自动判定精度的上下限作了如下分
析:
一律视为名词依附(即A≡1) 59.0%
只考虑介词p的最常见依附 72.2%
三位专家只根据四个中心词判断 88.2%
三位专家根据全句判断 93.2%
很明显,自动判断精确率的下限是72.2%,因为机器不会比只考虑句中
介词p的最常见依附做得更差;上限是88.2%, 因为机器不可能比三位
专家根据四个中心词作出的判断更高明。
论文报告,在被测试的3,0***个四元组中,系统正确判断的四元组
为2,606个,因此平均精确率为84.1%。这与上面提到的上限值88.2%
相比,应该说是相当不错的结果。
4. 结论
语言学家的努力,不论是用复杂特征集和合一语法,还是词汇主义
方法,都是在原先所谓的理性主义框架下作出的重大贡献。词汇主义方
法特别值得推崇,因为它不仅提出了一种颗粒度更细的语言知识表示形
式,而且体现了一种语言知识递增式开发和积累的新思路。尤其值得重
视的是在众多词汇***的开发过程中,语料库和统计学方法发挥了很大
的作用。这也是经验主义方法和理性主义方法相互融合的可喜开端。笔
者相信,语料库方法和统计语言模型是当前自然语言处理技术的主流,
它们的实用价值已在很多应用系统中得到证实。统计语言模型的研究,
尤其在结构化对象的统计建模方面,仍有广阔的发展空间。
参考文献:
Aarts, Jan & Willen Meijs (eds.). 1990. Corpus Linguistics:
Theory and Practice〔C〕. Amsterdam: Rodopi.
Collins, M. and J. Brooks. 1995. Preposition phrase
attachment through a backed-off model〔P〕. In Proceedings of the
3rd Workshop of Very Large Corpora. Cambridge, Mass.
Garside, R., G. Leech and G. Sampson, (eds.). 1989. The
Computational Analysis of English: A Corpus-Based Approach〔C〕.
London: Longman.
Hudson, R. A. 1991. English Word Grammar〔M〕. Cambridge,
Mass.: Basil Blackwell.
白拴虎,1992,汉语词性自动标注系统研究〔MA〕。清华大学计算
机科学与技术系硕士学位论文。
董振东、董强,19***,知网〔J〕。《语言文字应用》第3期。
俞士汶等,1998,《现代汉语语法信息词典详解》〔M〕。 北京:
清华大学出版社。
文言文句式类型分为四大句式分别是:判断句、被动句、倒装句以及省略句。详细介绍如下:
1、判断句,是根据谓语的性质给句子分类得出的一种句型,一般是用名词或名词性词组作谓语,对事物的属性作出判断,即说明某事物是什么,或不是什么。文言文判断句最显著的特点就是基本上不用判断词是来表示,而往往让名词或名词性短语直接充当。
2、所谓被动句,是指主语与谓语之间的关系是被动关系,也就是说,主语是谓语动词说表示的行为的被动者、受害者,而不是主动者、实施者。文言文中,被动句的主语是谓语动词说表示的行为被动者,受事者,而不是主动者,实施者。
3、常见的文言文省略句是文言文中普遍存在着省略成分的情况,对省略成分的把握,有助于完整理解句子的意思。
1·喷出烟雾是动宾短语,喷出是动词,烟雾是名词,做喷出的宾语。
2·判断短语类型的方法:
短语是由词和词构成的,短语可以作为句子成分;大多数短语加上一定的语调就可以成为句子。
词和词构成短语,形成一定的结构关系和短语成分:
1).并列短语:由两个或两个以上的名词、动词或形容词并列组成,词和词之间是平等的联合,没有轻重主次之分。
例如:报纸杂志、老师和同学、雄伟壮丽、唱歌又跳舞、调查研究、光荣而艰巨
2).偏正短语:由名词、动词或形容词和在它们前头起修饰限制作用的词组成。其中名词、动词或形容词是中心语,修饰句词的词语是定语,修饰动词、形容词的词语是状语。定语、状语与中心语的关系,是偏和正的关系。定语用“( )”表示,状语用“[ ]”表示,中心语不标符号。
例如:(汉语)语法、(祖国)大地
[完全]相信、[小心]翻阅、[更加]坚强、[多么]伟大
3).动宾短语:由动词和它的宾语组成。宾语在动词之后,是动词的支配成分,表示动作行为的对象、结果、处所等。
例如:吃晚饭、盖房子、住石洞
有的动词(如“给、送、教、告诉”等)可以带两个宾语。这样的宾语叫双宾语。离动词近的叫近宾语,离动词远的叫远宾语。
例如:给我笔、教你一首歌
4).补充短语:由动词或形容词和补语组成。补语在动词或形容词之后,对动词或形容词起补充说明的作用。建议将动词、形容词和补语组成的短语称补充短语。这样,补充短语分为两类,一是动补短语,一是形 补短语。补语用“〈 〉”表示。
例如:洗得〈干净〉、翻了〈一阵〉、抱〈起来〉、活跃〈在基层〉、热得〈出汗〉、大得〈多〉
5).主谓短语:由主语和谓语组成。主语在前,表示陈述对象;谓语在后,表示陈述的内容。主语、谓语之间用“?”标示,“?”之前是主语,之后是谓语。
例如:红旗?飘扬、天气?好
一个短语一个成分或每一个成分,还可以扩展成短语。这样短语中包含短语,成为复杂的短语。扩展后的短语,能够表达比较复杂的思想感情或动作行为,例如:
迷人的秋色--一派迷人的秋色--好一派迷人的秋色
走进来--急急忙忙走进来--神色慌张、急急忙忙走进来
6)·介宾短语、的字短语等也很常用。
介宾短语如:从今天(开始),向我(走来),对学校的情况(很熟悉)等。
的字短语如:男的(排左边),大红的(是牡丹)。