1 引言
眾所周知,語句是最小的交際單位,對其結(jié)構(gòu)的理解,語言學(xué)家的觀點(diǎn)大相徑庭。漢語語法從句子成分出發(fā),區(qū)分出主語、謂語、賓語、狀語等成分。其中,主語、謂語和賓語是主要的句子成分,一個(gè)句子的結(jié)構(gòu)可以用主語+謂語+賓語表示。喬姆斯基的轉(zhuǎn)換生成語法認(rèn)為,名詞短語(noun phrase,NP)和動(dòng)詞短語(verb phrase,VP)是構(gòu)成句子的兩大基本部件,任何一個(gè)句子(sentence,S)都可以表示為S→NP+VP.格語法的創(chuàng)立者、美國語言學(xué)家Fillmore把句子分成情態(tài)(modality)和命題(proposition)兩部分,可以用公式S→M+P表示(楊成凱1986:37)。Г. А. Золотова則認(rèn)為句法素(синтаксема)是句子的直接構(gòu)筑單位。她將“句法素”視為俄語中“最小的、不可分割的語義-句法單位”。范疇語義特征、形態(tài)特征和句法功能被認(rèn)為是區(qū)分句法素的重要特征。在俄語句子中,句法素體現(xiàn)以下3種基本句法功能:1)作為獨(dú)立的單位使用;2)作為句子的組成部分使用;3)作為詞組(或詞的組合)的組成部分使用。根據(jù)句法素在句子中所起的句法功能數(shù)量的多寡將其分為自由型句法素(свободная синтаксема)、限制型句法素(обусловленная синтаксема)和連接型句法素(связанная синтаксема)。在限制型句法素和連接型句法素中又可以區(qū)分出各種具體的“位”(позиция)。不僅是句子,像超句子統(tǒng)一體,乃至語篇等更大的語言單位都由句法素組合而成。(Г. А. Золотова 1988:4–5)俄語事格語法是從自然語言處理角度提出的可操作性強(qiáng)、高度形式化的俄語定性化描寫體系。事格語法認(rèn)為,客觀世界由事件組成,事件映射到語言中,體現(xiàn)為一個(gè)個(gè)句子,句子的抽象模式可以表示為V(x,y,z) <a>,動(dòng)詞V是事件中的“代表”, x,y,z和a則是事件的參與者。在交際過程中,根據(jù)各項(xiàng)參數(shù)取值的不同,可以生成變化無窮的句子。(傅興尚1999:45)。
我們認(rèn)為,句子是由有限的構(gòu)句塊(синтаксический блок)組成的。構(gòu)句塊是指句子中某一片段(отрезок),常以該段的第一個(gè)詞和最后一個(gè)詞為分割邊界。每個(gè)構(gòu)句塊都包含主導(dǎo)詞,由主導(dǎo)詞繼承整個(gè)構(gòu)句塊的語法屬性。句子中的基本構(gòu)句塊包括動(dòng)詞性構(gòu)句塊、名詞性構(gòu)句塊、副動(dòng)詞構(gòu)句塊和形動(dòng)詞構(gòu)句塊(傅興尚2004:41)。本文擬研究俄語名詞性構(gòu)句塊(以下簡稱NP構(gòu)句塊)。先看下例:В последние 50 лет в лингвистике возрос интерес к содержательной стороне языка。該句包含3個(gè)獨(dú)立的NP構(gòu)句塊:последние 50 лет,лингвистике,интерес к содержательной стороне языка,主導(dǎo)詞分別是лет,лингвистике,интерес。但是3個(gè)構(gòu)句塊內(nèi)部結(jié)構(gòu)是不相同的:在構(gòu)句塊последние 50 лет中,последние和50是лет的修飾語;лингвистике中主導(dǎo)詞本身就構(gòu)成一個(gè)構(gòu)句塊,интерес к содержательной стороне языка的結(jié)構(gòu)比較復(fù)雜:интерес是整個(gè)構(gòu)句塊的主導(dǎo)詞,其中“嵌套”另外一個(gè)NP構(gòu)句塊содержательная сторона языка。用樹形圖表示構(gòu)句塊интерес к содержательной стороне языка的結(jié)構(gòu)如下:
2 基本NP構(gòu)句塊的模式化及其次范疇化
上圖表明,NP構(gòu)句塊具有層級性。句子中最“底層”的、合乎句法規(guī)則的、以名詞為主導(dǎo)詞的構(gòu)句單位稱之為基本NP構(gòu)句塊。雖然句子中的NP構(gòu)句塊千變?nèi)f化,但是基本NP構(gòu)句塊的模式是有限的。借助相應(yīng)的規(guī)則對基本NP構(gòu)句塊加以組配,可以生成各種類型的NP構(gòu)句塊。 由俄羅斯留學(xué)網(wǎng)eluosi.liuxue86.com小編04月27日編輯整理《俄語語法:俄語基本名詞性構(gòu)句塊模式研究》。123123123
根據(jù)俄語名詞的組配性能,可區(qū)別以下8類基本NP構(gòu)句塊模式:1)Adj N1—形容詞+名詞一格(如утренний час,стальная воля,отличный студент);2)Adv N1—副詞+名詞一格(如прогулка ночью,поворот налево,совсем дурак);3)Pron N1—代詞+名詞一格(如весь народ,мой словарь);4)Num Nf—數(shù)詞+名詞(如два стола);5)N1 V—名詞一格+動(dòng)詞不定式(如возможность учиться,приказ наступать,мастер плавать);6)N1 P Nf—名詞一格+前置詞+名詞(лобовь к народу,робость перед народами,наблюдение за морем);7)N1 Nf—名詞一格+名詞(如ожидание автобуса,владение языком);8)ОДНОР СУЩ—同質(zhì)名詞短語(如кофе или чай,сын и дочь)。
我們知道,計(jì)算機(jī)通常按照條件執(zhí)行相關(guān)指令,算法設(shè)計(jì)要求對語言單位進(jìn)行定性化描寫。上述8類基本NP構(gòu)句塊模式是高度抽象化的、概括性很強(qiáng)的構(gòu)句單位。為了便于操作,必須實(shí)現(xiàn)模式的次范疇化。次范疇化指的是根據(jù)某些鑒別特征(形態(tài)特征、語法意義等)將語言單位細(xì)化(實(shí)現(xiàn)語法或語義層面具體化)的過程。在基于規(guī)則的自然語言處理系統(tǒng)中,把握次范疇化的適宜度至關(guān)重要。標(biāo)準(zhǔn)過于寬泛,容易導(dǎo)致語言單位承載的各項(xiàng)信息不足,給設(shè)計(jì)算法帶來困難或引起歧義;劃分過細(xì)便于對語言規(guī)則的操作,但這會(huì)占用很大的內(nèi)存,影響運(yùn)算速度。因此,次范疇化應(yīng)該以面向操作任務(wù)為原則,以實(shí)現(xiàn)語言單位的可計(jì)算性為目標(biāo)。具體涉及到NP構(gòu)句塊模式的次范疇化,可選取以下鑒別特征:1)Nf或P的形態(tài)特征;2)修飾語的詞匯-語法類別;3)修飾語與主導(dǎo)詞間的語義關(guān)系;4)聯(lián)系用語的不同。
基本NP構(gòu)句塊模式的次范疇化,需要強(qiáng)調(diào)以下兩點(diǎn):1)某一類基本NP構(gòu)句塊模式的次范疇化,往往只選取部分鑒別特征。構(gòu)句塊模式Adj N1的次范疇化,我們選取的鑒別特征包括修飾語的詞匯-語法類別和修飾語與主導(dǎo)詞間的語義關(guān)系兩項(xiàng),最終區(qū)分出Adj N1(屬性,красный стол)、 Adj N1(材料,каменный домик)、Adj N1(事物所有者,отцовская шляпа)等17類帶有語義標(biāo)注的NP構(gòu)句塊模式。其中,表示數(shù)量意義的構(gòu)句塊模式中的修飾語一般為сотый,тысячный,некоторый(如сотные строители)等具有數(shù)量意義的形容詞。聯(lián)系用語的不同只用于模式ОДНОР СУЩ的次范疇化。2)次范疇化具有層級性。各層級次范疇化所選取的鑒別特征也不盡相同。如模式N1 P Nf的次范疇化由3個(gè)層級組成:第一層級的次范疇化圍繞Nf的形態(tài)特征展開,可以得到N1 P N2,N1 P N3等模式。選取P的形態(tài)特征進(jìn)行第二層級的次范疇化后,可以得到N1 от N2, N1 к N3, N1 перед N5等比較具體的模式。第三層級次范疇化選取的鑒別特征是構(gòu)句塊內(nèi)部的語義關(guān)系,最終我們得到諸如N1 от N2(客體,освобождение от пустяков),N1 от N2(空間,тропика от леса),N1 от N2(時(shí)間,письмо от двацатого мая)等帶有語義標(biāo)注及相關(guān)語言信息的基本NP構(gòu)句塊模式。
次范疇化后基本NP構(gòu)句塊模式表現(xiàn)為一個(gè)層級系統(tǒng)。位于頂部的是諸如Adj N1等基本構(gòu)句塊模式,數(shù)量少,概括性強(qiáng);基本模式下面是第一級次范疇化后形成的模式,隨后是第二級次范疇后形成的模式,越底層的模式數(shù)量越多,越具體。
3 基本NP構(gòu)句塊模式的信息標(biāo)注 由俄羅斯留學(xué)網(wǎng)eluosi.liuxue86.com小編04月27日編輯整理《俄語語法:俄語基本名詞性構(gòu)句塊模式研究》。123123123
信息標(biāo)注重在為次范疇化后的基本NP構(gòu)句塊模式提供必要信息。在基于規(guī)則的處理系統(tǒng)中,信息標(biāo)注具有重要意義。基本NP構(gòu)句塊模式的信息標(biāo)注,在理論上為NP的研究提供了新的內(nèi)容,拓寬了研究者的視野;在操作中可為建造語言知識(shí)庫和實(shí)現(xiàn)NP構(gòu)句塊的自動(dòng)處理提供信息源。確定一個(gè)合理、統(tǒng)一、開放的信息標(biāo)注集是實(shí)現(xiàn)信息標(biāo)注的必要前提。從實(shí)現(xiàn)NP構(gòu)句塊自動(dòng)處理的角度出發(fā),我們確定一個(gè)包括構(gòu)句塊的形式化表達(dá)、語義關(guān)系、主導(dǎo)詞、例詞、漢化語序等5項(xiàng)內(nèi)容組成的信息標(biāo)注集,無法歸入標(biāo)注集,但對于NP構(gòu)句塊的自動(dòng)處理具有重要價(jià)值的信息,可體現(xiàn)在備注中。
構(gòu)句塊的形式化表達(dá)是用形式化語言表征基本NP構(gòu)句塊模式化的結(jié)果。在數(shù)學(xué)中,用公式a2+b2=c2表示直角三角形兩個(gè)直角邊與第三條邊之間的長度關(guān)系。在自然語言處理中,借用元語言表達(dá)手段表示語言單位的內(nèi)部結(jié)構(gòu),便于對其理解和計(jì)算。
語義問題是目前機(jī)器翻譯中的重點(diǎn)和難點(diǎn)。實(shí)現(xiàn)語言單位的“句法-語義一體化描寫”是自然語言處理中不可避免的趨勢,句法分析側(cè)重對語言單位結(jié)構(gòu)的理解,語義分析著重闡釋語言單位的意義。在基本NP構(gòu)句塊模式化過程中,本文力求明確模式內(nèi)部的語義關(guān)系。
構(gòu)句塊的語法屬性集中體現(xiàn)在主導(dǎo)詞上。Adj N1,Adv N1,Pron N1等模式中只有一個(gè)N1,N1即為構(gòu)句塊的主導(dǎo)詞。N1 P Nf和N1 Nf模式中的主導(dǎo)詞一般為N1,ОДНОР СУЩ模式中存在兩個(gè)(或兩個(gè)以上)的主導(dǎo)詞。確定模式的主導(dǎo)詞,便于實(shí)現(xiàn)構(gòu)句塊的規(guī)約(即NP→N)并減少NP構(gòu)句塊中的“節(jié)”點(diǎn)。
基于規(guī)則建模的主要依據(jù)是研究者的語言知識(shí)?;谝?guī)則建造的模式分析效率較高,但是主觀性較大,往往需要經(jīng)過真實(shí)文本的驗(yàn)證。本文為每個(gè)基本NP構(gòu)句塊模式配備相應(yīng)例詞,供讀者檢驗(yàn)。漢化語序是模式相應(yīng)的漢語對等翻譯形式。本文根據(jù)不同上下文為NP構(gòu)句塊提供不同漢化語序的方案,增強(qiáng)了譯文的合理性和準(zhǔn)確性。
備注中的內(nèi)容主要體現(xiàn)為:1)基本NP構(gòu)句塊模式對其組成要素的要求。構(gòu)句塊并不是主導(dǎo)詞與修飾語的任意組合,對各組成要素的形態(tài)特征、語義類別進(jìn)行規(guī)定是NP構(gòu)句塊自動(dòng)處理的重要輔助模塊;2)NP構(gòu)句塊模式的變體形式。在自然語言處理中,不同的變體形式往往包含在一個(gè)模式中,一方面可以節(jié)省模式占用的內(nèi)存空間,另一方面有利于模式的查詢,提高運(yùn)算速度。實(shí)現(xiàn)對8類基本NP構(gòu)句塊模式的次范疇化和信息標(biāo)注后,所有的模式按順序排列?,F(xiàn)在我們從中選出部分模式,來展示NP構(gòu)句塊模式化的過程。
N1 P Nf :以Nf的形態(tài)特征進(jìn)行第一層級的次范疇化。
N1 P N2:選取P的形態(tài)特征進(jìn)行第二層級的次范疇化。
N1 от N2:根據(jù)模式內(nèi)部的語義關(guān)系可進(jìn)行第三層級的次范疇化。
至此,模式的次范疇化已經(jīng)完成,可以對第三層級次范疇化后得到的基本NP構(gòu)句塊模式進(jìn)行信息標(biāo)注。
模式表達(dá)式: N1 от N2;模式內(nèi)部的語義關(guān)系:行為-客體意義;模式主導(dǎo)詞:N1;例詞:отличие от нас等;模式漢化語序:對N2的N1/ N1 N2;備注:該模式中的N1可以為:1)защита,охрана,освобождение,гарантия等表示擺脫威脅、困境等意義的動(dòng)名詞。例如,защита от непогод,освобождение от пустяков等;2)отказ,отличие,отречение,отвлечение,отнятие等部分帶有前綴от-的動(dòng)名詞,如отречение от трона,отказ от просьбы等。
模式表達(dá)式:N1 от N2;模式內(nèi)部的語義關(guān)系:事物-空間意義;模式主導(dǎo)詞:N1;例詞:тропинка от леса等;模式漢化語序:N2旁的N1.
模式表達(dá)式:N1 от N2;模式內(nèi)部的語義關(guān)系:事物-時(shí)間意義;模式主導(dǎo)詞:N1;例詞:телеграмма от пятницы,письмо от двацатого мая等;模式漢化語序:N2的N1 由俄羅斯留學(xué)網(wǎng)eluosi.liuxue86.com小編04月27日編輯整理《俄語語法:俄語基本名詞性構(gòu)句塊模式研究》。123123123
…
N1против N2
…
N1 P N3
…
4 基本NP構(gòu)句塊模式的操作原理
自然語言處理是一個(gè)包含詞法分析、句法分析、語義分析等若干處理模塊的復(fù)雜過程。各處理模塊是相對獨(dú)立的,即完成相應(yīng)的操作任務(wù),又緊密相連,集中體現(xiàn)為前一個(gè)處理模塊的結(jié)果對后一個(gè)模塊的分析產(chǎn)生直接影響。構(gòu)句塊的分析作為句法分析(或句法-語義分析)的預(yù)處理模塊,該處理模塊應(yīng)建立在成熟的詞法分析技術(shù)基礎(chǔ)上,詞法分析的出口即為構(gòu)句塊分析的入口。以Я читаю книгу為例,經(jīng)過詞法分析,對句中的詞形進(jìn)行形態(tài)還原并賦予相應(yīng)的詞法信息,結(jié)果如下:
я(代詞,單數(shù),第一格,я)
читаю(動(dòng)詞,單數(shù),第一人稱,主動(dòng)態(tài),未完成體,行為,читать)
книгу(名詞,單數(shù),第四格,語言作品,книга)
進(jìn)入構(gòu)句塊分析階段,首先考慮各種類別基本NP構(gòu)句塊的組配順序,同時(shí)完成對構(gòu)句塊的規(guī)約(NP→N),直至實(shí)現(xiàn)整個(gè)NP構(gòu)句塊的分析。這里列舉幾條組配規(guī)則,以展示其分析步驟。
規(guī)則1:8類基本NP構(gòu)句塊模式的組配順序?yàn)椋篈(Adv N1,Adj N1,Pron N1,Num Nf)→B(N1 P Nf,N1 Nf,N1 V)→C(ОДНОР СУЩ)。用此規(guī)則分析красная шапка сестры и джинсы братаNP構(gòu)句塊,規(guī)約結(jié)果可表示為{〔(красная шапка) сестры〕и (джинсы брата)}。
規(guī)則2:當(dāng)修飾語本身帶有接格關(guān)系時(shí),優(yōu)先進(jìn)行規(guī)約。對于NP構(gòu)句塊знакомый мне человек的規(guī)約順序?yàn)椤玻ě侑擐学堙唰蕨恣?мне) человек〕。
規(guī)則3:對于上面A組內(nèi)的模式,經(jīng)常出現(xiàn)一個(gè)主導(dǎo)詞前存在多個(gè)修飾語的情況,這時(shí)優(yōu)先規(guī)約距離主導(dǎo)詞近的修飾語。例如NP構(gòu)句塊пять красных шапок的組配順序?yàn)椤钵岌瘰洄?(красных шапок)〕。當(dāng)修飾語前出現(xiàn)若干同質(zhì)修飾語時(shí),優(yōu)先規(guī)約同質(zhì)修飾語。對красивая францзуская машинаNP構(gòu)句塊進(jìn)行規(guī)約,結(jié)果如下:〔(красивая францзуская)машина〕。
規(guī)則4:當(dāng)一個(gè)構(gòu)句塊中“嵌套”另一個(gè)構(gòu)句塊時(shí),優(yōu)先規(guī)約被嵌套的結(jié)構(gòu)。構(gòu)句塊интерес к содержательной стороне языка的規(guī)約順序如下:{интерес к 〔(содержательной стороне)языка〕}。
對俄語句子中的NP構(gòu)句塊進(jìn)行自動(dòng)化處理時(shí),除引入組配規(guī)則外,還需解決NP構(gòu)句塊邊界測定、后置定語的分析和識(shí)別、歧義消除等一系列技術(shù)問題,限于篇幅,不再贅述。
5 結(jié)束語
句法-語義分析的一個(gè)熱點(diǎn)是注重句子的局部分析,內(nèi)容涉及基本名詞短語(Base NP)的確定、短語邊界的劃定、語塊(或組塊)分析等(趙鐵軍等 2000:157-175)。雖然上述研究的出發(fā)點(diǎn)和方法各不相同,但宗旨大體一致,即為后來的句法-語義分析作準(zhǔn)備,提高句法分析的質(zhì)量。就某種意義而言,構(gòu)句塊分析也屬于一種局部分析的方法。由此可見,構(gòu)句塊分析具有廣闊的研究價(jià)值和應(yīng)用前景。
本文以NP構(gòu)句塊的內(nèi)部結(jié)構(gòu)為基礎(chǔ),以構(gòu)句塊的模式化和形式化為表達(dá)手段,力求對俄語基本NP構(gòu)句塊進(jìn)行定性化描寫,為實(shí)現(xiàn)NP構(gòu)句塊的自動(dòng)分析和識(shí)別提供信息源,為短語分析以及其他構(gòu)句塊的分析積累經(jīng)驗(yàn)。
由俄羅斯留學(xué)網(wǎng)eluosi.liuxue86.com小編04月27日編輯整理《俄語語法:俄語基本名詞性構(gòu)句塊模式研究》。123123123