莱比锡注释规则:修订间差异
创建页面,内容为“语言学中的“'''莱比锡注释规则'''”(Leipzig Glossing Rules)是一套国际通用的标注规范,主要用于对语言材料(如文本、语料)进行形态句法分析,尤其是在语言类型学、田野调查和语法描述中。该规则旨在统一学术文献中的语法标注方式,确保不同语言的研究成果能够清晰、一致地呈现,便于跨语言比较和学术交流。 == 组成部分 == *原文语言名称。…” |
|||
第88行: | 第88行: | ||
==标准缩写表== | ==标准缩写表== | ||
{| class=" | {| class="wikitable sortable" | ||
|1 | |1 | ||
|first person | |first person |
2025年5月25日 (日) 03:58的最新版本
语言学中的“莱比锡注释规则”(Leipzig Glossing Rules)是一套国际通用的标注规范,主要用于对语言材料(如文本、语料)进行形态句法分析,尤其是在语言类型学、田野调查和语法描述中。该规则旨在统一学术文献中的语法标注方式,确保不同语言的研究成果能够清晰、一致地呈现,便于跨语言比较和学术交流。
组成部分
[编辑]- 原文语言名称。
- 原文(如果原文不是用拉丁字母书写的,最好附上用拉丁字母转写的版本)以及对原文的逐语素分隔。
- 对原文的逐语素注释。
- 译文。
规则
[编辑]规则1. 逐词对齐
[编辑]- 从左向右水平逐词书写。如:
道本语 | |||||||
pipi | suno | li | kama | jo | e | ilo | suno. |
虫子 | 光明 | 分隔主谓 | 来 | 有 | 分隔动宾 | 工具 | 光明 |
萤火虫,提着灯。 |
规则2. 逐语素对应
[编辑]- 原文和注释中,语素单位用连字符“-”分隔,如:
Mandarin | ||
萤火虫,提着灯。 | ||
ying2huo3chong2 | ti2-zhe | deng1 |
firefly | carry-PROG | lamp |
"Firefly is carrying a lamp." |
- 例句和注释中,依附词(clitic)用等号“=”标注。
- 依附词,指的是语法上单独成词,语音上依附于前后的词。比如英语 it's 中的 's.
- 例句和注释中,相应的分隔符号数量须一致。
- 规则2A. 如果形态上的合成元素由不同的语音词或音韵词构成,则在原文中使用一个空格加连字符" -"。
规则3. 语法范畴标签
[编辑]- 语法语素可以用缩写表示。
- 缩写使用小体大写字母。如:NOM ACC。
- 不过圈里关于造语的日常交流中这条规则并不是很重要,况且并非所有聊天平台都支持设置字体大小的排版。
- 如果你使用的缩写不在标准缩写表里,则应该说明。
- 缩写不是强制的。况且大量使用缩写容易增加理解难度,尤其是面向不熟悉 gloss 的人。
规则4. 一对多的情况
[编辑]- 当一个原语言单位对应多个注释语言单位,用句号“.”分隔这些注释语言单位。
- 规则4A. 如果原语言的一个元素在形式上和语义上都不可分割,并且注释语言缺少一个与之等价的单词而只能用词组来注释,则可以使用下划线"_"连接词组间的各个单词。
- 规则4B. 如果原语言的一个元素在形式上不可分割,但具有多个可分的含义或语法特性,则可以使用分号";"连接注释内容。
- 规则4C. 如果原语言的一个元素在形式上和语义上可分割,但此种分割无关紧要,或出于保持文本完整的目的,则可以使用冒号":"连接注释内容。
- 规则4D. 如果对象语言中的语法属性由形态语音变化(如声调)表达。用反斜杠"\"分隔类别标签和注释的其余部分。
- 规则4E. 如果元语言的人称词缀可以同时表达施事和受事人称,则可以在注释中使用符号">"来分隔施事人称和受事人称。
规则5. 人称和数
[编辑]- 数量和人称之间不用句号分隔。如:3SG 表示第三人称单数。
- 规则5A. 人称和数量也可以使用非小写体大写,并不用句号与其他标注分隔。
规则6. 非显性成分
[编辑]- 如果注释有在原文中未外显的成分,可以在注释中使用方括号"[]"来标注。
- 或:在原文中加入“Ø”来表示,用连字符分隔。
- 此规则适用于注释类似拉丁语这样没有绝对所谓“原形”的语言。
规则7. 固有类别
[编辑]- 内部的、暗含的类别用圆括号“()”标注
规则8. 不连续成分
[编辑]- 如果一个语义或语法单位在原文中由间断的两部分组成,如环缀。则:
- 分别重复注释,或
- 用 STEM 表示重复注释的词干,用 CIRC 表示重复注释的语法成分。
规则9. 中缀
[编辑]- 用尖括号"<>"注释中缀。中缀一般有“左倾”或“右倾”之分,这决定了它在注释中写在词干之前还是之后。
规则10. 重复
[编辑]- 有些语言通过重复词干的某个部分来表达语法。用波浪号“~”来连接与词干重复的元素。
丘丘语 | |
mi~mi | nunu |
1~PL | 睡觉 |
我们睡觉 |
标准缩写表
[编辑]1 | first person | 第一人称 |
2 | second person | 第二人称 |
3 | third person | 第三人称 |
A | agent-like argument of canonical transitive verb | 典型及物动词的施事 |
ABL | ablative | 离格/夺格/从格 |
ABS | absolutive | 通格/绝对格 |
ACC | accusative | 宾格 |
ADJ | adjective | 形容词 |
ADV | adverb(ial) | 副词(状语) |
AGR | agreement | 一致 |
ALL | allative | 向格 |
ANTIP | antipassive | 反被动语态 |
APPL | applicative | 应动语态 |
ART | article | 冠词 |
AUX | auxiliary | 助词 |
BEN | benefactive | 利益格 |
CAUS | causative | 使役 |
CLF | classifier | 量词/分类词 |
COM | comitative | 伴随格 |
COMP | complementizer | 补语化成分 |
COMPL | completive | 补语 |
COND | conditional | 条件 |
COP | copula | 系动词 |
CVB | converb | 副动词 |
DAT | dative | 与格/给格 |
DECL | declarative | 陈述 |
DEF | definite | 定指 |
DEM | demonstrative | 指示 |
DET | determiner | 限定词 |
DIST | distal | 远指 |
DISTR | distributive | 分配/分格 |
DU | dual | 双数 |
DUR | durative | 持续体 |
ERG | ergative | 作格/施格 |
EXCL | exclusive | 排除性 |
F | feminine | 阴性 |
FOC | focus | 焦点 |
FUT | future | 将来时 |
GEN | genitive | 属格 |
IMP | imperative | 命令式 |
INCL | inclusive | 包含性 |
IND | indicative | 陈述式 |
INDF | indefinite | 不定 |
INF | infinitive | 不定式 |
INS | instrumental | 工具格 |
INTR | intransitive | 不及物 |
IPFV | imperfective | 未完成体 |
IRR | irrealis | 非现实式 |
LOC | locative | 方位格 |
M | masculine | 阳性 |
N | neuter | 中性 |
N- | non- (e.g. NSG nonsingular, NPST nonpast) | 非-(如NSG 非单数,NPST 非过去时) |
NEG | negation, negative | 否定 |
NMLZ | nominalizer/nominalization | 名词化 |
NOM | nominative | 主格 |
OBJ | object | 宾语 |
OBL | oblique | 间接格/斜格/旁格 |
P | patient-like argument of canonical transitive verb | 典型及物动词的受事 |
PASS | passive | 被动语态 |
PFV | perfective | 完成体 |
PL | plural | 复数 |
POSS | possessive | 所有格 |
PRED | predicative | 表语<ref>有地方误译为“可预测的”,疑似是看成 predicable 导致的</ref> |
PRF | perfect | 完成体 |
PRS | present | 现在时 |
PROG | progressive | 进行体 |
PROH | prohibitive | 禁止 |
PROX | proximal/proximate | 近指 |
PST | past | 过去时 |
PTCP | participle | 分词 |
PURP | purposive | 目的格 |
Q | question particle/marker | 疑问 |
QUOT | quotative | 引用 |
RECP | reciprocal | 相互 |
REFL | reflexive | 反身 |
REL | relative | 关系词 |
RES | resultative | 结果格 |
S | single argument of canonical intransitive verb | 典型非及物动词的单一事 |
SBJ | subject | 主语 |
SBJV | subjunctive | 虚拟语气 |
SG | singular | 单数 |
TOP | topic | 主题 |
TR | transitive | 及物 |
VOC | vocative | 呼格 |
注释示范
[编辑]The cat-s chase-d the mouse quick-ly DEF.ART N-PL V-PST DEF.ART N ADV “The cats chased the mouse quickly.”
逐词解释
[编辑]The
语素分割:The(不可分割,定冠词)。
语法标注:DEF.ART(定冠词,Definite Article)。
cats
语素分割:cat-s(词根 cat + 复数标记 -s)。
语法标注:N-PL(名词复数,Noun-Plural)。
chased
语素分割:chase-d(动词词根 chase + 过去时标记 -d)。
语法标注:V-PST(动词过去时,Verb-Past Tense)。
the
同第一项,标注为 DEF.ART。
mouse
语素分割:mouse(不可分割,单数名词)。
语法标注:N(名词,Noun)。
quickly
语素分割:quick-ly(形容词词根 quick + 副词化后缀 -ly)。
语法标注:ADV(副词,Adverb)。
关键标注规则
[编辑]语法缩写:
DEF.ART = 定冠词(Definite Article)
N = 名词(Noun),PL = 复数(Plural)
V = 动词(Verb),PST = 过去时(Past Tense)
ADV = 副词(Adverb)
语素分割符号:
连字符 - 分隔语素(如 cat-s)。
不可分割的语素(如 mouse)无需连字符。
功能说明 定冠词(DEF.ART):标记特定指称(“the cats” 指特定的猫)。
复数标记(-s):表明名词为复数形式。
过去时标记(-d):表明动作发生在过去。
副词化后缀(-ly):将形容词转换为副词(quick → quickly)。