莱比锡注释规则:修订间差异

来自TUCMandWSC
跳转到导航 跳转到搜索
创建页面,内容为“语言学中的“'''莱比锡注释规则'''”(Leipzig Glossing Rules)是一套国际通用的标注规范,主要用于对语言材料(如文本、语料)进行形态句法分析,尤其是在语言类型学、田野调查和语法描述中。该规则旨在统一学术文献中的语法标注方式,确保不同语言的研究成果能够清晰、一致地呈现,便于跨语言比较和学术交流。 == 组成部分 == *原文语言名称。…”
 
 
第88行: 第88行:


==标准缩写表==
==标准缩写表==
{| class="fandom-table"
{| class="wikitable sortable"
|1
|1
|first person
|first person

2025年5月25日 (日) 03:58的最新版本

语言学中的“莱比锡注释规则”(Leipzig Glossing Rules)是一套国际通用的标注规范,主要用于对语言材料(如文本、语料)进行形态句法分析,尤其是在语言类型学、田野调查和语法描述中。该规则旨在统一学术文献中的语法标注方式,确保不同语言的研究成果能够清晰、一致地呈现,便于跨语言比较和学术交流。

组成部分

[编辑]
  • 原文语言名称。
  • 原文(如果原文不是用拉丁字母书写的,最好附上用拉丁字母转写的版本)以及对原文的逐语素分隔。
  • 对原文的逐语素注释。
  • 译文。

规则

[编辑]

规则1. 逐词对齐

[编辑]
  • 从左向右水平逐词书写。如:
道本语
pipi suno li kama jo e ilo suno.
虫子 光明 分隔主谓 分隔动宾 工具 光明
萤火虫,提着灯。

规则2. 逐语素对应

[编辑]
  • 原文和注释中,语素单位用连字符“-”分隔,如:
Mandarin
萤火虫,提着灯。
ying2huo3chong2 ti2-zhe deng1
firefly carry-PROG lamp
"Firefly is carrying a lamp."
  • 例句和注释中,依附词(clitic)用等号“=”标注。
    • 依附词,指的是语法上单独成词,语音上依附于前后的词。比如英语 it's 中的 's.
  • 例句和注释中,相应的分隔符号数量须一致。
  • 规则2A. 如果形态上的合成元素由不同的语音词或音韵词构成,则在原文中使用一个空格加连字符" -"。

规则3. 语法范畴标签

[编辑]
  • 语法语素可以用缩写表示。
  • 缩写使用小体大写字母。如:NOM ACC。
    • 不过圈里关于造语的日常交流中这条规则并不是很重要,况且并非所有聊天平台都支持设置字体大小的排版。
  • 如果你使用的缩写不在标准缩写表里,则应该说明。
  • 缩写不是强制的。况且大量使用缩写容易增加理解难度,尤其是面向不熟悉 gloss 的人。

规则4. 一对多的情况

[编辑]
  • 当一个原语言单位对应多个注释语言单位,用句号“.”分隔这些注释语言单位。
  • 规则4A. 如果原语言的一个元素在形式上和语义上都不可分割,并且注释语言缺少一个与之等价的单词而只能用词组来注释,则可以使用下划线"_"连接词组间的各个单词。
  • 规则4B. 如果原语言的一个元素在形式上不可分割,但具有多个可分的含义或语法特性,则可以使用分号";"连接注释内容。
  • 规则4C. 如果原语言的一个元素在形式上和语义上可分割,但此种分割无关紧要,或出于保持文本完整的目的,则可以使用冒号":"连接注释内容。
  • 规则4D. 如果对象语言中的语法属性由形态语音变化(如声调)表达。用反斜杠"\"分隔类别标签和注释的其余部分。
  • 规则4E. 如果元语言的人称词缀可以同时表达施事和受事人称,则可以在注释中使用符号">"来分隔施事人称和受事人称。

规则5. 人称和数

[编辑]
  • 数量和人称之间不用句号分隔。如:3SG 表示第三人称单数。
  • 规则5A. 人称和数量也可以使用非小写体大写,并不用句号与其他标注分隔。

规则6. 非显性成分

[编辑]
  • 如果注释有在原文中未外显的成分,可以在注释中使用方括号"[]"来标注。
  • 或:在原文中加入“Ø”来表示,用连字符分隔。
  • 此规则适用于注释类似拉丁语这样没有绝对所谓“原形”的语言。

规则7. 固有类别

[编辑]
  • 内部的、暗含的类别用圆括号“()”标注

规则8. 不连续成分

[编辑]
  • 如果一个语义或语法单位在原文中由间断的两部分组成,如环缀。则:
    • 分别重复注释,或
    • 用 STEM 表示重复注释的词干,用 CIRC 表示重复注释的语法成分。

规则9. 中缀

[编辑]
  • 用尖括号"<>"注释中缀。中缀一般有“左倾”或“右倾”之分,这决定了它在注释中写在词干之前还是之后。

规则10. 重复

[编辑]
  • 有些语言通过重复词干的某个部分来表达语法。用波浪号“~”来连接与词干重复的元素。
丘丘语
mi~mi nunu
1~PL 睡觉
我们睡觉

标准缩写表

[编辑]
1 first person 第一人称
2 second person 第二人称
3 third person 第三人称
A agent-like argument of canonical transitive verb 典型及物动词的施事
ABL ablative 离格/夺格/从格
ABS absolutive 通格/绝对格
ACC accusative 宾格
ADJ adjective 形容词
ADV adverb(ial) 副词(状语)
AGR agreement 一致
ALL allative 向格
ANTIP antipassive 反被动语态
APPL applicative 应动语态
ART article 冠词
AUX auxiliary 助词
BEN benefactive 利益格
CAUS causative 使役
CLF classifier 量词/分类词
COM comitative 伴随格
COMP complementizer 补语化成分
COMPL completive 补语
COND conditional 条件
COP copula 系动词
CVB converb 副动词
DAT dative 与格/给格
DECL declarative 陈述
DEF definite 定指
DEM demonstrative 指示
DET determiner 限定词
DIST distal 远指
DISTR distributive 分配/分格
DU dual 双数
DUR durative 持续体
ERG ergative 作格/施格
EXCL exclusive 排除性
F feminine 阴性
FOC focus 焦点
FUT future 将来时
GEN genitive 属格
IMP imperative 命令式
INCL inclusive 包含性
IND indicative 陈述式
INDF indefinite 不定
INF infinitive 不定式
INS instrumental 工具格
INTR intransitive 不及物
IPFV imperfective 未完成体
IRR irrealis 非现实式
LOC locative 方位格
M masculine 阳性
N neuter 中性
N- non- (e.g. NSG nonsingular, NPST nonpast) 非-(如NSG 非单数,NPST 非过去时)
NEG negation, negative 否定
NMLZ nominalizer/nominalization 名词化
NOM nominative 主格
OBJ object 宾语
OBL oblique 间接格/斜格/旁格
P patient-like argument of canonical transitive verb 典型及物动词的受事
PASS passive 被动语态
PFV perfective 完成体
PL plural 复数
POSS possessive 所有格
PRED predicative 表语<ref>有地方误译为“可预测的”,疑似是看成 predicable 导致的</ref>
PRF perfect 完成体
PRS present 现在时
PROG progressive 进行体
PROH prohibitive 禁止
PROX proximal/proximate 近指
PST past 过去时
PTCP participle 分词
PURP purposive 目的格
Q question particle/marker 疑问
QUOT quotative 引用
RECP reciprocal 相互
REFL reflexive 反身
REL relative 关系词
RES resultative 结果格
S single argument of canonical intransitive verb 典型非及物动词的单一事
SBJ subject 主语
SBJV subjunctive 虚拟语气
SG singular 单数
TOP topic 主题
TR transitive 及物
VOC vocative 呼格

注释示范

[编辑]

The cat-s chase-d the mouse quick-ly DEF.ART N-PL V-PST DEF.ART N ADV “The cats chased the mouse quickly.”

逐词解释

[编辑]

The

语素分割:The(不可分割,定冠词)。

语法标注:DEF.ART(定冠词,Definite Article)。

cats

语素分割:cat-s(词根 cat + 复数标记 -s)。

语法标注:N-PL(名词复数,Noun-Plural)。

chased

语素分割:chase-d(动词词根 chase + 过去时标记 -d)。

语法标注:V-PST(动词过去时,Verb-Past Tense)。

the

同第一项,标注为 DEF.ART。

mouse

语素分割:mouse(不可分割,单数名词)。

语法标注:N(名词,Noun)。

quickly

语素分割:quick-ly(形容词词根 quick + 副词化后缀 -ly)。

语法标注:ADV(副词,Adverb)。

关键标注规则

[编辑]

语法缩写:

DEF.ART = 定冠词(Definite Article)

N = 名词(Noun),PL = 复数(Plural)

V = 动词(Verb),PST = 过去时(Past Tense)

ADV = 副词(Adverb)

语素分割符号:

连字符 - 分隔语素(如 cat-s)。

不可分割的语素(如 mouse)无需连字符。

功能说明 定冠词(DEF.ART):标记特定指称(“the cats” 指特定的猫)。

复数标记(-s):表明名词为复数形式。

过去时标记(-d):表明动作发生在过去。

副词化后缀(-ly):将形容词转换为副词(quick → quickly)。

参考资料

[编辑]