指代消解综述

研究综述

第36卷

V01.36

第8期

No.8

计算机工程

ComputerEngineering

文章编号tlIloo—342s(2010)08—帅33..04

2010年4月

April2010

博士论文

文献标识码:A

中圈分类号。TP391

指代消解综述

孔芳u。周目栋1,2朱巧孵1,2t钱培德1’2

(1.苏州大学计算机科学与技术学院,苏州215006;2.江苏省计算机信息处理技术重点实验室,苏州215006)

擅要:给出指代消解的基本概念,从指代消解的语料资源、评测系统和算法3个方面出发,介绍指代消解的国内外研究现状,分析制约

指代消解的3个关键问题:结构化句法信息的自动获取和表示,深层次语义信息的自动获取和使用,跨文本指代消解,基于分析结果给出国际上指代消解的研究趋势。

关健词:自然语言处理;指代消解;信息抽取

一J1

“1~

Survey011UoreI-erence

KONGFangL2,ZHOUGuo.dongL2,ZHU

ResOlution

Pei-del’2

- ‘

Qiao.ruingt,z,QIAN

(1.SchoolofCompumrScienceandTechnology.SoochowUniversity,Suzhou215006;

2.KeyLabofComputerInformationProcessingTechnologyofJiangsuProvince,Suzhou215006)

[Abstract]This

aspects:corpus

capture

paper

interpretstheconceptsofmeasures

coreference

resolution,andintroducesthe

algorithms.Itanalyzes

the

state-of-the—artsincoreferenceresolutionfromthree

resources,evaluation

andresolution

criticalproblemsofcoreferenceresolution:automatic

and

presentation

on

ofstructured

syntacticknowledge,automaticcapture

andusageofunderlyingsemantic,cross-documentcoreference

resolution.Basedthe

analysis.itexploresitsinternationalresearchtrend.

[KeywordsInaturelanguageprocessing;coreferenceresolution;informationextraction

1概述

随着计算机技术和互联网的迅速发展,人们步入了信息时代,各种信息呈爆炸式增长。人们在享受其提供的便利的同时,也面临着如何从海量信息中寻找自己所需内容的困境。在这一背景下,信息抽取的需求日益紧迫。指代是一种常见的语言现象,是信息抽取不可或缺的组成部分。在信息抽取中,用户关心的事件和实体问语义关系往往散布于文本的不同位置,涉及的实体通常可以有多种不同的表达方式,为了更准确且没有遗漏地从文本中抽取相关信息,必须对文章中的指代现象进行消解。

指代消解在信息抽取中起着重要作用,在自然语言接I:1、机器翻译、文本摘要和问答系统等应甩以及篇章理解中也很关键。通常,相同信息会在同一文本中出现若干次,为了保证文本的简练、减少冗余,文本的概念关联性往往通过指代关系来刻画。因此,有必要把这些指代互相联系起来,实现

的关键技术。

英语中指代有多种类型,常见的包括:

、(1)人称代词(pronoun)指代,例如:Computational

Hngu妇acsfromdifferentcountriesattendedthetookextensivenote.

tutorial.砌唧

(2)别名(namealias)指代,例如:MicrosoftD巾.

announcedits

new

CE0yesterday.Microsoftsaid...

Caesa‘the

(3)同位语(apposition)指代,例如:Julius

well-knownemperor,wasbornin100BC.

(4)有定名词短语(definite

Computationallinguistics

phrase)指代,例如:

fromdifferentcountriesattended

noun

noun

thetutorial.Theparticipantstookextensivenote.

(5)指示名词短语(demonstrative

Boordawantsship

to

to

phrase)指代,例如:

on

limitthetotalnumberofsailorsthearsenal

between50and60.Currently,thisshit,haveabout90

sailors.

相关信息的融合,以获得相应信息在该文本中的完整描述。

(6)谓词别名(predicatenominal)指代,例如:GeorgewBushisthepresidentoftheUnitedStates.

(7)其他名词短语(bare

ofaluminum

noun

2指代消解的基本概念

指代是一种常见的语言现象,广泛存在于自然语言的各种表达中。一般情况下,指代分为2种:回指(也称指示性指代)和共指(也称同指)。回指是指当前的照应语与上文出现的词、短语或句子(句群)存在密切的语义关联性,指代依存于上下文语义中,在不同的语言环境中可能指代不同的实体,具有非对称性和非传递性;共指主要是指2个名词(包括代名词、名词短语)指向真实世界中的同一参照体,这种指代脱离上下文仍然成立。回指和共指存在很大的交集,又不互相包含,目前指代消解研究主要侧重于等价关系,只考虑2个词或短语是否指示现实世界中同一实体的问题,即共指消解。本文对指代和共指并不加以严格的区分,主要讨论共指消解

phrase)指代,例如:The

price

sidinghassteadilyincreased,asthemarketfor

基金项目:国家“863”计划基金资助项EI(2006AA012147);国家自

然科学基金资助项目(60673041,60873150);高等学校博士学科点专项科研基金资助项I目(20060285008,200802850006);江苏省高校自然科学基础研究基金资助重大项目(08KJA520002);江苏省高校自然科学基础研究基金资助项I;t(08KJD520010);江苏省自然基金基础研究计划基金资助项目(BK2008160);苏州市软件专项基金资助项目(SGR

0807)

作者倚介:孔芳(1977--),女,博士研究生,主研方向:自然语言

处理;周国栋、朱巧明、钱培德,教授、博士生导师

投稿日期:2009一11-10

E-mall:kongfang@suda.edu.cn

一33—

万方数据

Word文档免费下载Word文档免费下载:指代消解综述 (共4页,当前第1页)

指代消解综述相关文档

最新文档

返回顶部