基于树核函数的“it”待消解项识别研究

该文在基于特征的英文代词指代消解平台上,使用复合核函数,研究指代消解中待消解项"it"的识别问题。围绕"it"是否是待消解项,该文采取有效策略获得"it"句法结构信息与平面特征信息,并将它们结合起来生成"it"待消解项分类器。在测试分类器性能的同时,将其运用到代词指代消解中以检验它对指代消解的作用。最后在ACE2003基准语料上实验表明采用复合核生成的分类器具有较高的

第2 4卷第 5期 21 0 0年 9月

中文信息学报 J OU RNAL OF CHI NES NF E I oRM ATI oN ROCES I P S NG

Vo.2 1 4,N o. 5 Se,2 0 p. 01

文章编号: 0 30 7 ( 0 0 0—0 40 1 0—0 7 2 1 ) 50 2—7

基于树核函数的“t待消解项识别研究 i” 陈九昌,芳,巧明,国栋孔朱周 (.州大学计算机科学与技术学院,苏苏州 250; 1苏江 10 6 2江苏省计算机信息处理技术重点实验室,苏苏州 2 5 0 ) .江 1 0 6摘要:该文在基于特征的英文代词指代消解平台上,用复合核函数,究指代消解中待消解项“t的识别问使研 i”

题。围绕…’否是待消解项,文采取有效策略获得“t句法结构信息与平面特征信息,将它们结合起来生成 i是 t该 i”并 …t待消解项分类器。在测试分类器性能的同时,其运用到代词指代消解中以检验它对指代消解的作用。最后 i’将在 AC 2 0基准语料上实验表明采用复合核生成的分类器具有较高的准确率,能显著提高代词指代消解性能。 E 03并 关键词:消解项识别;合核;待复指代消解 中图分类号:TP3 1 9文献标识码:A

De e t o f Re e e t a t t c i n o f r n i lI i r f r n e Re o u i n Ba e n Tr e Ke n l n Co e e e c s l to s d o e r e CHEN ic n Ju ha g,K0NG n Fa g。ZHU a mig。ZHOU o o g Qio n Gu d n ( .S h o fCo u e ce c n c n l g,S o h w i e st,Su h u,Ja g u 2 5 0 Ch n: 1 c o lo mp t rS in e a d Te h o o y o c o Un v r iy zo in s 1 0 6, i a 2 in s o i ca y L b r t r f mp t rI f r t n Pr c s i g Te h o o y .Ja g u Pr vn il Ke a o a o y o Co u e n o ma i o e sn c n l g,S z o o u h u,Ja g u 2 5 0 Ch n ) in s 1 0 6, i a Absr t

tac:T h spa e r s nt n au om a i ppr c sng Co po ie K e ne fSV M o de e m i i g whe he i p r p e e sa t tca oa h u i m s t r lo t tr nn t r“i’ n t’i txtr fr o a pr c dig n e ee s t e e n oun p a e o s i t a on—e e e ili he p a f r o e t e— s d Eng ih p o un hr s r i ns e d n— f r nta n t l to m ff a ur— r ba e ls r no c eee er s ui or f r nc e ol ton. W e e r c tuc ur n or a i nd plne f a ur i o mato a ou”t” i de o c xt a t s r t e i f m ton a a e t e nf r in b t i n or r t on— s r c n a a t u ta n pho iiy fle . W e e a i e t ror a eoft it rb ntod ig i i o t r no o e e e e rct it r x m n hepe f m nc he fle y i r ucn t nt he p o un c r f r ne r s u i as e ol ton t k. Evaua i he A CE20 b nc m a k c r us s ow s h he fle c i v s t ghe t p r o m— l ton on t 03 e h r o p h t att it r a h e e he hi s e f r

a c y u i g Co p s t r e n h r n u o e e e e e o u i n i i r v d b m p o ig t e f t r n e b sn m o ie Ke n la d t e p o o n c r f r n e r s l to s mp o e y e l y n h i e . l K e r s:a p y wo d na horc t t r i ton; c p ie ke ne;c e e e e r s l in iiy de e m na i om ost r l or f r nc e o uto

语言信息处理和信息抽取等诸多运用中都涉及到指

1引言 指代是指在篇章中用一个指代词回指某个以前

代消解问题。 待消解项识别是

判断指代词是否指向某个语言 单位,否需要消解的过程,是指代消解研究的重是它

说过的语言单位。在语言学中,指代词称为照应语, 所指的对象或内容称为先行语。指代消解就是确定 照应语和先行语之间相互关系的过程,是自然语它

点问题之一。S o a o ty n v等详细论述了影响指代消解性能的三个因素,中第三个因素就是待消解其 项的识别 ( a h r i tr n t n,指出加 An p o i t Deemiai )他 cy o

言处理的关键问题之一。在文本摘要、器翻译、机多

入待消解项识别可以减少错误的消解元素 ( o e一 C rf

收稿日期:2 0— 9 2定稿日期:2 0 1 8 0 9 0—2 0 9 1 1

基金项目:国家自然科学基金资助项目( 0 7 0 1;等学校博士学科点专项科研基金资助项目 ( 0 8 2 5 0 6;苏 6 63 4 )高 2 0 0 80 0 )江省高校自然科学重大基础研究项目( 8 J 5 0 0 )江苏省高校自然科学基础研究项目( 8 D 2 0 0;州市软件专项资 0 K A 20 2; 0 KJ 5 0 1 )苏 助项目( GR0 0 ) S 8 7

作者简介:几昌 (9 4 )男,士,究方向为自然语言处理;芳 (9 7 )女,士,究方向为自然语言处理;陈 1 8,硕研孔 1 7,博研朱

巧明(93 )男,授,导,究方向为中文信息处理、 16一,教博研网络挖掘。

基于树核函数的“it”待消解项识别研究

Word文档免费下载Word文档免费下载:基于树核函数的“it”待消解项识别研究 (共1页,当前第1页)

基于树核函数的“it”待消解项识别研究相关文档

最新文档

返回顶部