GOAnnotator:将蛋白质基因注释与文本证据联系起来

上一篇 / 下一篇  2008-02-12 15:20:45 / 个人分类:生物信息文本挖掘

利用基因本体的术语给蛋白质进行注释是一项复杂的工作,手工GO注释准确但费时,因此人们提出了利用文本挖掘系统抽取出相关文本自动进行注释。Daraselia N等提出了一种利用文本挖掘中相似度计算的方法,将本体中原有的未经处理的文字与从文献中抽取出来的文本连接起来。文本的选择基于该文本与未合成文本中术语的相似度,除了将未合成的注释具体化,被抽取的文本也产生了新的注释。另外,该方法利用GO的分类体系达到较高的精度。我们的方法被集成到了GOAnnotator,这是一个辅助UniPort蛋白质GO注释合成过程的工具。结论:GO合成器登录GOAnnotator输入66个带有未合成注释的蛋白质,GOAnnotator提供正确率达到93%的正确证据文本。这种高精度的结果主要是由于利用了GO分类体系来选择与来自GOA中未合成的注释的GO术语相类似的GO术语。我们的方法是第一个达到高精度的,急需得到GO合成器的有效支持。GOAnnotator已经作为万维网上的工具免费使用:http://xldb.di.fc.ul.pt/rebil/tools/goa/

   Couto FM, Silva MJ, Lee V, Dimmer E, Camon E, Apweiler R,Kirsch H, Rebholz-Schuhmann D.

 GOAnnotator: linking protein GO annotations to evidence text.J Biomed Discov Collab. 20061:19.


TAG:

 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

日历

« 2008-11-26  
      1
2345678
9101112131415
16171819202122
23242526272829
30      

数据统计

  • 访问量: 913
  • 日志数: 13
  • 图片数: 1
  • 建立时间: 2006-11-05
  • 更新时间: 2008-02-12

RSS订阅

Open Toolbar