通过矩阵分解从生物医学文献中抽取未知的基因关系

上一篇 / 下一篇  2008-01-18 13:48:40 / 个人分类:生物信息文本挖掘

背景

构建出基于医学文献的基因相互作用网络是文本挖掘在生物信息学中最为重要的应用。从生物医学文献中抽取潜在的基因关系有助于建立生物医学假说,而假说可以通过实验进一步探索之。最近,基于奇异值分解(singular value decomposition)的潜在语义标引(latent semantic indexing)已经应用于基因检索上。然而,用于降低秩矩阵的因子K的取值仍然是一个悬而未解的问题。

结果

本文介绍了一种将基因关系的先验知识加入到LSI/SVD中来确定因子数的方法。我们还探讨了利用非负矩阵因子分解(non-negative matrix factorization NMF)通过利用已知的基因关系从生物医学文献中抽取未能识别的基因关系。基于NMF和LSI/SVD的基因检索方法现实出较好的性能。

结论

使用某个特定基因的已知的基因关系,我们确定了用于减少矩阵秩的因子数,并且采用LSI/SVD或者GR/NMF方法检索到与该基因相关的未识别的基因。


TAG:

 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

日历

« 2008-11-29  
      1
2345678
9101112131415
16171819202122
23242526272829
30      

数据统计

  • 访问量: 919
  • 日志数: 13
  • 图片数: 1
  • 建立时间: 2006-11-05
  • 更新时间: 2008-02-12

RSS订阅

Open Toolbar