数学论文 | 力学论文 | 化学论文 | 信息科学论文 | 物理学论文 | 农学论文 | 林学论文 | 药学论文 | 天文学论文 | 生物学论文 | 水产学论文 | 核科学论文 | 中医中药学论文
管理学论文 | 经济学论文 | 教育学论文 | 地球科学论文 | 畜牧兽医论文 | 基础医学论文 | 临床医学论文 | 医学卫生论文 | 工程学科论文 | 测绘科学论文 | 军事特种医学论文
材料学论文 | 矿山工程论文 | 化学工程论文 | 纺织科学论文 | 食品科学论文 | 体育科学论文 | 水利工程论文 | 环境科学论文 | 安全科学论文 | 能源科学论文 | 机械工程论文
电子通信自动控制论文 | 计算机科学论文 | 冶金工程技术论文 | 动力电气工程论文 | 土木建筑工程论文 | 交通运输工程论文 | 航空航天科学论文 | 图书馆情报文献学论文
  当前位置:免费论文首页 >> 计算机科学论文 >> 正文

基于集成学习方法识别导致人类疾病的遗传变异

论文发布时间:[2010-04-01]    范文大全    编辑:Voive.net

所有作者:吴佳欣 张望舒 江瑞

作者单位:清华大学自动化系

论文摘要:随着生物医学研究的加速发展,识别与人类遗传疾病相关的遗传变异因素成为生物信息学中的一个热点。作为一类重要的遗传变异,发生在蛋白质编码区的非同义核苷酸多态性(Nonsynonymous single nucleotide polymorphisms, nsSNPs)将直接改变蛋白质序列并影响其功能,最终导致遗传疾病的发生。因此,用机器学习的方法识别致病非同义核苷酸多态性将有助于人们理解人类疾病的遗传学基础,从而对这些疾病的预防、诊断、治疗起到一定的促进作用。文章把致病非同义核苷酸多态性的识别问题建模为二值分类问题。基于从蛋白质序列中提取的26维特征,文章比较了5种常见的集成学习方法(AdaBoost、LogitBoost、随机森林、L2boosting算法和随机梯度回归算法)和两种传统分类方法(决策树、支持向量机)在这一分类问题中的性能。结果表明,基于集成学习方法的机器学习方法可以更有效地识别致病非同义核苷酸多态性,其中又以LogitBoost的性能最佳。

关键词: 非同义单核苷酸多态性 二值分类 集成学习

免费下载《基于集成学习方法识别导致人类疾病的遗传变异》PDF全文(已停止下载)
  本站“论文下载”文章收集整理于“中国科技论文在线”,由于各种原因,本站已暂停论文下载!请前往“中国科技论文在线http://www.paper.edu.cn/”免费下载!

〖返回计算机科学论文列表〗

下一篇:基于代理重加密的多接收者加密方案的应用