Novel link prediction for large-scale miRNAlncRNA interaction network in a bipartite graph
文件大小: 1966k
源码售价: 10 个金币 积分规则     积分充值
资源说明:### 新型链接预测方法在大规模miRNA-lncRNA相互作用网络中的应用 #### 背景与意义 近年来,随着高通量测序技术的发展,科学家们能够以前所未有的精度来研究生物分子间的相互作用。其中,非编码RNA(non-coding RNA, ncRNA)作为一类不被翻译成蛋白质的RNA分子,在基因表达调控中扮演着至关重要的角色。miRNA(microRNA)和lncRNA(long non-coding RNA)是ncRNA中两个重要的子类。miRNA主要通过与mRNA结合来抑制其翻译或促进其降解,而lncRNA则通过多种机制调节基因表达,如作为miRNA的海绵来解除其对目标mRNA的抑制作用。 本研究聚焦于miRNA与lncRNA之间的相互作用,并提出了一种新的链接预测算法,旨在揭示这两种ncRNA之间的复杂关系。该方法对于理解ncRNA的生物学功能、疾病机制及开发新的治疗策略具有重要意义。 #### 目标与挑战 目前关于miRNA-lncRNA相互作用的研究数据相对有限,预测miRNA的目标lncRNA仍然是一个挑战。现有的研究表明,miRNA和lncRNA之间的相互作用模式与它们的相对表达水平密切相关,这种模式可能形成一种称为“海绵效应”的机制。此外,利用编码与非编码RNA共表达网络以及序列数据可以进一步测量miRNA和lncRNA之间的相似性。数学分析这些相似性有助于发现以下规律:(i)具有相似表达谱的lncRNA和miRNA倾向于协同相互作用;(ii)与一组共同靶基因相互作用的miRNA往往共同作用于相同的lncRNA。 #### 方法论 为了解决上述挑战,本研究开发了一种名为GBCF(Group Preference Bayesian Collaborative Filtering)的新型组偏好贝叶斯协作过滤模型。GBCF基于已知的miRNA-lncRNA相互作用网络,为每个个体miRNA或lncRNA提供一个前k概率排名列表。 - **GBCF模型**:该模型综合考虑了miRNA和lncRNA的表达谱、序列特征以及它们之间已知的相互作用信息,通过贝叶斯统计方法进行概率估计。 - **数据预处理**:收集并整合来自不同来源的大规模miRNA-lncRNA相互作用数据,包括实验验证的数据和预测得到的数据。 - **特征提取**:接着,从表达谱和序列数据中提取特征,包括但不限于表达水平、保守性等。 - **模型训练与优化**:通过调整超参数,利用交叉验证等技术对模型进行训练和优化,确保预测结果的准确性和鲁棒性。 #### 结果与验证 为了评估GBCF的有效性,研究团队采用了留一法交叉验证(leave-one-out cross validation)和k折交叉验证(k-fold cross validation)等多种方法进行了模型性能评估。结果显示,在不同的交叉验证设置下,GBCF的受试者工作特征曲线(Receiver Operating Characteristic curve, ROC curve)下的面积(Area Under the Curve, AUC)分别为0.9193、0.8354±0.0079、0.8615±0.0078和0.8928±0.0082,这表明GBCF模型不仅可靠性强而且具有较高的预测准确性。 此外,还进行了一系列比较实验,将GBCF与其他现有的预测方法进行了对比。结果显示,GBCF在大多数情况下表现出更好的预测性能。 #### 结论与展望 GBCF模型为识别特定miRNA的潜在lncRNA靶标提供了有力工具,并为进一步研究lncRNA调控网络奠定了坚实的基础。未来的工作可以继续优化模型算法,扩大训练数据集,并探索更多生物学意义,以期更好地理解ncRNA的功能及其在疾病发生发展中的作用。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。