星火AI
首页 灵感 学院 工具 投稿
首页 / AI资讯 / 正文详情 返回列表

AI新突破!NA-MPNN统一模型:从RNA设计到DNA结合预测,一键搞定

jasper
📰 资讯 2025-12-02
12 阅读

引言:核酸逆折叠的“统一大业”

想象一下,你是个生物信息学开发者,每天面对RNA序列设计和蛋白质-DNA结合预测这两个“老冤家”,得用不同工具来回切换,头都大了。现在,华盛顿大学大卫·贝克团队(就是那个ProteinMPNN的幕后大佬)出手了,他们推出了NA-MPNN——一个深度学习统一模型,号称能协同解决这两类问题,简直像给核酸世界装上了“瑞士军刀”!

什么是NA-MPNN?

NA-MPNN全称核酸消息传递神经网络,基于团队之前爆火的ProteinMPNN扩展而来。简单说,它把蛋白质、DNA和RNA都塞进一个统一的生物聚合物图里,节点可以是蛋白质残基或核酸碱基,连接方式覆盖蛋白质-蛋白质、核酸-核酸和蛋白质-核酸三类。这就像给不同生物分子发了张“通用身份证”,让模型能联合训练异构数据集,利用更大规模数据提升性能。

关键创新点:
– **统一表示**:用one-hot编码区分聚合物类型(蛋白质/DNA/RNA),取代零值初始化。
– **token扩展**:核酸碱基的脱氧核糖和核糖形式共享token(如DA/A),促进DNA与RNA间的交叉学习,实验显示这提升了序列恢复率。

模型怎么工作?

NA-MPNN训练了两种任务专用模型:设计模型(用于骨架约束序列设计)和特异性模型(用于固定对接蛋白质-DNA结合偏好)。两者都采用逐位置交叉熵优化,但监督目标不同——设计模型瞄着晶体学序列,特异性模型则盯着经验位置概率矩阵。

有趣的是,尽管架构统一,团队没搞“一刀切”,而是让模型根据任务自适应,这避免了过拟合,就像给AI装了“任务切换键”。论文地址:https://www.biorxiv.org/content/10.1101/2025.10.03.679414v2,开发者们快去围观!

效果如何?

**RNA序列设计**:NA-MPNN在给定RNA结构时,能稳定恢复60.5%的天然碱基身份。用RibonanzaNet和AlphaFold 3预测生成序列的结构,结果比gRNAde和RhoDesign更接近输入结构——这简直是“结构复刻大师”!

**蛋白质-DNA结合预测**:在固定对接任务中,NA-MPNN达到顶尖精度,仅凭骨架坐标(忽略蛋白质侧链)就比DeepPBS显著降低误差。这种侧链无关的建模方式,避免了数据泄露,为DNA结合蛋白设计提供了严格筛选方案,省了计算开销,开发者们可以偷着乐了。

更酷的是,NA-MPNN还能与扩散模型RFDpoly结合,从头设计出经电子显微镜验证的RNA和蛋白质-DNA复合物,展示了在实际工程工作流中的实用价值。

未来展望

团队预计NA-MPNN将成为转录因子研发的“标配”,实现快速、结构感知的特异性筛选。对于开发者来说,这意味着更高效的工具链,有望加速下一代人工RNA分子、转录因子和基因组工程工具的创制。

总之,NA-MPNN不仅拓展了应用边界,还让核酸逆折叠问题变得“优雅”起来——用一个模型解决多个任务,这才是AI该有的样子!

分享到:
🔒

登录后参与讨论

加入社区,与大家分享您的独特见解。

立即登录