星火AI
首页 灵感 学院 工具 投稿
首页 / AI资讯 / 正文详情 返回列表

贝克团队放大招:NA-MPNN统一模型,让核酸设计从“单打独斗”到“全家桶”时代

jasper
📰 资讯 2025-12-02
8 阅读

引言:核酸设计的“统一大业”来了!

朋友们,还记得那个用AI设计蛋白质的ProteinMPNN吗?现在,它的创造者大卫·贝克团队又搞事情了!他们推出了NA-MPNN,一个能同时搞定RNA序列设计和蛋白质-DNA结合特异性预测的“全能选手”。简单说,就是以前你得用不同工具处理不同核酸问题,现在一个模型全包了——这简直是生物信息学界的“瑞士军刀”啊!

什么是核酸逆折叠?让AI当“结构侦探”

想象一下,你拿到一个核酸或核酸-蛋白质复合物的3D结构(就像一张建筑蓝图),但不知道对应的序列(建筑材料清单)。核酸逆折叠就是让AI根据结构反推序列,或者预测蛋白质和DNA怎么“看对眼”。这活儿以前得靠多个专门工具,效率低还容易出错。NA-MPNN的出现,就像给侦探配了个超级大脑,能同时处理多种案件,数据多了、学得更快,应用范围也大大拓宽。

NA-MPNN:从ProteinMPNN升级的“多面手”

NA-MPNN基于ProteinMPNN的图神经网络架构,但做了关键升级:节点现在能包含蛋白质残基、DNA或RNA碱基,连接方式也支持蛋白质-蛋白质、核酸-核酸和蛋白质-核酸三类。团队还用了残基标签平滑技术,防止模型过于自信——毕竟,AI太“飘”可不好!

### 两大创新点:让模型更“聪明”

1. **初始化更精准**:每个残基节点用聚合物类型(蛋白质/DNA/RNA)的one-hot编码作为初始特征,取代了零值初始化。这就像给AI一张更清晰的地图,起步就少走弯路。
2. **token表统一化**:DNA和RNA的碱基共享token(比如DA/A代表腺嘌呤),还加了未知核酸token。这促进了交叉学习,实验证明能提升序列恢复率——AI学会举一反三了!

实战效果:RNA设计新标杆,DNA预测超精准

NA-MPNN在RNA序列设计上树立了新标准:给定结构,它能恢复60.5%的天然碱基身份,生成的序列经结构预测后,比现有工具更接近输入结构。更酷的是,它和骨架生成器RFDpoly结合,成功从头设计了经电子显微镜验证的RNA和蛋白质-DNA复合物——这可不是纸上谈兵,是实打实的工程应用!

在蛋白质-DNA结合特异性预测方面,NA-MPNN仅凭骨架坐标(忽略侧链原子),就在实验中超越了DeepPBS,降低了误差。这种侧链无关的建模方式,避免了信息泄露,为DNA结合蛋白设计提供了严格的早期筛选方案。团队预计,它将成为转录因子研发中的利器,实现快速、结构感知的特异性筛选,省去大量计算开销。

展望未来:AI驱动的核酸工程新时代

总的来说,NA-MPNN为核酸设计提供了稳健高效的工具,有望在人工RNA分子、转录因子和基因组工程中发挥广泛作用。从“单任务工具”到“统一模型”,这不仅是技术升级,更是思维变革——开发者们,准备好拥抱这个“全家桶”时代了吗?下次设计核酸时,或许只需轻点一下,NA-MPNN就能帮你搞定一切!

分享到:
🔒

登录后参与讨论

加入社区,与大家分享您的独特见解。

立即登录