POTFlow:基于生成模型和实验验证的胶质母细胞瘤靶向肽设计新框架
本研究针对胶质母细胞瘤(GBM)治疗需求,提出了一个名为POTFlow的干湿结合框架,用于生成和优化靶向潜在靶点ATP5A的治疗性肽。该框架首创了先导肽条件化生成模型,利用二级结构作为几何约束,并通过最优传输理论优化生成路径,有效降低了从头设计的组合复杂度。与五种主流方法相比,POTFlow取得了最优性能。在GBM患者来源的异种移植模型中,其生成的肽能选择性抑制细胞活力并显著延长生存期,展示了作为通用治疗性肽设计框架的潜力。
今日速览 · AI 导读
自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。
AI 导读
今日看点(自动摘要):q-bio: POTFlow:基于生成模型和实验验证的胶质母细胞瘤靶向肽设计新框架;q-bio: 混合隐空间模型揭示脑连接组中连续与离散变异源;q-bio: CONFIDE:提升蛋白质结构预测可靠性的幻觉评估新框架
数据源:arXiv 官方 RSS(physics / math / cs / q-bio / econ / astro-ph 等)。
标题与摘要由 DeepSeek 进行中文润色,便于快速浏览;外链跳转至原文。
AI 速览助手:点击卡片“速览全文”可拉取 arXiv HTML,生成全文要点并缓存;右下角悬浮按钮可随时展开/收起速览。
自动抓取:每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。
往期回顾:点击上方“往期回顾”进入日历页,按月查看每日抓取总数,并跳转到对应日期速览。
2025-12-03 共 22 条抓取,按综合热度排序
本研究针对胶质母细胞瘤(GBM)治疗需求,提出了一个名为POTFlow的干湿结合框架,用于生成和优化靶向潜在靶点ATP5A的治疗性肽。该框架首创了先导肽条件化生成模型,利用二级结构作为几何约束,并通过最优传输理论优化生成路径,有效降低了从头设计的组合复杂度。与五种主流方法相比,POTFlow取得了最优性能。在GBM患者来源的异种移植模型中,其生成的肽能选择性抑制细胞活力并显著延长生存期,展示了作为通用治疗性肽设计框架的潜力。
本研究提出一种具有混合隐空间的变分自编码器(VAE),用于联合建模脑结构连接组中的连续(如连接强度)和离散(如成像站点)变异因素。在包含5,761个连接组的大规模阿尔茨海默病数据集上,该方法以无监督方式有效解耦了变异源,其离散空间在捕获站点相关差异方面显著优于PCA和标准VAE后聚类方法。这为大规模、高维脑连接组的可解释分析提供了新工具。
本文提出了CONFIDE评估框架,通过结合能量稳定性指标pLDDT与新型拓扑评估指标CODE,显著提升了蛋白质结构预测的可靠性。CODE通过无监督分析AlphaFold3的潜在扩散嵌入来量化蛋白质折叠能量景观中的拓扑挫折,与蛋白质折叠速率的相关性达0.82,远超pLDDT的0.33。在分子胶结构预测基准测试中,CONFIDE与RMSD的斯皮尔曼相关性达到0.73,相比pLDDT提升了73.8%。该框架可广泛应用于药物设计任务,为结构生物学和药物发现提供更稳健的工具。
本研究提出EcoCast模型,旨在持续预测生物多样性与气候风险。该模型整合多源卫星影像、气候数据和公民科学观测记录,利用基于序列的Transformer架构捕捉时空环境依赖性,以预测物种分布的近期(月度至季节性)变化。初步在非洲的试点研究表明,相较于随机森林基线模型,EcoCast在预测选定鸟类物种分布方面展现出更优性能。该模型通过支持持续学习,为未来整合新数据流进行业务化部署奠定了基础,有望为制定有针对性的保护政策提供数据驱动的决策支持。
本研究针对大规模基因组数据下,结合化石信息进行进化分歧时间估计时面临的计算成本高、对化石校准不确定性敏感的问题,提出了两种基于调整成对似然(APW)的快速替代方法。该方法通过渐近矩匹配权重,在贝叶斯MCMC框架内更好地逼近完整似然的行为。模拟实验表明,APW方法在保持与完整似然可比估计精度的同时,对化石错位和先验误设更具鲁棒性,且计算成本降低一个数量级以上。在鸟类基因组数据集上的应用验证了其有效性与高效性。
本研究提出PRIMO框架,通过结合上下文学习与测试时训练,仅需少量实验数据即可准确预测蛋白质适应性。该框架将序列信息、零样本预测及稀疏实验标签统一编码,在大规模预训练后能快速适应新蛋白质与检测任务,在多种蛋白质家族与突变类型上表现优于现有基线方法。
本研究提出MolAS,一种轻量级算法选择系统,用于预测蛋白质-配体对接任务中不同算法的性能。该系统利用预训练的蛋白质-配体嵌入,通过注意力池化和浅层残差解码器,仅需数百至数千个标记复合物即可实现高效预测。在五个不同的对接基准测试中,MolAS相比单一最佳求解器(SBS)实现了高达15%的绝对性能提升,并将虚拟最佳求解器(VBS)与SBS之间的差距缩小了17-66%。分析表明,当求解器性能排名稳定且可分离时,MolAS表现优异;但在协议引发的排名层次变化下,其性能会下降。这揭示了稳健对接算法选择的主要障碍并非表征能力,而是不同姿态生成机制下求解器排名的不稳定性。MolAS既可作为实用的域内选择工具,也可作为评估算法选择可行性的诊断工具。
本文提出,大脑新皮层与小脑虽结构相对统一,但通过构建预测性世界模型并利用预测误差学习,实现了从感知理解到运动生成等多样化功能。研究发现,基于注意力的AI系统也独立地采用了类似的学习范式和基于世界模型的计算,这表明预测与生成世界模型构成了生物与人工系统实现高级智能的共同核心计算基础。该理论洞见架起了神经科学与AI之间的桥梁。
研究团队推出了scCluBench,一个用于评估单细胞RNA测序(scRNA-seq)聚类算法的综合性基准平台。该平台整合了36个经过统一处理的多样化数据集,并系统评估了包括传统方法、深度学习、图算法及生物基础模型在内的多种聚类技术。通过核心性能指标、可视化分析及下游生物任务(如标志基因识别)的验证,scCluBench揭示了不同模型在鲁棒性、可扩展性及实际应用边界上的差异,为研究人员选择合适方法提供了标准化依据。
本研究针对具有历史依赖性的非马尔可夫生化反应网络,开发了高效的随机模拟算法。方法将“下一反应方法”和“τ-跳跃方法”推广至支持任意事件间隔时间分布,并引入耦合方案生成精确样本路径。这为基于模拟的贝叶斯推断带来了高达两个数量级的效率提升,显著扩展了非马尔可夫模型在系统生物学等领域的实际应用。
本研究针对心血管系统中的合成分子通信应用,提出了一个涵盖复杂血管网络拓扑结构的全新信道模型。该模型描述了信号分子(如超顺磁性氧化铁纳米颗粒)在血管中的对流、扩散及吸附/解吸附过程,并引入了平面线圈感应传感器作为接收器模型,实现了端到端的实验验证。研究还借鉴无线通信中的多径传播概念,提出了分子延迟和多径扩展两个新指标,定量揭示了血管网络结构如何通过影响分子色散来最终决定接收端的信噪比。该框架为心血管系统中的传感器优化布局及特定信噪比要求的测试平台设计提供了理论依据。
本研究将分子捕获的二项式模型扩展到一般基因调控网络,揭示了不完美的单细胞分子检测如何重塑观测到的分子计数时间统计量。研究发现,在转录因子丰度较高或启动子状态转换时间尺度显著区别于其他反应时,技术噪声会导致观测到的基因产物平均爆发大小减小,并使转录因子结合反应显得更快。这些效应可被理解为对动力学速率的部分重正化,为解释嘈杂的单细胞测量提供了系统性基础。
本研究通过大规模基准测试,评估了超过34万种空间与非线性的EEG分类算法组合,用于解码脑电图中的心理指令。研究发现,协方差切空间投影和共空间模式平均准确率最高,但效果高度依赖数据集和个体,非线性方法对特定个体更优。结果表明,不存在适用于所有用户或数据集的通用方法,未来实用BCI系统需能自动适应个体神经生理差异。
针对耐药性癫痫的立体脑电图检测难题,本研究提出Seizure-NGCLNet框架。该方法通过中心性指标引导的自适应图增强策略构建脑网络,并采用全局图级与局部节点-图级双重对比学习,有效编码发作间期抑制与发作期传播等空间病理模式。在大规模公开数据集上的实验表明,该模型平均准确率达95.93%,其学习到的表征能清晰区分发作状态,并有助于定位致痫区。
本研究提出了一种名为LLOST的深度隐变量模型,旨在通过患者的医学影像(如CT或MRI)来预测其体细胞突变谱。模型采用点云表示病灶图像以确保成像模态不变性,并利用双变分自编码器与条件归一化流,将影像特征与突变计数信息耦合到一个共享的隐空间中。实验基于癌症影像档案库和癌症基因组档案库的泛癌数据集,验证了模型在预测特定突变计数和突变发生方面的性能,揭示了影像与突变域之间反映癌症类型的共享模式。
本研究提出了一种利用小型神经网络架构逼近经典系统发育距离函数的新方法。该方法能够学习多种分子进化模型下的距离度量,相比传统的贝叶斯或最大似然模型推断,以及近期提出的模型无关卷积/Transformer网络,具有计算开销小、可扩展性强的优势,能够高效处理大量分类群和分子特征。在适当训练数据下,其推断结果可与当前最先进方法相媲美。
本研究通过推导一个原则性的等变性误差度量,量化了模型在学习对称性时的效率。在3D分子任务(如流匹配、力场预测)上的实验表明,模型能在1千至1万步内将等变性误差降至总损失的2%以下。研究发现,学习3D旋转等变性比主预测任务更容易,其损失景观更平滑、条件更好。非等变模型在整个训练过程中的损失惩罚较小,因此除非等变模型的“效率差距”缩小,否则它们在单位GPU时间内可能获得更低的测试损失。
研究通过心理物理学范式,构建了BayesBench行为基准测试,评估了9种大语言模型在文本和图像多模态线索整合中的表现。研究发现,尽管部分模型在文本任务上准确率很高(如GPT-5 Mini),但在整合视觉线索时效率低下,未能展现出接近最优的贝叶斯策略。研究揭示了模型能力与底层计算策略之间的关键分离,表明仅关注准确率的基准测试可能高估了模型处理不确定性的鲁棒性。
本文设计了一种便携、低成本的数据记录系统,可同时测量呼出气体中的多种关键参数(如特定气体成分和双向潮气质量流量)。该系统通过整合这些相互关联的呼吸生物标志物,提供对呼吸系统状态的协同视图,有望成为一套新的临床生命体征。其桌面式、手持式和面罩式版本适用于不同场景,仅需患者短时呼吸即可完成检测,有助于实现多种呼吸系统疾病的早期诊断,改善预后与生活质量。
本文提出了一种个体化精准神经影像研究范式,以克服传统群体平均方法的局限。该方法通过高频次采集高质量神经影像数据、在个体自身解剖空间映射脑功能,并结合详细的行为学习指标,能够精确追踪个体在学习过程中的神经轨迹。结合fMRI与移动式近红外光谱等技术,可在更自然和长期的时间尺度上研究大脑可塑性,为理解技能学习的个性化神经机制提供了新途径。
本研究针对随机流行病模型参数估计的挑战,系统比较了两种先进的贝叶斯推断方法:伪边际粒子马尔可夫链蒙特卡洛(粒子滤波)与条件归一化流。研究在经典的SIR模型和两变种SEIR模型上评估了这两种方法,结果表明它们在处理难以处理的似然函数时,仍能提供准确且稳健的参数推断能力,有效捕捉流行病的随机动态。基于埃塞俄比亚队列研究的应用进一步验证了方法在真实世界噪声和不规则数据采样下的操作稳健性。
本文系统回顾了高阶信息理论在计算神经科学中的应用,旨在弥合统计度量与认知机制之间的解释鸿沟。作者将多元依赖性分解为相互作用强度和冗余-协同平衡两个独立维度,并论证了协同整合与冗余广播的平衡分层可优化多尺度复杂性,形式化了计算与通信的权衡。文章进一步探讨了部分信息分解在神经数据分析中的实用考量,并将冗余-协同平衡的数学特性逐步嵌入现实约束,从小型合成系统扩展到神经影像数据,以连接其与认知功能的关系。