今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

定量生物学

2026-04-23 04-23 15:28

单细胞与计算生物学研究持续深化,基础模型、多模态整合与可解释性成为焦点。

  • 基础模型整合碎片化数据:scpFormer通过Transformer架构与连续嵌入,将不同抗体面板的单细胞蛋白质组数据映射到统一语义空间,解决了数据整合难题,并支持虚拟面板扩展。
  • 多模态增强扰动预测:AROMA整合文本、图结构与序列信息,通过两阶段优化提升虚拟细胞遗传扰动预测的准确性与可解释性,在零样本与长尾场景中表现稳健。
  • 计算模型性能优化与理论探索:图论分子预测模型通过系统增强框架在基准测试中媲美深度学习;细菌代谢模型被证实可作为高效储备池计算机,其性能与动力学特性相关。
  • 技术开发强调生态与临床实用性:自动动物识别研究指出技术需与生态学目标深度结合;生物医学成像的领域自适应方法利用对照样本有效解决批次效应,提升了模型在实际应用中的鲁棒性。
  • 新兴机制与框架拓展理论边界:“能量梯度驱动无膜化学自组织”为生命起源研究提供新机制;“涌现偏倚”概念统一描述了分子进化中获得新功能的内在倾向。
  • 评估平台与创造力量化应对AI挑战:LAFA框架为蛋白质功能注释提供持续、可重复的评估平台;研究提出在生成式AI时代需通过量化框架区分人类与AI的创造力,强调独特性成为关键信号。

2026-04-23 速览 · 定量生物学

2026-04-23 共 20 条抓取,按综合热度排序

← 返回日历
q-bio 04-23 00:00

scpFormer:首个单细胞蛋白质组学基础模型,统一整合碎片化抗体面板数据

针对单细胞蛋白质组数据因靶向抗体面板碎片化而难以整合的挑战,本研究提出了scpFormer——一个基于Transformer架构的基础模型。该模型在超过3.9亿个细胞上进行预训练,摒弃了传统的索引式标记化方法,采用连续的、序列锚定的方式,结合进化尺度建模(ESM)与值感知表达嵌入,将可变抗体面板动态映射到共享语义空间。实验表明,scpFormer生成的全局细胞表征在大规模批次整合和无监督聚类中表现优异。其开放词汇架构支持虚拟面板扩展,有助于在稀疏临床数据中重建生物流形。此外,其学习到的蛋白质共表达逻辑可迁移至批量组学任务,支持如癌症药物反应预测等应用,为可扩展的生物标志物发现和精准肿瘤学提供了一个通用、面板无关的框架。

单细胞蛋白质组学基础模型数据整合transformer精准肿瘤学生物标志物
q-bio 04-23 00:00

AROMA:多模态增强推理架构提升虚拟细胞遗传扰动预测

本研究提出AROMA模型,通过整合文本证据、图拓扑信息和蛋白质序列特征,对虚拟细胞遗传扰动进行建模。采用两阶段优化策略,使预测结果兼具准确性与可解释性。研究构建了包含49.8万样本的PerturbReason数据集及两个知识图谱。实验表明,AROMA在多种细胞系上优于现有方法,并在零样本评估及知识稀疏的长尾场景中保持稳健。

虚拟细胞建模遗传扰动预测多模态学习知识图谱可解释ai生物信息学
q-bio 04-23 00:00

侧向预测编码网络响应时间优化与模块化结构优势

本研究针对侧向预测编码(LPC)网络响应速度慢的问题,提出了一种优化方法。研究发现,在保持平均预测误差(能量成本)和信号传输信息鲁棒性的前提下,LPC系统的特征响应时间可以被最小化,使其无限接近理论下限。进一步研究表明,采用模块化结构、大幅减少侧向连接数量的最优LPC网络,在特征检测性能、响应时间、能量成本和信息鲁棒性方面,与全连接网络表现同样出色。

预测编码神经网络响应时间模块化结构信息鲁棒性能量成本
q-bio 04-23 00:00

自动化动物个体识别:为何生态学目标应是核心考量

本文指出,虽然自动识别技术(如图像和声音识别)在加速动物个体追踪方面潜力巨大,但其在生态学实践中的应用仍有限。主要障碍并非算法性能不足,而是技术开发与生态数据收集、处理及使用方式之间的不匹配。作者强调,自动识别的有效性取决于具体的生态学问题、可用数据类型以及错误容忍度。未来进展需将生态学背景置于核心,确保技术不仅准确,而且具有生态学实用性、透明度和可信度。

动物个体识别生态监测自动化技术数据匹配技术应用生态学实践
q-bio 04-23 00:00

LAFA:用于蛋白质功能注释模型可重复纵向评估的框架

本研究提出了LAFA(蛋白质功能注释模型纵向评估服务器),作为一个持续性的蛋白质功能预测方法基准测试平台。它解决了现有评估(如CAFA)周期性、非连续性的局限,通过容器化方法实现对新开发模型的持续评估,并跟踪其在不断积累的蛋白质功能注释数据下的性能演变。该平台旨在加速方法迭代、支持可重复性研究,并为该领域提供更动态、细粒度的进展视图。

蛋白质功能预测基准测试平台纵向评估生物信息学可重复性研究
q-bio 04-23 00:00

生成式AI时代如何衡量创造力:区分人类与AI在人才评估中的表现

本文提出在生成式AI普及的背景下,创造力应被重新定义为一种在共同约束和竞争激励下涌现的、基于过程的分布属性。研究者引入了一个量化框架,通过在嵌入空间中衡量想法生成与转化的新颖性来操作化创造力。实证评估表明,该指标与直觉判断一致,并能捕捉表面质量评估所忽略的差异。研究发现,在AI介入的环境中,创意产出呈现双峰分布的结构性转变,这意味着在生成式AI时代,独特性而非流畅性成为衡量人类创造力的主要信号。

生成式ai创造力评估人才系统量化框架新颖性双峰分布
q-bio 04-23 00:00

图论模型预测分子性质:低成本方法在基准测试中媲美深度学习

本研究评估了基于外部活动$D(G)$和内部活动$\zeta(G)$指数的图论分子预测模型。在MoleculeNet的五个基准数据集(BACE、LogP、ESOL、SAMPL)上,基线模型平均$R^2=0.24$,泛化能力有限。通过系统增强框架(加入岭回归、额外图描述符、物理化学性质、梯度提升集成学习、Lasso特征选择及与摩根指纹的混合方法),最佳平均$R^2$提升至0.79,改进幅度达165%–274%。在相同实验条件下,增强后的经典模型在所有数据集上均匹配或优于图卷积网络,且无需GPU,训练时间不足5分钟。

图论模型分子性质预测机器学习化学信息学基准测试
q-bio 04-23 00:00

细菌代谢模型可作为高效储备池计算机:性能与动力学特性相关

本研究探索了细菌代谢模型作为物理储备池计算机的潜力。通过动态通量平衡分析模拟多种微生物的生长动态,以底物浓度为输入、生长曲线为储备状态,评估其在非线性分类任务中的性能。研究发现,多个微生物模型实现了高分类准确率,表明细菌代谢动力学支持非线性计算。不同物种间存在性能差异,揭示了收敛速度与峰值精度之间的权衡。此外,大肠杆菌单基因缺失突变体的计算能力普遍弱于野生型,表明基因缺失会降低计算所需的动力学丰富度。研究结果为识别具有优良计算特性的微生物菌株提供了初步指导。

储备池计算细菌代谢模型动态通量平衡分析非线性计算系统生物学生物计算
q-bio 04-23 00:00

外部短波信号如何影响捕食者-猎物系统的稳定性?

本研究针对一类包含Patlak-Keller-Segel型交叉扩散的拟线性二阶PDE系统,建立了完整的短波渐近展开理论。模型假设捕食者并非直接感知猎物密度,而是响应猎物产生的驱动信号,且该信号受独立外部短波场强的影响。研究在任意空间维度和种内/种间反应动力学下,构造了无限制的短波解渐近展开,并应用Kapitza倒立摆理论分析了外部信号诱导的系统稳定性变化。结果表明,特定外部信号可抑制趋向性迁移、增强物种平衡鲁棒性或模糊参数空间中稳定与不稳定区域的边界。

交叉扩散短波渐近捕食者-猎物模型稳定性分析偏微分方程系统趋向性
q-bio 04-23 00:00

序列马尔可夫合并过程的遗忘速率研究

本文研究了序列马尔可夫合并(SMC)过程及其变体SMC'在成对情况下的遗忘速率。SMC是一种马尔可夫跳跃过程,用于模拟染色体上局部谱系间的相关性,是研究连锁不平衡、血缘同源以及推断种群历史和祖先的重要理论工具。研究发现,其嵌入跳跃链在总变差距离下具有几何遍历性,并给出了显式常数;而连续过程与平稳分布的总变差距离随遗传距离 $\ell$ 以 $\asymp 1/\ell$ 的速率衰减。这些结果为文献中将远距离位点视为独立演化的启发式近似提供了理论依据。

群体遗传学马尔可夫过程遍历理论统计推断连锁不平衡
q-bio 04-23 00:00

利用对照样本实现生物医学成像的领域自适应,解决批次效应难题

生物医学成像中的批次效应是导致深度学习模型在实际应用中失效的关键问题。本文提出了一种名为CS-ARM-BN的元学习适应方法,该方法利用实验设计中普遍存在的阴性对照样本作为稳定的上下文信息进行模型适应。在用于药物发现的关键任务——作用机制分类的大规模数据集上验证,该方法成功将模型在新实验批次上的准确率从0.862提升至0.935,首次证明了元学习方法可以有效弥合领域差距。研究表明,通过基于原理的上下文适应,可以有效地中和生物成像数据中的批次效应。

批次效应元学习生物医学成像领域自适应药物发现对照样本
q-bio 04-23 00:00

新型噪声自适应注意力机制提升显微镜图像中微管分割的鲁棒性

本研究提出了一种新型的噪声自适应注意力机制,通过扩展经典的Squeeze-and-Excitation模块,使其能够动态适应显微镜图像中变化的噪声水平。该机制被集成到带有残差编码器块的U-Net解码器中,构建了轻量级高性能模型ASE_Res_UNet。研究还开发了合成数据集生成策略,确保在噪声图像中对细丝结构进行精确标注,并通过系统评估损失函数和指标来缓解类别不平衡问题。实验表明,ASE_Res_UNet在噪声合成图像中有效分割微管,性能优于其消融变体及其他注意力机制或架构的模型,且参数量更少。在真实显微镜数据集上的评估进一步验证了其有效性,并显示出对其他曲线结构(如血管和神经)的良好迁移能力。

图像分割注意力机制显微镜图像微管分割噪声自适应深度学习
q-bio 04-23 00:00

非线性循环神经网络中相关性的统计特性研究

本研究针对具有高斯淬火无序的非线性循环神经网络,在神经元数量N趋于无穷大的极限下,推导了网络相关性的统计特性的精确表达式,并包含了系统的1/N修正。研究采用路径积分方法表示网络的随机动力学,将描述简化为少数集体变量,从而实现了高效计算。该方法将先前线性网络的结果推广至包含广泛非线性激活函数的家族,这些函数在路径积分中表现为相互作用项。这些相互作用可以解决线性理论的不稳定性,并产生严格正的参与维度。研究展示了幂律激活函数的显式结果,揭示了由网络耦合控制的标度行为,并通过数值模拟验证了理论预测。

循环神经网络相关性统计路径积分非线性激活淬火无序集体动力学
q-bio 04-23 00:00

肺炎链球菌与呼吸道合胞病毒肺炎的流行病学建模研究进展

本文综述了针对肺炎链球菌(S. pneumoniae)和呼吸道合胞病毒(RSV)所致肺炎的流行病学建模最新进展。研究综合运用确定性与随机模型,以全面刻画疾病传播、疫苗效力及群体免疫的复杂性。这些模型已成为评估疫苗影响、优化免疫策略以减轻全球肺炎疾病负担的关键工具。

流行病学建模肺炎链球菌呼吸道合胞病毒疫苗评估公共卫生政策
q-bio 04-23 00:00

能量梯度驱动无膜化学自组织:生命起源前的新机制

本研究探讨了在无稳定膜边界条件下,环境能量梯度如何驱动化学物质的空间自组织。研究者构建了一个反应扩散模型,模拟在类似深海热液喷口的环境中,pH、氧化还原电位和温度耦合梯度形成的“活性景观”对化学动力学的影响。模拟显示,当梯度强度超过阈值(梯度驱动运输克服扩散和降解损失)时,反应物会自发积累、反应最大值空间对齐,并出现稳定的局域化化学态。这表明,结构化的能量景观本身即可在没有预定义隔室的情况下支持有序化学动态,为前生命化学中的耦合与持续存在提供了连续介质中的机制。

生命起源化学自组织能量梯度反应扩散模型前生命化学热液喷口
q-bio 04-23 00:00

多阶段体积排斥模型:更精确模拟细胞增殖与空间竞争

本研究开发了一种结合体积排斥、随机运动和多阶段细胞周期的随机格子智能体模型(ABM),以更真实地模拟细胞增殖的时空动态。模型引入了一种新颖的“近视”行为机制,使细胞在尝试增殖前能感知局部环境。研究通过平均场近似推导出对应的连续偏微分方程(PDE)描述,并利用数值模拟比较了不同增殖机制在生长至汇合实验和细胞侵袭行波等生物相关场景下,对群体水平动力学的影响。结果表明,多阶段框架能更好地捕捉真实细胞周期时间分布,为肿瘤生长、伤口愈合等过程提供了更精确的建模工具。

细胞增殖模型多阶段细胞周期体积排斥智能体模型偏微分方程生物模拟
q-bio 04-23 00:00

分子进化中的涌现偏倚:新功能获得的内在倾向

本文提出“涌现偏倚”这一新概念,用以描述基因序列在突变时,其分子结构本身会倾向于或阻碍其获得新功能(如启动子、增强子或从头蛋白的产生)或引发新表型的内在倾向。作者综述了先前研究中观察到的相关现象,首次将其统一归纳为“涌现偏倚”,并探讨了其潜在的分子机制。这一概念为理解进化创新(如新功能的出现)提供了一个新的框架,表明分子层面的内在偏倚可能对进化轨迹产生重要影响。

分子进化涌现偏倚进化创新新功能获得突变倾向表型演化
q-bio 04-23 00:00

DNA-CRAFT:基于条件蒙特卡洛树扩散的细胞特异性调控DNA设计框架

本研究提出DNA-CRAFT,一种结合条件离散扩散模型与蒙特卡洛树搜索的生成框架,用于设计具有高细胞类型特异性且符合生物学规律的调控DNA元件。模型首先在ENCODE数据库的320万个候选调控元件上训练,学习特定细胞类型(如增强子、启动子)的调控语法,再通过推理时的条件蒙特卡洛树引导算法,最大化目标与非目标细胞类型间的调控活性差异。在人类细胞系和免疫细胞类型的调控序列设计任务中,DNA-CRAFT在特异性与生物保真度上均优于现有扩散、自回归及基于梯度优化的方法。

调控dna设计生成模型细胞特异性蒙特卡洛树搜索离散扩散模型基因调控
q-bio 04-23 00:00

半监督GAN实现智能显微镜下的高效细胞周期分类

本研究提出一种半监督生成对抗网络(SGAN),用于在标注数据稀缺的条件下,对显微镜图像中的细胞周期阶段进行鲁棒分类。该方法结合未标注的真实图像与合成生成样本,有效缓解了标注需求,即使在未标注数据存在类别不平衡时也能保持稳定性能。在Mitocheck数据集(包含5个有丝分裂阶段)的测试中,模型仅使用每类80张标注图像和600张未标注图像,即达到$93 \pm 2\%$的分类准确率。该通用框架可通过迁移学习快速适配新的细胞系、标记方案或显微成像模式,适于集成至自动化显微镜系统,实现高效、自适应的生物图像分析。

智能显微镜半监督学习生成对抗网络细胞周期分类计算生物学图像分析
q-bio 04-23 00:00

免疫系统与溶瘤病毒相互作用的新型混合建模方法

本研究提出了一种新颖的随机智能体模型,结合离散与连续建模方法,描述溶瘤病毒、癌细胞与免疫系统之间的复杂空间相互作用。模型将智能体(细胞)的随机动力学与引导免疫细胞运动的趋化因子浓度平衡方程相耦合,并正式推导出其连续极限(偏微分方程组)。在二维空间中的系统定量比较显示,两种模型在模拟细胞波传播(如未感染增殖细胞逃离感染细胞、免疫细胞浸润肿瘤)时具有良好一致性。研究同时发现,在某些参数范围内,两种模型行为可能出现显著差异,表明随机性在动力学中扮演关键角色。结果强调,在感染未充分建立前过快的免疫反应会降低疗法疗效,提示溶瘤病毒疗法与免疫疗法联用时需审慎调控免疫应答。

溶瘤病毒疗法免疫系统建模混合离散连续模型空间动力学随机过程计算生物学
AI速览助手