今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

定量生物学

2026-04-08 04-08 15:40

今日q-bio领域热点显示,研究正从数据生成与模型构建,向模型评估、理论统一及跨学科应用深化。

  • 模型评估与泛化挑战:研究系统评估了免疫治疗转录组预测模型,发现其跨队列泛化能力有限,生物标志物信号不一致,凸显了提升模型稳健性与生物学可解释性的迫切需求。
  • 基础模型与基准构建:针对钙成像与基因组序列,分别提出了首个自监督基础模型CalM和多个评估大语言模型(LLMs)的基准(GenomeQA, PhageBench),旨在为特定模态数据建立强大的预训练框架和诊断工具。
  • 理论框架的统一与拓展:数学演化理论为复制子系统提供了统一框架,另一研究则解决了种群动力学中世代与物理时间的“双时钟”难题,推动了理论模型的完善与实际应用。
  • 跨尺度与多模态分析:研究利用分层网格Transformer统一处理脑成像的体素与表面网格,并通过图论框架量化气候变化下的物种迁移,展示了复杂系统分析中整合结构与动力学的重要性。
  • 方法学创新解决实际问题:针对医疗事件序列建模中的类别不平衡问题,提出了改进的Transformer Hawkes过程;针对大规模分层贝叶斯模型推断,开发了稳定的组合摊销推理方法,提升了计算效率与稳定性。
  • 对当前范式的批判性思考:有观点指出,脑疾病生物标志物研究过度依赖患者-对照比较,忽视了脑特征的“简并性”,主张利用多模态纵向数据指导更精确的疾病亚型分组。

2026-04-08 速览 · 定量生物学

2026-04-08 共 15 条抓取,按综合热度排序

← 返回日历
q-bio 04-08 00:00

CalM:首个基于钙成像神经信号的自监督基础模型

本研究提出了CalM,一个专门针对神经元钙成像信号的自监督基础模型。其核心是一个预训练框架,包含一个高性能的“分词器”,可将单神经元钙信号映射到共享的离散词汇表,以及一个双轴自回归Transformer,能同时建模神经轴和时间轴上的依赖关系。在大规模、多动物、多会话数据集上的评估表明,CalM在神经群体动态预测任务上超越了专门的基线模型。通过添加任务特定头部,CalM可适配到行为解码等下游任务,并取得了优于监督模型的性能。该模型为基于钙信号的功能神经分析提供了可扩展的预训练新范式。

钙成像基础模型自监督学习神经解码transformer群体动态
q-bio 04-08 00:00

下一代测序质量控制的特征表示研究:一个包含37,491个样本的不平衡数据集

本研究提出了一个用于开发下一代测序(NGS)自动化质量控制工具的新数据集。该数据集包含37,491个人类和鼠类样本,并提供了两种质量相关特征表示:来自质量控制工具的34个特征(QC-34),以及基于ENCODE问题基因组区域读数计数的可变数量特征(BL,8至1,183个)。所有样本均带有源自自动化流程和领域专家的二元质量标签(低质量样本占3.2%)。监督机器学习算法能准确预测质量标签,验证了所提供特征的相关性。该数据集使研究人员能够系统比较不同特征类型(QC-34 vs. BL)和粒度对质量问题检测效果的影响。

下一代测序质量控制机器学习生物信息学不平衡数据集特征工程
q-bio 04-08 00:00

免疫治疗转录组预测模型跨队列泛化能力有限

本研究系统评估了九种基于转录组学的免疫检查点抑制剂(ICI)疗效预测模型(包括五种基于bulk RNA-seq和四种基于单细胞RNA-seq的模型)在独立数据集上的表现。结果显示,bulk RNA-seq模型在多数队列中预测性能接近随机水平,而单细胞模型仅略有提升。通路分析表明,不同模型识别的生物标志物信号稀疏且不一致,缺乏可重复的生物学重叠。这些发现凸显了当前模型在跨队列稳健性和生物学一致性方面的局限,强调了改进领域适应、标准化预处理和基于生物学的模型设计的必要性。

免疫治疗预测模型转录组学泛化能力生物标志物单细胞测序
q-bio 04-08 00:00

复制子系统动力学:从种群方程到准物种模型的数学演化理论

本章为复制子系统的数学理论提供了统一框架,旨在形式化广义达尔文主义下的演化过程。从描述相互作用种群的Kolmogorov方程出发,推导出复制子方程,并分析了独立复制、自催化复制和超循环复制三种典型机制。研究表明,超循环具有持久性并能内在地携带演化变异。随后,文章综述了准物种框架(Eigen模型和Crow-Kimura模型),涵盖了平衡点的全局稳定性、序列空间结构以及误差阈值现象。重点在于揭示这些模型背后的数学结构,使其能够应用于分子生物学之外的抽象演化动力学。

演化动力学复制子方程准物种模型数学建模超循环误差阈值
q-bio 04-08 00:00

GenomeQA:评估通用大语言模型在基因组序列理解中的表现

研究团队提出了GenomeQA基准测试,旨在评估通用大语言模型(LLMs)在原始基因组序列推理任务中的能力。该基准包含5200个样本,序列长度从6到1000个碱基对不等,涵盖增强子/启动子识别、剪接位点识别、物种分类等六大任务家族。研究发现,前沿LLMs能有效利用GC含量、短基序等局部序列信号,但在需要间接或多步推理的任务上表现下降。该工作为改进LLMs在基因组学中的应用提供了诊断工具。

基因组学大语言模型基准测试序列分析生物信息学
q-bio 04-08 00:00

自设计AI进化数学理论:揭示AI演化与欺骗风险

本文为通过递归自我改进产生的AI系统建立了一个进化数学模型。与生物DNA随机突变不同,AI后代的“设计”是高度定向的。模型将随机突变替换为可能的AI程序的有向树,当前程序决定其后代的设计,而人类通过分配有限计算资源的“适应度函数”保留部分控制权。研究表明,进化动态不仅反映当前适应度,还反映后代谱系的长期增长潜力。在没有额外假设的情况下,适应度未必随时间增加。然而,假设适应度有界且任何AI以固定概率复制自身的“锁定”副本,则适应度会集中在可达到的最大值。文章探讨了这对AI对齐的影响,特别是在适应度与人类效用不完全相关的情况下。在一个加性模型中,如果欺骗能带来超越真实效用的适应度,进化将选择欺骗。如果繁殖基于纯粹的客观标准而非人类判断,这种风险可能得到缓解。

ai进化数学模型自我设计ai对齐欺骗风险演化动力学
q-bio 04-08 00:00

分层网格Transformer:拓扑引导预训练实现脑结构形态学分析

本研究提出了一种用于异质脑成像网格分析的分层Transformer框架。该模型通过基于任意阶单纯复形构建的空间自适应树分区,统一处理体素和表面网格,无需针对特定拓扑结构进行修改。其核心创新在于一个特征投影模块,可将不同长度的顶点级形态学描述符(如皮层厚度、曲率)映射到空间层次结构中,从而将几何结构与特征维度分离。通过在大规模未标记数据上对坐标和形态学通道进行掩码重建的自监督预训练,模型获得了可迁移的编码器主干。在ADNI的阿尔茨海默病分类、淀粉样蛋白负荷预测以及MELD数据集局灶性皮质发育不良检测任务上,该方法均取得了最先进的性能。

脑成像分析transformer模型网格数据处理自监督学习形态测量学神经影像
q-bio 04-08 00:00

图论框架揭示气候变化下物种定向迁移与网络拓扑的相互作用

本研究开发了一个基于图论的反应-扩散-平流框架,以量化环境梯度驱动的物种定向迁移。研究发现,平流(定向迁移)会引导个体向最优生态位(通常对应网络中的高入度节点)聚集,形成种群热点,但也增加了局部灭绝风险。扩散虽能促进种群在整个网络中的持续存在,但生态廊道的丧失会破坏网络内的定向流动,迫使物种扩散至次优斑块。该框架揭示了定向迁移与网络拓扑结构如何共同决定物种的再分布、热点形成及环境变化下的灭绝风险。

物种分布模型图论框架定向迁移网络拓扑气候变化种群动态
q-bio 04-08 00:00

PhageBench:首个评估大语言模型理解原始噬菌体基因组能力的基准

研究团队提出了首个评估大语言模型(LLMs)理解原始噬菌体基因组能力的基准PhageBench。该基准包含5600个高质量样本,覆盖筛选、质量控制、表型注释三个阶段的五个核心任务,旨在模拟生物信息学专家的工作流程。评估发现,通用推理模型在噬菌体序列识别和宿主预测任务上显著优于随机基线,显示出基因组理解的潜力。然而,在涉及长程依赖和细粒度功能定位的复杂推理任务中,模型仍存在明显局限。这凸显了开发具备更强推理能力的下一代生物序列模型的必要性。

噬菌体基因组大语言模型生物信息学基准测试序列理解
q-bio 04-08 00:00

基于Transformer Hawkes过程的患者护理轨迹建模

本研究提出了一种结合Transformer与霍克斯过程的模型,用于建模患者不规则的医疗事件序列(如门诊、住院、急诊)。模型通过Transformer编码历史事件,利用霍克斯过程捕捉事件间依赖关系,联合预测未来事件类型与发生时间。针对医疗数据中严重的类别不平衡问题,作者引入了基于逆平方根类权重的训练策略,在不改变数据分布的前提下,提升了对罕见但临床重要事件的识别能力。在真实数据上的实验表明,该模型性能优越,为识别高风险患者群体提供了有临床意义的见解。

医疗轨迹建模霍克斯过程transformer事件预测类别不平衡高风险患者识别
q-bio 04-08 00:00

解决种群动力学中的“双时钟”问题:建立世代时间与物理时间的统一桥梁

本文解决了种群动力学中长期存在的“双时钟”难题。当种群世代重叠时,以世代为单位的时间与以物理时间为单位的时间会产生分歧,这阻碍了数学模型与实际种群数据的关联。作者证明,通过一个简单的恒等式,可以在长期尺度上同步这两种时间度量。这一关键等价关系实现了世代视角与物理视角之间的直接转换。基于此,作者推导出了一个广义的欧拉-洛特卡方程,将基本繁殖数 $R_0$ 与种群增长率联系起来,并提出了一个将突变选择系数与典型个体历史相关联的恒等式。该成果在流行病学、种群生物学和微生物生长等领域具有广泛应用价值。

种群动力学世代时间欧拉-洛特卡方程基本繁殖数时间尺度数学模型
q-bio 04-08 00:00

脑疾病生物标志物研究:超越队列比较的局限

本文指出,尽管脑数据多样且AI分析算法先进,但脑特征在临床诊断和预后中应用甚少。作者认为,当前领域过度依赖患者与健康对照的队列比较来寻找生物标志物,忽视了脑特征的“简并性”(即不同脑状态可产生相同功能)。通过“脑交换”思想实验,作者论证了仅靠更多数据和更强算法不足以识别脑疾病生物标志物。文章主张,应在定义多维生物标志物前,利用多模态(如脑活动、神经递质、神经调节剂、脑成像)和纵向脑数据指导分组,以更准确地刻画疾病亚型。

脑疾病生物标志物多模态数据纵向研究简并性ai分析
q-bio 04-08 00:00

SiLVi:首个支持动物行为交互标注的开源视频标注工具

针对动物行为研究中交互检测的空白,研究者开发了开源标注软件SiLVi。该工具首次将个体定位与行为交互标注功能相结合,允许用户在视频中直接标注行为和交互,并生成适用于计算机视觉模型训练的结构化输出。SiLVi旨在连接行为生态学与计算机视觉,推动精细行为分析的自动化方法发展,其应用也可扩展至需要提取动态场景图的人类交互视频标注。

视频标注动物行为交互检测计算机视觉开源工具
q-bio 04-08 00:00

Marangoni效应调控Piezo1分布与活性:上皮细胞与癌细胞差异机制

本研究通过理论模型探讨了上皮细胞与间充质样癌细胞中机械敏感离子通道Piezo1分布与活性的差异机制。研究发现,上皮细胞中Piezo1分子在黏着斑(FAs)周围呈异质性聚集,此现象受肌动球蛋白收缩性调控,并可用Marangoni效应解释;而癌细胞中Piezo1分布均匀且活性显著更高。研究进一步分析了膜介导的分子间相互作用对Piezo1活性的影响,为细胞机械感知的物理机制提供了新见解。

细胞力学感知piezo1通道marangoni效应黏着斑癌细胞迁移理论生物物理
q-bio 04-08 00:00

基于组合摊销推理的大规模分层贝叶斯模型高效推断方法

本研究提出了一种扩展的组合分数匹配方法,通过开发新的误差阻尼估计器解决了大规模分层贝叶斯模型中摊销推理的稳定性问题。该方法在包含10万个数据点的基准测试中验证了数值稳定性,并在分层自回归模型上实现了与直接摊销推理基线相当的性能,同时计算成本显著降低。最终,该方法成功应用于包含超过75万个参数的先进显微镜大规模反演问题,展示了其在真实科学应用中的潜力。

贝叶斯推断分层模型摊销推理组合分数匹配大规模计算科学计算
AI速览助手