今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

定量生物学

2026-04-15 04-15 15:41

今日q-bio领域研究呈现方法学创新与跨尺度整合并重的趋势,涵盖从微观蛋白质到宏观生态系统的广泛议题。

  • 研究问题/方法/主要发现/意义与应用
    • 宏观疾病传播建模:针对城市虫媒病毒传播,研究通过时空概率模型分析发现,不同疾病(如登革热、寨卡)的传播在底层结构上具有共性,其统计差异仅在特定时间尺度上才显现。这为理解城市尺度下多病毒共循环的动态提供了新视角。
    • 微观生物信息学工具革新:在蛋白质与基因组分析层面,研究致力于提升模型的性能与可解释性。例如,通过融合蛋白质动力学信息显著提升了突变效应预测的准确性;利用大语言模型为决策树生成高阶特征,在保持可解释性的同时增强了DNA序列分类能力。
    • 计算与理论生物学框架拓展:研究提出了多个通用计算框架,如用于计算多等位基因固定概率的微扰理论、将半定规划引入系统发育推断,以及用于分析流行病模型参数可识别性的开源工作流。这些方法学进展为复杂生物问题的定量研究提供了新工具。
    • 数据标准化与资源建设:针对数据碎片化问题,研究提出了统一糖尿病设备数据的标准化格式(DIAX),并发布了基于AI定量分析的大规模肿瘤微环境开放数据集(OpenTME)。这些工作旨在提升数据的互操作性与可复用性,为后续研究奠定基础。
    • 经典假设的再审视与挑战:部分研究对现有范式提出质疑。例如,分析指出多中心fMRI研究中IQ与头动的混淆可能被高估;人工生命实验揭示了AI用于外星生命探测的分布外泛化缺陷;新模型则挑战了“随机突变”的传统观点,强调了基因组内部信息对突变的影响。
    • 跨尺度机制的统一解释:研究尝试用统一框架解释不同尺度的现象。例如,一个理论框架揭示了空间环境异质性如何通过单一指数(SCI)预测合作的演化;另一个模型则用非平衡相变理论统一解释了高尔基体等细胞器的不同组装状态。

2026-04-15 速览 · 定量生物学

2026-04-15 共 22 条抓取,按综合热度排序

← 返回日历
q-bio 04-15 00:00

城市虫媒病毒传播的尺度依赖性:时空模型揭示登革热、寨卡与基孔肯雅热共性

本研究提出了一种基于成对交互核的时空概率模型,利用巴西累西腓的大规模地理参考数据分析虫媒病毒传播。模型通过最大似然估计发现,在城市尺度上,空间邻近性无法有效区分不同疾病;而时间动态则表现出尺度依赖性:登革热、寨卡和基孔肯雅热之间的统计差异仅在超过一个临界时间窗口后才显现。无约束模型主要捕捉短期共现,导致表面但非稳健的差异,而生物约束模型则揭示了三者具有共同的底层传播结构。重建的传播网络显示出与合理疫情传播一致的局部化、结构化交互模式。

时空模型虫媒病毒尺度依赖传播动力学城市流行病学
q-bio 04-15 00:00

蛋白质序列信息对帕金森病分类的局限性评估

本研究系统评估了仅基于蛋白质一级序列信息对帕金森病进行分类的可行性。在无数据泄露的嵌套分层交叉验证框架下,测试了氨基酸组成、k-mers、理化描述符、混合表示及蛋白质语言模型嵌入等多种表示方法。最佳模型(ProtBERT + MLP)仅获得F1分数0.704 ± 0.028和ROC-AUC 0.748 ± 0.047,表明其判别能力有限。所有方法的性能差异不显著(Friedman检验p = 0.1749),且无监督分析未发现与类别标签对齐的内在结构。结果表明,仅凭序列信息难以有效区分帕金森病,需要结合结构、功能或相互作用等更丰富的生物特征。

帕金森病蛋白质序列生物信息学机器学习疾病分类模型评估
q-bio 04-15 00:00

多等位基因Moran过程弱选择下的固定概率计算框架

本研究针对多等位基因(M个)竞争的随机进化动力学,建立了一个微扰理论框架来计算弱选择条件下的固定概率。该方法利用后向Fokker-Planck算子的结构,将固定概率围绕其中性解进行系统展开。研究将该通用框架应用于三个生物学实例:具有恒定适应度函数的三等位基因竞争模型、适应度随频率增加的协调博弈模型,以及互惠等位基因间克隆干扰模型。这些结果将固定概率的分析理解从成对相互作用扩展到了多策略场景。

固定概率moran过程弱选择多等位基因随机进化动力学微扰理论
q-bio 04-15 00:00

半定规划在平衡最小进化系统发育推断中的应用

本研究首次将半定规划(SDP)这一强大的凸优化框架引入系统发育学领域,用于解决基于距离的平衡最小进化(BME)问题。该方法通过SDP松弛结合迭代舍入方案,将松弛解逐步转化为有效的树拓扑结构。在模拟和实证数据集上的实验表明,该方法能够实现准确的系统发育重建,且其通用性框架有望扩展至其他系统发育学问题。

系统发育学半定规划平衡最小进化凸优化距离法算法
q-bio 04-15 00:00

自闭症多中心fMRI研究中IQ与头动混淆可能被高估

本研究通过概率云回归(一种考虑双变量测量误差的模型)重新分析了ABIDE-I数据集(19个站点,935名被试),发现传统最小二乘法(OLS)可能将IQ与头动之间的负相关斜率高估了约4.67倍。研究还发现,基于全样本构建的头动预测模型在跨站点验证时表现不佳(样本外R²为负)。结果表明,多中心神经影像研究中常用的混杂控制方法可能因忽略测量不确定性而夸大关联,但这对下游运动校正流程的具体影响仍需进一步量化。

测量误差多中心研究神经影像自闭症统计方法头动伪影
q-bio 04-15 00:00

空间环境异质性如何影响合作演化:一个统一框架

本研究提出了一个在复杂、异质环境中合作演化的通用框架,其中合作的收益取决于局部环境质量。研究发现,环境异质性究竟是促进还是抑制合作,主要取决于环境状态的空间组织方式。对于任意环境景观,一个单一的量——空间相关指数(SCI)——可以预测合作者的固定概率。在弱选择条件下,隔离的环境(segregated environments)能增强合作,而高度混合的棋盘状景观则会抑制合作。此外,环境的组织方式还控制着演化时间尺度:隔离景观会产生长期存在的亚稳态共存,而混合景观则导致合作者更快但成功率较低的固定。这些结果为理解空间环境异质性如何塑造合作演化提供了统一描述。

合作演化空间异质性演化博弈论固定概率空间相关指数环境景观
q-bio 04-15 00:00

可穿戴设备结合唾液皮质醇提升心理压力识别准确率

本研究通过对比高强度骑行(生理压力)与社交压力测试(心理压力),评估了仅使用可穿戴生理信号(心率、心率变异性、皮电活动)以及结合唾液皮质醇对压力状态进行分类的效果。结果显示,仅使用可穿戴信号时,总体分类准确率为77.8%,但对心理压力及恢复状态的识别率较低(召回率分别为50.0%和54.2%)。加入皮质醇特征后,总体准确率提升至94.4%,心理压力与恢复状态的召回率分别显著提高至83.3%和87.5%,并有效减少了心理压力与静息状态的误判。研究表明,整合内分泌标志物对于可靠区分心理压力至关重要。

压力监测可穿戴设备皮质醇生理信号心理压力多模态融合
q-bio 04-15 00:00

AI探测外星生命存在重大缺陷:人工生命实验揭示误判风险

研究表明,依赖机器学习检测外星生命的方法存在根本性缺陷。通过人工生命实验发现,即使样本不具备生命能力,AI模型也可能以接近100%的置信度将其误判为生命。这源于机器学习对分布外样本的脆弱性——外星样本很可能超出地球生物与非生物样本的训练分布范围,导致使用AI进行生命探测时必然产生大量假阳性结果。

人工智能生命探测机器学习外星生命假阳性分布外样本
q-bio 04-15 00:00

DIAX:统一糖尿病时序数据的标准化JSON格式

针对连续血糖监测、智能胰岛素笔等糖尿病设备产生的时序数据格式不统一问题,本研究提出了DIAX(DIAbetes eXchange)标准化JSON格式。该格式整合了血糖、胰岛素、饮食等多源信号,旨在提升数据的互操作性、可复现性和可扩展性,尤其服务于机器学习应用。项目提供了开源工具集,支持数据集转换、格式兼容、可视化及社区协作,目前已兼容DCLP3、T1Dexi等主要数据集,涵盖超1000万患者小时的数据。

糖尿病数据数据标准化json格式时序数据机器学习开源工具
q-bio 04-15 00:00

TriFit:融合蛋白质动力学的三模态突变适应性预测模型

TriFit 是一个预测单氨基酸突变功能影响的多模态框架,创新性地整合了序列、结构和蛋白质动力学信息。它通过四专家混合模型自适应融合模态,并采用三模态跨模态对比学习。模型在包含 69.6 万个突变的 ProteinGym 基准测试中,AUROC 达到 0.897,超越了现有最佳监督模型。消融实验证实,蛋白质动力学(如残基灵活性和相关性运动)的引入贡献了最大的边际性能提升。

突变适应性预测蛋白质动力学多模态融合混合专家模型生物信息学
q-bio 04-15 00:00

DEFT:基于动态特征生成的决策树实现可解释DNA序列分类

针对DNA序列分析中深度神经网络“黑箱”与决策树表达能力受限的问题,本研究提出了DEFT框架。该框架在决策树构建过程中,利用大语言模型为每个节点处的局部序列分布自适应生成并迭代优化具有生物学意义的高阶特征。实验表明,DEFT能在多种基因组学任务中发现高度可预测且易于人类理解的序列特征,在保持模型可解释性的同时提升了性能。

可解释aidna序列分析决策树特征生成大语言模型生物信息学
q-bio 04-15 00:00

OpenTME:首个基于AI的TCGA肿瘤微环境开放数据集发布

研究团队发布了OpenTME,一个基于AI分析的大规模、定量化肿瘤微环境(TME)开放数据集。该数据集源自癌症基因组图谱(TCGA)中5种癌症类型(膀胱、乳腺、结直肠、肝、肺癌)的3,634张H&E染色全切片图像。通过Atlas H&E-TME病理基础模型,对每张切片进行组织质控、分割、细胞检测分类及空间邻域分析,生成超过4,500个细胞级定量指标。OpenTME旨在为生物标志物发现、空间生物学研究及TME计算方法开发提供关键资源。

肿瘤微环境人工智能病理图像开放数据集空间分析tcga
q-bio 04-15 00:00

Brain-DiT:首个基于扩散Transformer的多状态fMRI基础模型

本研究提出了Brain-DiT,一个通用的多状态fMRI基础模型。它基于扩散Transformer(DiT)架构,并采用元数据条件预训练,在涵盖静息、任务、自然刺激、疾病和睡眠等24个数据集的近35万次扫描上进行训练。与依赖原始信号或潜在空间掩码重建的现有模型不同,Brain-DiT通过生成式预训练学习多尺度表征,既能捕捉细粒度功能结构,也能理解全局语义。在7个下游任务的广泛评估中,该模型证明了扩散预训练比重建或对齐任务更具优势,元数据条件化能有效解耦内在神经动态与群体变异性。不同下游任务对表征尺度有不同偏好,例如ADNI分类更依赖全局语义,而年龄/性别预测则更依赖局部结构。

fmri基础模型扩散transformer元数据条件预训练多状态脑成像神经表征学习生成式预训练
q-bio 04-15 00:00

基于分布估计算法的非随机非拉马克突变进化模型

本文挑战了传统进化论中“随机突变”与“拉马克主义”的二元对立,提出了基于“交互式进化”理论的新模型。研究利用多元分布估计算法构建仿真,证明突变并非完全随机,而是受到基因组内部跨代累积信息的影响。模型揭示了选择、重组与非随机突变以互补方式交互作用,进化由简约性与适应度的互动驱动。该框架将个体视为样本,将学习到的假设置于种群层面,为理解性状的钟形分布及其对选择的响应提供了新视角,强调了在进化理论与计算中纳入遗传变化内部信息整合的重要性。

进化计算非随机突变分布估计算法交互式进化理论模型种群遗传
q-bio 04-15 00:00

细胞器动态组装新机制:高尔基体与内体非平衡相变模型

本研究通过非平衡随机力学框架,揭示了高尔基体和内体等细胞器在持续膜运输流中的组装与尺寸控制机制。模型基于违反细致平衡的机械化学融合-分裂循环,识别出从稳定态到极限环的多种鲁棒动力学状态,对应从稳定囊泡到周期性解体/重组等不同表型。分析表明,囊泡运输和囊泡递进这两种高尔基体组织模型实为同一非平衡过程的两个不同相。该框架为通过调控糖基化酶与膜分裂-融合动力学相互作用来控制囊泡化学特性与数量提供了新策略。

细胞器组装非平衡动力学高尔基体膜运输相变系统生物学
q-bio 04-15 00:00

干旱生态系统植被斑块模式:环境异质性与气候变化驱动下的六边形与无序集群

本研究通过统一的数学模型,结合空间环境异质性,揭示了干旱生态系统中植被斑块模式的形成机制。研究发现,随着植被死亡率增加,系统会形成高生物量的自组织六边形斑块;而当死亡率趋势逆转时,则会形成低生物量、无周期性的无序集群斑块,两者构成滞后回环。该行为得到了遥感和实地观测的支持,为理解气候变化下生态系统向荒漠化的临界转变提供了新视角。

干旱生态系统植被自组织环境异质性滞后回环荒漠化空间模式
q-bio 04-15 00:00

GeoPl@ntNet:基于AI的高分辨率生物多样性地图探索平台

本文介绍了GeoPl@ntNet,一个旨在通过动态地图和资料卡使“关键生物多样性变量”对公众可及且易懂的交互式网络应用。其核心功能是允许用户探索覆盖欧洲的高分辨率AI生成地图,包括物种分布、栖息地类型和生物多样性指标。这些地图通过一个包含卷积神经网络和大语言模型的级联流程开发,分辨率可达50×50米,提供了直观且信息丰富的界面。平台还支持对特定区域(如城市绿地、保护区或河岸)进行探索,查看本地物种及其覆盖情况,并为选定区域生成包含受保护物种、入侵物种和特有物种洞察的综合报告。

生物多样性ai地图物种分布卷积神经网络交互平台欧洲生态
q-bio 04-15 00:00

英国生物银行研究:血常规轨迹模式可识别疾病特征并预测癌症风险

本研究利用英国生物银行数据,分析了常见血液检测指标(尤其是全血细胞计数CBC)的纵向变化轨迹。通过标准化时间序列和机器学习技术,研究发现,即使在症状出现前,血液指标的模式也具有疾病敏感性和特异性,能够区分癌症、心血管疾病和感染等多种疾病。结果表明,CBC指标贡献了主要的预测信号,而常规生化检测仅提供有限的额外增益。这为利用普及的常规血液检测进行大规模精准医疗和疾病预测提供了新路径。

血液检测疾病预测机器学习纵向研究生物标志物精准医疗
q-bio 04-15 00:00

oxo-call:基于文档与技能增强的精准生物信息学命令行生成工具

针对生物信息学命令行工具语法多样、参数复杂的使用壁垒,本研究提出了oxo-call工具。它通过两种核心策略,利用大语言模型将自然语言任务描述转化为准确命令:一是“文档优先”策略,为模型提供目标工具的完整版本帮助文本;二是“技能增强”策略,为模型注入领域专家知识、常见陷阱与工作示例。oxo-call(v0.10)内置超过150项技能,覆盖44个分析类别,并集成了基于DAG的工作流引擎与本地LLM推理支持,以保障研究的可重复性与数据隐私。

生物信息学命令行生成大语言模型可重复研究技能增强
q-bio 04-15 00:00

灵长类视觉前馈过程的动态本质:时间动态本身携带关键类别信息

传统研究认为灵长类视觉腹侧通路在最初的100毫秒内以分阶段的前馈方式处理信息,因此分析多聚焦于空间响应模式。本研究通过同时记录猕猴腹侧通路多个区域(V4和IT)的数据,并采用时间分辨的多变量分析和循环神经网络解码技术,揭示了关键发现:1)在早期处理阶段,V4与IT之间交换的信息在时间和语义上均呈现多样性;2)神经模式的时间动态本身携带的类别信息,远超任何单一时间点的空间编码信息。这些证据挑战了单一、分阶段前馈过程的传统观点,表明即使是最早期的视觉处理,也更好地被描述为一个时空演化的动态过程。

视觉腹侧通路前馈处理时间动态编码循环神经网络信息解码猕猴神经生理
q-bio 04-15 00:00

流行病模型结构可识别性分析教程:使用StructuralIdentifiability.jl

本文提供了一个面向用户的方法论教程,展示了如何将全局结构可识别性分析系统地集成到流行病建模工作流中。结构可识别性是从理想、无噪声数据中唯一恢复模型参数的理论能力,是流行病建模中可靠参数估计的前提。我们使用Julia包StructuralIdentifiability.jl,为常微分方程模型的结构可识别性分析提供了一个可复现的框架。该工作流在常用流行病模型(包括具有无症状和症状前传播的SEIR变体、媒介传播疾病模型以及包含住院和疾病诱导死亡率的系统)中进行了演示。我们还引入了一种可视化沟通策略,将可识别性结果直接嵌入到隔室图中,便于解释和跨学科交流。结果表明,可识别性关键取决于模型结构、观测变量的选择以及对初始条件的假设,并且即使单个参数不是全局可识别的,也可能存在可识别的参数组合。

结构可识别性流行病模型参数估计julia常微分方程模型校准
q-bio 04-15 00:00

PyBioNetFit:整合定性与定量数据优化生物模型参数与不确定性分析

本研究针对细胞调控研究中大量定性数据(如突变前后信号响应排序)常被忽视或处理随意的问题,提出了一种系统化解决方案。通过软件PyBioNetFit,研究者将定性观察转化为形式化约束,与定量数据共同用于常微分方程(ODE)模型的参数优化,并实现了原研究中缺失的不确定性量化(UQ)。该方法提升了模型参数估计的可靠性、可重复性及分析深度,为系统生物学研究提供了更严谨的工具。

系统生物学参数优化不确定性量化定性数据pybionetfitode模型
AI速览助手