今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

定量生物学

2026-04-07 04-07 15:25

今日定量生物学研究聚焦于人工智能与生物系统的交叉验证,从模型对齐到物理极限,揭示计算与生命过程的深层联系。

  • 模型与大脑的创造性对齐:通过fMRI与表征相似性分析,研究发现大语言模型与人类大脑在创造性思维任务中的对齐程度,会随模型规模和想法原创性提升,且受后训练目标的功能性重塑,为理解AI创造力提供了神经科学依据。
  • 分子信号放大的热力学边界:研究从热力学平衡态出发,揭示了分子信号放大的结构限制(如需要三聚体)并推导出普适的放大倍数上限,为合成生物学中可靠的分子电路设计提供了根本性指导原则。
  • 离子通道感知的物理极限:理论分析指出,电压门控离子通道的感知精度受散粒噪声和热涨落噪声的双重限制,单个通道的精度极限约10 mV,而神经元层面的信息整合最终受制于热力学约束,为神经计算设定了物理边界。
  • 基础模型的几何失真问题:研究提出“几何对齐税”概念,指出科学基础模型为追求预测准确性,其内部表征会系统性破坏所模拟系统的连续几何结构,揭示了当前模型在保持物理世界本质属性方面的内在冲突。
  • 基因组模型的高熵困境:分析表明,DNA序列的高熵特性导致基因组学基础模型预测分歧大、信息利用不足,效果不及NLP模型,对仅依赖序列自监督的训练范式提出了根本性质疑。
  • 临床AI模型的公平性挑战:新发布的工具包对多模态癌症生存模型进行系统性校准审计,发现其排名准确但概率失准;同时,交叉公平性分析揭示了比单维度评估更显著的算法偏见,凸显了临床AI可靠性与公平性的严峻挑战。

2026-04-07 速览 · 定量生物学

2026-04-07 共 24 条抓取,按综合热度排序

← 返回日历
q-bio 04-07 00:00

大语言模型在创造性思维中与人类大脑对齐

本研究首次探索了在创造性思维任务中,大语言模型(LLMs)与人类大脑活动的对齐关系。通过分析170名参与者在执行“替代用途任务”(AUT)时的fMRI数据,并使用表征相似性分析(RSA)测量模型与大脑默认模式网络、额顶网络的相似性。研究发现,大脑-模型对齐度随模型规模(仅默认模式网络)和想法原创性(两个网络)而提升,且在创意过程早期效应最强。更重要的是,不同的后训练目标会以功能选择性的方式重塑这种对齐:创造力优化的模型(如 \texttt{Llama-3.1-8B-Instruct})能保持与高创造力神经反应的对齐,而推理训练的模型则表现出相反模式,表明思维链训练可能将表征从创造性神经几何转向分析性处理。

大语言模型创造性思维神经对齐功能磁共振成像表征相似性分析后训练
q-bio 04-07 00:00

基于Kolmogorov后向方程的随机反应网络瞬态矩边界计算

本文针对描述细胞内分子数量动态的连续时间马尔可夫链模型,提出了一种计算瞬态矩理论上确界与下确界的新方法。该方法利用Kolmogorov后向方程(化学主方程的对偶表示),将无限维问题转移至对初始状态的依赖,从而避免了传统矩方程的非闭合层级问题。结合CTMC生成元的单调性,该方法导出了一个有限维线性时不变系统,可高效计算多个初始条件下的矩边界,仅需简单的内积运算。对于特定类别的随机反应网络,边界常微分方程可直接从反应模型显式构造,为计算可证明的边界提供了一个系统化框架。

随机反应网络矩边界kolmogorov方程化学主方程马尔可夫链系统生物学
q-bio 04-07 00:00

AI生成商业背景音乐的神经合理性:基于全脑编码模型的皮质响应研究

本研究结合生成音乐系统Wubble与全脑编码模型TRIBE v2,通过计算模拟评估了AI生成商业背景音乐的皮质响应。研究生成五首不同唤醒度、编排密度和情感效价的纯音乐,分析其在听觉、颞叶、颞顶叶及前额叶皮层的预测激活。结果显示,高唤醒、明亮的流行乐条件引发最强的全皮层平均激活(0.0402)及前额叶响应(0.0704),且不同提示条件产生的皮质空间响应模式具有显著差异(空间相关性0.787–0.974),表明AI音乐可通过提示词系统性地调节与显著性及价值评估相关的听觉-颞叶-前额叶神经模式。

计算神经科学ai音乐生成脑编码模型商业神经科学皮质响应
q-bio 04-07 00:00

果蝇连接组约束神经网络:拓扑优势可能源于初始化偏差

本研究重新评估了连接组约束神经网络中生物拓扑结构提升学习效率的普遍观点。通过使用果蝇连接组数据,并对比了自环匹配随机图与度保持重连零模型,研究发现:在弱控制条件下(如从连接组训练检查点恢复模型),连接组在早期损失、平均活性和运行时间上表现更优;但在严格公平条件下(如共享随机初始化和使用度保持零模型),这些优势基本消失。这表明先前报道的拓扑优势可能源于初始化偏差和零模型选择不当,而非拓扑结构本身的因果效应。

连接组学神经网络拓扑结构零模型果蝇大脑计算神经科学
q-bio 04-07 00:00

神经物质中信息流的物理基础:热相干视角下的认知动力学

本文提出了一个多尺度的资源理论框架,以解释神经物质中信息流的物理基础。核心是“热相干效应”,即热流与由共享相干性承载的非局域信息流相互耦合。研究认为,相关性(包括量子纠缠、量子失谐和经典关联)的可用性取决于其在特定相互作用几何下的动态可及性,而非其分类。神经组织中的电、化学、离子和热输运过程,可能在微观条件下生成或转导部分“隐藏”的关联资源,这些资源的相互耦合能在神经组织中构建更大尺度的热相干组织。离子通道界面、氢键质子网络、芳香π电子结构等被识别为潜在的物理基质。该框架为理解微观关联资源如何影响神经信号的传输、弛豫和跨尺度协调提供了可检验的路径。

神经信息流热相干效应关联资源多尺度框架认知动力学量子生物学
q-bio 04-07 00:00

平衡态分子信号放大的结构限制与热力学边界

本研究揭示了在热力学平衡状态下实现分子信号放大的根本性限制。首先证明仅由二聚体构成的网络无法实现平衡态放大,解释了早期‘链置换’设计失败的原因。突破点在于引入三聚体复合物,研究者设计并实验验证了一种等距三聚体放大器,其输出信号大小与输入一致,便于模块化组合,实现了接近理论值2倍的放大倍数。研究进一步推导出普适的热力学上限:最大放大倍数与分析物和放大器组分之间的相互作用自由能呈线性关系。对于核酸系统,这意味着所需分析物的长度必须随放大倍数线性增长,且模块化组合在固定分析物下存在收益递减。这些结果明确了平衡态放大的结构边界与能量成本,为理解为何高增益放大必须依赖非平衡过程提供了严格的理论依据。

平衡态放大热力学极限三聚体网络分子信号核酸系统模块化设计
q-bio 04-07 00:00

基于策略驱动模型重建蛋白质残基网络以探索折叠路径

本研究扩展了ND模型,通过引入节点选择和边恢复策略来重建蛋白质残基网络。该方法生成的数值观测结果与52个双态和21个多态折叠蛋白的已发表折叠速率显示出强相关性(皮尔逊相关系数 < -0.83)。结果表明,合适的策略和随机种子条件共同为在ND框架内模拟蛋白质折叠创造了有利环境,类似于蛋白质自然折叠所需的生理条件。研究进一步分析了恢复边的序列,以评估其作为潜在蛋白质折叠路径的可能性,并收集轨迹数据用于后续模型评估与开发。

蛋白质折叠残基网络策略驱动模型计算生物学折叠路径
q-bio 04-07 00:00

大语言模型在生物分子建模中的局限:跨尺度评估揭示关键挑战

本研究通过构建跨尺度生物分子基准测试BioMol-LLM-Bench,系统评估了13个大语言模型在26个下游任务上的表现。研究发现:思维链数据对生物任务提升有限甚至有害;混合Mamba-Attention架构在处理长生物序列时更有效;监督微调会以牺牲泛化能力为代价提升专业性;当前模型在分类任务上表现良好,但在更具挑战性的回归任务上仍显薄弱。这些结果为未来基于LLM的分子系统建模提供了实用指导。

生物信息学大语言模型跨尺度建模基准测试分子序列模型评估
q-bio 04-07 00:00

MolSeek-OCR:基于DeepSeek-OCR-2的两阶段微调策略实现分子结构识别

本研究将光学化学结构识别(OCSR)任务定义为图像条件SMILES生成,并针对DeepSeek-OCR-2模型提出了一种两阶段渐进式监督微调策略。该策略首先使用参数高效的LoRA方法,再过渡到采用分割学习率的选择性全参数微调,有效克服了训练不稳定性问题。模型在结合PubChem合成渲染图和USPTO-MOL真实专利图像的大规模语料库上进行训练,在精确匹配准确率上达到了与最佳图像到序列模型相当的水平,但在严格序列级保真度要求下,仍逊于最先进的图像到图模型。

分子结构识别深度学习微调smiles生成光学化学识别两阶段训练
q-bio 04-07 00:00

热涨落设定离子通道功能的基本极限

研究揭示了电压门控离子通道感知膜电位时面临的两个基本噪声源:离子电荷离散性导致的散粒噪声,以及电场长波长热涨落导致的约翰逊-奈奎斯特噪声。对于单个通道,散粒噪声占主导,将电压感知的固有精度限制在约10 mV,接近实测通道灵敏度。当聚合多个通道信号时,约翰逊-奈奎斯特噪声最终超越散粒噪声,限制了可从环境中感知的总信息量。这一转变发生在与神经元胞体和轴突起始段实验测量密度相符的通道密度范围内,表明神经元计算最终受热涨落约束。

离子通道热涨落散粒噪声电压感知神经元计算生物物理极限
q-bio 04-07 00:00

特征锥星座:基于谱权重的球形图嵌入与动态子图轨迹收敛方法

本文提出了一种名为“特征锥星座”的层次化框架,用于将有界度空间图嵌入到同心球壳中。该方法以图中一个根节点(女王)为中心,根据图中节点到根节点的图距离确定其所在的球壳半径,并将每个球壳划分为多个星形区域,每个区域的立体角与对应子图的谱质量成正比。通过约束排斥力在区域内进行节点排布,形成局部单纯形结构。该几何表示为测量动态子图状态之间的谱距离提供了结构框架。结合领域特定的编辑操作约束,定义了一种仅向前、确定性的轨迹——“同构行走”,能够高效地收敛图编辑操作。研究定义了具有测地线可见性的球形星形域概念,建立了其在谱投影下的性质,并在分子接触图上验证了轨迹的收敛性。

图嵌入谱分析球形划分动态子图轨迹收敛分子图
q-bio 04-07 00:00

重复互动如何促进公平:基于迷你最后通牒博弈的理论模型

本研究通过理论建模,探讨在重复的迷你最后通牒博弈中,公平行为如何通过重复互动得以演化。研究者构建了一个基于反应策略的重复博弈框架,分析提议者与接受者之间的互动。通过引入双物种演化稳定策略的概念,研究识别出一个关键的有效博弈长度阈值:低于该阈值时,公平由双方遵守对方过往行为的策略促进;高于该阈值时,则由“顺从型”提议者与公平的接受者共同维持。研究还通过推广经典自适应动力学,建立了一个考虑有限种群规模和非局部突变的双种群随机动力学模型,证明特定的反应策略能有效促进公平在长期突变-选择动态中的涌现与维持。

演化博弈论公平行为重复博弈反应策略演化稳定策略社会行为
q-bio 04-07 00:00

STORM:首个整合空间转录组与组织学的多模态基础模型

本研究提出了STORM模型,通过整合120万个空间转录组数据与匹配的组织学图像,构建了首个跨18个器官的多模态基础模型。该模型采用分层架构,融合形态特征、基因表达和空间信息,实现了分子与形态的稳健表征。STORM在空间域发现方面表现出色,能生成生物学一致的组织图谱,并在11种肿瘤类型中优于现有方法,仅凭H&E图像即可预测空间基因表达。模型平台无关,在Visium、Xenium等多个平台上表现一致。应用于7,245名患者的23个独立队列,STORM显著提升了免疫治疗反应预测和预后评估的准确性,为空间信息驱动的生物发现和临床精准医疗提供了可扩展框架。

空间转录组学组织病理学多模态模型基础模型精准医疗生物信息学
q-bio 04-07 00:00

利用反应稀疏性加速随机化学反应矩边界优化

针对随机化学动力学中矩方程无限耦合导致的求解难题,本研究提出了一种利用反应稀疏性的矩阵分解方法。通过分析每个化学反应仅涉及由其反应物决定的变量子集这一结构特征,将半定规划中的大型约束分解为多个小型约束。该方法在保证提供实用矩边界的同时,显著降低了优化问题的计算成本。

随机化学动力学矩边界半定规划稀疏性计算优化
q-bio 04-07 00:00

利用结构预训练生成分子动力学轨迹的新框架

本研究提出了一种利用结构预训练生成分子动力学轨迹的新框架,以解决MD数据稀缺和高维分布建模的挑战。该方法首先在大规模构象数据集上训练基于扩散的结构生成模型,然后引入在MD轨迹数据上训练的插值器模块,以确保生成结构间的时间一致性。通过将复杂的MD建模任务分解为结构生成和时间对齐两个子问题,有效利用了丰富的结构数据。在QM9和DRUGS小分子数据集上的实验表明,该方法在无条件生成、正向模拟和插值任务中均能生成化学上真实的MD轨迹,在几何、动力学和能量测量精度上均有显著提升。

分子动力学生成模型结构预训练扩散模型轨迹生成
q-bio 04-07 00:00

多维体能通过蛋白质组与神经影像通路降低痴呆风险:英国生物银行前瞻性研究

本研究基于英国生物银行超5万人的12年随访数据,系统揭示了握力、心肺适能与肺功能三项体能指标均能独立降低痴呆风险(最高与最低三分位风险比HR分别为0.50、0.62和0.73),且在女性和年轻个体中关联更强。血浆蛋白质组学分析发现,不同体能维度对应独特的分子特征(如神经丝轻链与肌肉/心肺适能相关,GDF15等炎症介质与肺功能相关),共有22-40种蛋白质通过神经炎症和神经血管通路预测痴呆。脑部MRI显示海马体体积是重要的结构中介(中介比例3.7-10.1%)。据估计,约26%的痴呆病例可归因于体能不佳。

痴呆预防体能多维性蛋白质组学神经影像神经炎症前瞻性队列
q-bio 04-07 00:00

非平衡统计物理统一解释持续学习困境:从Kramers逃逸率看洞察与重复练习

本文利用非平衡统计物理为人工神经网络的持续学习困境提供了统一的理论框架。研究将学习系统状态建模为双势阱能量景观上遵循朗之万动力学的粒子,其概率密度服从Fokker–Planck方程,状态间跃迁由Kramers逃逸率 $k = (\omega_0\omega_b/2\pi)\,e^{-\Delta E/T}$ 描述。核心贡献有二:首先,揭示了弹性权重巩固(EWC)惩罚项相当于一个随任务数量线性增长的能量势垒,这从理论上预测并数值验证了可塑性随任务积累呈指数级崩溃。其次,证明了“洞察”与“重复练习”对应于同一Fokker–Planck方程下两种不同的温度协议:洞察事件由 $T(t)$ 的瞬时尖峰驱动快速越障,而重复练习则在适度升高但恒定的温度下通过持续随机扩散实现跃迁。

持续学习统计物理kramers逃逸稳定性-可塑性困境非平衡动力学fokker-planck方程
q-bio 04-07 00:00

几何对齐税:科学基础模型中离散化与连续几何的冲突

研究发现,生物和物理领域的科学基础模型在追求预测准确性的同时,其内部表征会系统性地破坏所模拟系统的连续几何结构。其根源在于“几何对齐税”——将连续流形强行通过离散分类瓶颈所固有的代价。实验表明,在相同编码器上用连续目标替换交叉熵,可将几何失真降低高达8.5倍。对14个生物基础模型的评估揭示了三种失效机制:局部-全局解耦、表征压缩和几何空虚。目前没有模型能同时实现低失真、高互信息和全局一致性。

基础模型几何失真表征学习连续几何离散化生物学模型
q-bio 04-07 00:00

多模态癌症生存模型排名准确但概率失准:首次系统性校准审计揭示临床风险

本研究首次对融合全切片病理图像与基因组数据的多模态深度学习生存预测模型进行了系统性校准审计。研究发现,尽管这些模型在区分性能(C-index)上表现优异,但其输出的生存概率——无论是原生离散时间输出还是通过标准Breslow方法重建的生存曲线——在校准性方面存在普遍缺陷。在290项折层测试中,166项在Benjamini-Hochberg校正后拒绝了正确校准的原假设。例如,MCAT模型在GBMLGG数据集上C-index达0.817,但在所有五个折上都未通过1-校准测试。研究还发现,基于门控的融合策略与更好的校准性相关,而事后Platt缩放可在不影响区分能力的情况下改善特定时间点的校准误差。结果表明,仅凭一致性指数不足以评估拟用于临床的生存模型。

生存分析模型校准多模态学习癌症预测深度学习临床评估
q-bio 04-07 00:00

基因组学基础模型为何受限?高熵序列导致预测分歧与信息利用不足

研究发现,基因组学基础模型效果不及自然语言处理模型,核心原因在于DNA序列的高熵特性。通过训练模型集合并分析其预测、静态嵌入和Fisher信息流,论文表明:高熵导致模型输出分布趋于均匀、不同模型间预测分歧大、嵌入不稳定。此外,DNA模型将Fisher信息过度集中于嵌入层,未能有效利用token间关系。这提示仅靠序列的自监督训练可能不适用于基因组数据,对当前基因组基础模型的训练方法论提出了根本性质疑。

基因组学基础模型自监督学习模型分歧fisher信息
q-bio 04-07 00:00

平均场博弈流行病模型:部分健康状态可观测性与时间范围不确定性

本文引入了一种新的平均场博弈流行病模型,探讨了个体免疫状态的可观测性(随时间衰减或瞬时消失且不可观测)对理性个体行为决策的影响。模型的核心挑战在于求解一个包含偏微分方程(描述免疫结构群体的平流-反应方程和对应的Hamilton-Jacobi-Bellman方程)的前向-后向MFG系统。作者提出了一种高效的计算方法,通过求解近似常微分方程系统的两点边值问题来解决。该方法还可扩展至处理规划时间范围存在初始不确定性的情况。

平均场博弈流行病模型健康状态可观测性hamilton-jacobi-bellman方程计算优化
q-bio 04-07 00:00

Transformer模型缺乏生物系统的标量变异性:表征噪声随数值增大而减小

本研究分析了三个7-8B参数的大语言模型(Llama-3-8B-Instruct, Mistral-7B-Instruct-v0.3, Llama-3-8B-Base)对26个数值的表征。研究发现,与生物系统中观察到的“标量变异性”(即表征噪声与数值大小成比例,变异系数恒定)相反,Transformer模型的表征变异性随数值增大而减小(沿数值轴的缩放指数 $\alpha \approx -0.19$)。这种反标量模式在完整维度空间和经过句子身份校正后依然存在,且沿数值轴比正交维度强3-5倍。语料库频率能强烈预测每个数值的变异性($\rho = .84$)。结果表明,仅靠分布学习不足以产生标量变异性,Transformer再现了对数压缩的数值几何结构,但未复制生物系统中的恒定变异系数噪声特征。

标量变异性transformer模型表征噪声大语言模型认知科学计算神经科学
q-bio 04-07 00:00

多时间尺度平衡脉冲网络中的振荡状态机制图谱

本研究系统性地绘制了突触后衰减时间常数、传导延迟和可塑性速率如何共同塑造循环泄漏积分发放网络的振荡状态。通过结合Brian2模拟与粗粒度Hopf参考边界,构建了可直接可视化静默态-异步不规则态-振荡态转变的机制图谱。结果显示,增加可塑性速率会向更短的衰减时间和中长延迟方向扩展振荡区域,而显著度图谱则识别出具有最强节律相干性的参数区域。控制实验进一步将这一全局图谱与局部节律形成机制联系起来,表明STDP冻结会削弱节律相干性,而延迟抖动则能在平均发放率变化最小的情况下增强相干性。

脉冲神经网络振荡状态时间尺度参数图谱节律相干性平衡网络
q-bio 04-07 00:00

FairLogue:临床机器学习模型交叉公平性分析工具包发布

本研究提出了FairLogue工具包,旨在解决临床机器学习中算法公平性评估的不足。该工具包包含三个核心模块:1)将人口统计均等、机会均等等指标扩展至交叉人群的观测框架;2)基于治疗场景的反事实公平性评估框架;3)评估对交叉群体成员进行干预的广义反事实框架。在利用All of Us数据集进行的青光眼手术预测任务中,交叉性评估揭示了比单轴分析更大的公平性差距(如人口统计均等差异达0.20),而反事实分析则表明在控制协变量后,部分观测差异可能与随机性一致。

算法公平性交叉性分析临床机器学习反事实评估健康公平
AI速览助手