今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

定量生物学

2026-04-21 04-21 15:43

今日q-bio领域研究呈现方法学创新与理论反思并重的趋势,涵盖从神经科学到蛋白质设计的广泛主题。

  • 分析工具集成化:针对脑电/脑磁图分析,新开源工具箱MLE-Toolbox通过统一界面整合了从预处理到机器学习的全流程,旨在降低技术门槛并提高分析可复现性。
  • 单细胞扰动解读深化:研究提出几何稳定性度量Shesha,用于量化CRISPR扰动后细胞状态变化的定向一致性,该方法有助于区分多效性主调控因子与谱系特异性因子的不同作用模式。
  • 蛋白质设计范式革新:多个研究探索了超越传统端到端训练的新框架。ProtoCycle利用大语言模型驱动反思循环进行文本引导设计,而ConforNets则通过调控潜变量来生成蛋白质的多种构象,均旨在提升设计的可控性与功能性。
  • 模型评估与理论反思:在模型评估层面,有研究提出交叉公平性审计工具FairLogue,强调多维度评估的重要性;同时,“环境表征假说”对神经网络与生物大脑表征必然趋同的观点提出挑战,主张从生态约束角度理解对齐现象。
  • 计算方法的效率与原理突破:在具体计算问题上,研究通过并行持续MCMC改进玻尔兹曼机学习以高效估计蛋白质进化参数,并基于变分原理提出将因果性解释为网络能量流的新框架,以处理复杂动力学。
  • 基础理论与标度律探讨:适应性景观理论的综述系统梳理了进化导航的机制,而另一研究则试图从数据谱结构出发,推导模型性能随数据量增长的标度律(“泽塔定律”),为评估数据需求提供理论框架。

2026-04-21 速览 · 定量生物学

2026-04-21 共 23 条抓取,按综合热度排序

← 返回日历
q-bio 04-21 00:00

MLE-Toolbox:用于脑电与脑磁图全流程分析的开源MATLAB工具箱

MLE-Toolbox 是一个开源的 MATLAB 工具箱,为脑磁图(MEG)和脑电图(EEG)数据提供端到端的分析解决方案。它集成了从原始数据导入、预处理(含ICA、SSP等伪迹去除)、源定位(支持MNE、dSPM、sLORETA、波束成形等多种算法)、功能连接、振荡分析到基于机器学习的分类在内的完整流程。该工具箱通过统一的图形界面(GUI)提供自动化处理、交互式可视化及一键生成学术报告功能,并与 Brainstorm、FieldTrip 等主流平台实现互操作,旨在降低严谨、可重复的脑电研究的门槛。

脑电图分析开源工具箱源定位功能连接机器学习神经影像
q-bio 04-21 00:00

单细胞CRISPR扰动几何稳定性揭示调控架构并预测细胞应激

本研究提出了一种名为Shesha的几何稳定性度量,用于量化单细胞CRISPR扰动后细胞转录组状态变化的定向一致性(即细胞是否沿共同轨迹移动)。通过分析五个包含2200多个扰动(CRISPRa、CRISPRi、混合筛选)的数据集,发现稳定性与效应大小高度相关(Spearman $\rho=0.75-0.97$)。关键的是,当两者解耦时,能揭示调控架构:多效性主调控因子(如CEBPA、GATA1)产生大但混乱的偏移,而谱系特异性因子(如KLF1)则产生高度协调的响应。在控制效应大小后,几何不稳定性与伴侣蛋白HSPA5/BiP的激活独立相关(偏相关$\rho_{partial}=-0.34$和$-0.21$),表明其能预测细胞应激。该稳定性-大小关系在scGPT基础模型嵌入中依然存在,证实其是生物状态空间的固有属性。

单细胞crispr筛选几何稳定性调控架构细胞应激扰动预测转录组学
q-bio 04-21 00:00

ProtoCycle:基于反思与工具增强的文本引导蛋白质设计框架

针对文本描述生成功能性蛋白质的难题,本研究提出了ProtoCycle框架。它不依赖数据与算力密集的端到端微调,而是将大语言模型(LLM)作为规划核心,驱动一个多轮、反馈驱动的决策循环。该框架将LLM规划器与轻量级工具环境耦合,模拟人类蛋白质工程的迭代工作流,并通过LLM对工具反馈进行反思来修订计划。结合监督轨迹与在线强化学习训练,ProtoCycle在保持蛋白质可折叠性的同时,实现了更强的语言指令对齐,消融实验表明反思机制显著提升了序列质量。

蛋白质设计大语言模型工具增强反思规划强化学习ai for science
q-bio 04-21 00:00

3D-DXA骨参数在不同Hologic骨密度仪间具有良好一致性

本研究评估了不同系列和型号的Hologic骨密度仪在测量股骨近端三维皮质骨和小梁骨参数时的一致性。通过对103名受试者进行重复髋部扫描,并使用3D-Shaper软件分析,发现所有参数在设备间均表现出高度一致性(决定系数>0.91)。绝对偏差低于最小显著变化值,表明设备间差异无临床意义,支持其在临床实践中的适用性。

骨密度测量三维dxa设备一致性临床验证骨质疏松
q-bio 04-21 00:00

环境表征假说:重新思考神经网络的“通用性”

本文提出“环境表征假说”,挑战当前关于人工神经网络与生物大脑必然收敛于通用表征的观点。研究认为,两者间的表征对齐并非源于单一最优解,而是由系统发育过程中的生态约束重叠所致。通过回顾物种、个体与神经网络间的系统性表征差异证据,作者指出这些差异具有适应性,难以用“通用性”解释。最后,研究将模型比较重构为生态约束空间中对齐簇的映射方法,而非寻找单一最优世界模型。

表征对齐生态约束人工神经网络认知科学通用性假说
q-bio 04-21 00:00

基于并行持续MCMC的玻尔兹曼机学习:从蛋白质多序列比对中估计进化场与耦合

本研究提出了一种改进的玻尔兹曼机学习方法,用于从蛋白质多序列比对中精确估计进化单点位场和成对耦合。为解决传统方法计算量大的问题,采用了并行、持续的马尔可夫链蒙特卡洛方法来高效估计每个学习步骤中的边际分布,并结合随机梯度下降加速学习过程。此外,研究提出了一种基于蛋白质构象特定条件的新策略来调整正则化超参数,而非依赖对参数不敏感的残基接触预测精度。该方法已在八个蛋白质家族上得到应用验证。

玻尔兹曼机逆potts问题马尔可夫链蒙特卡洛蛋白质进化序列分析统计推断
q-bio 04-21 00:00

ToFiE:一种拓扑感知的纤维提取工作流,用于从显微图像中三维重建致密异质生物纤维网络

本研究提出了ToFiE,一种开源的、拓扑感知的纤维提取工作流,旨在从高分辨率显微图像中三维重建致密且异质的生物纤维网络,并精确保持其网络连接性。该方法克服了传统基于强度阈值分割易导致纤维断裂和连接点失真的挑战。研究通过合成荧光显微图像验证了ToFiE在不同拓扑结构和信噪比下的鲁棒性,并成功应用于具有多种微结构的胶原凝胶纤维网络重建。ToFiE为从广泛的纤维材料成像数据中提取与力学行为相关的网络信息提供了一个实用的半自动化框架。

纤维网络三维重建拓扑保持图像分割生物力学显微成像
q-bio 04-21 00:00

基于化学信息学的阿尔茨海默病天然药物化合物预测模型

本研究开发了一种基于化学信息学的预测模型,用于筛选具有潜在抗阿尔茨海默病活性的天然药用化合物。该模型作为一个药物筛选系统,利用分子描述符和机器学习技术进行活性检测。研究对来自ChEBI、SynSysNet和INDOFINE数据库的7000多种化合物进行了预处理和分析,使用Dragon软件计算描述符。通过以已批准药物为训练集的随机森林分类器,模型实现了中等性能(精确度0.5970,召回率0.6590),最终筛选出73个候选化合物。关键分子描述符包括原子极化率、键多重性和非氢键数量等。这些发现证明了化学信息学在阿尔茨海默病早期药物发现中的价值。

阿尔茨海默病化学信息学药物发现机器学习天然化合物分子描述符
q-bio 04-21 00:00

ConforNets:基于OpenFold3潜变量调控的蛋白质构象控制新方法

AlphaFold系列模型通常只能预测蛋白质的一种主导构象,难以捕捉其生物学相关的多种构象状态。本研究提出ConforNets方法,通过在OpenFold3模型的Pairformer层之前,对潜变量表示进行通道级的仿射变换,实现了对模型表征的全局、可复用调控。该方法在无监督生成蛋白质替代构象的任务上,在所有现有多状态基准测试中取得了最优成功率。此外,在构象转移这一新监督任务中,基于单一源蛋白训练的ConforNets能够诱导整个蛋白质家族产生保守的构象变化,为基于AF3的模型提供了有效的构象控制机制。

蛋白质结构预测构象调控潜变量变换openfold3生物信息学人工智能
q-bio 04-21 00:00

信念仲裁中的支持充分性:后果敏感的压缩机制

本文挑战了传统观点,即决策系统仅需保留所选假设和置信度即可进行下游控制。作者认为,确定在信息压缩过程中必须保留哪些证据支持结构本身是一个后果敏感的问题。研究提出了一种循环仲裁架构,其中活跃的约束场共同决定了候选假设的几何结构。系统并非完整传递该结构,而是将其压缩为一个支持感知的控制状态,其分辨率由当前后果几何、仲裁记忆和资源约束共同调节。通过一个有界目标函数形式化了权衡关系:保留过少支持会导致策略相关区别消失,使控制器在正确选择内容的同时错误处理验证、弃权和恢复;保留过多支持则会使学习过程碎片化,即使辨别力提升也会损害适应性。最小化重复交互模拟证实了这些有序的控制器预测。调节支持分辨率的自适应控制器在累积效用上优于所有固定分辨率控制器,且敏捷自适应控制优于迟钝自适应控制。固定高分辨率控制虽能实现最佳承诺准确度,但由于资源成本和学习碎片化抵消了丰富保留带来的收益,其总体表现仍不及自适应控制器。因此,支持充分性应被理解为动态压缩准则,而非静态表征阈值。

信念仲裁信息压缩自适应控制认知架构决策理论计算神经科学
q-bio 04-21 00:00

FairLogue:利用All of Us数据评估临床机器学习模型的交叉公平性

本研究提出了FairLogue工具包,用于对临床机器学习模型进行交叉公平性审计。研究选取了All of Us研究计划的数据集,复现并评估了两个已发表的临床预测模型:选择性血清素再摄取抑制剂相关出血事件预测,以及房颤患者的两年卒中风险预测。通过计算跨种族、性别及其交叉子组的观察性公平性指标,并进行反事实分析,研究发现交叉评估揭示的差异大于单轴分析,但反事实诊断表明,大多数观察到的差异与随机分组下的预期差异相当。这凸显了交叉公平性审计的重要性,并为理解临床机器学习系统中的偏见提供了更深入的视角。

交叉公平性临床机器学习算法审计健康公平反事实分析all of us
q-bio 04-21 00:00

分子性质预测深度学习综述与基准:从量子化学到基础模型

本文系统梳理了分子性质预测领域的四大范式:量子计算、描述符机器学习、几何深度学习及基础模型,并提出了统一的分类法。基准分析整合了学术界与工业界视角的数据集,涵盖量子、物理化学、生理及生物物理性质。研究揭示了当前数据标注、划分策略与评估协议中的挑战,如立体化学不一致、数据源异质性及随机划分下的可复现性局限。文章呼吁推动基准设计向更透明、时间与骨架感知的方法现代化,并展望了三个前瞻方向:嵌入量子一致性的物理感知学习、可信推理的不确定性校准基础模型,以及整合计算与实验数据的现实多模态基准生态系统。

分子性质预测深度学习基础模型几何深度学习量子化学基准测试
q-bio 04-21 00:00

FRIGID:基于扩散模型的大规模质谱分子生成框架

本研究提出了FRIGID框架,它利用一种新颖的扩散语言模型,通过中间指纹表示和确定的化学式,根据质谱数据生成分子结构。该模型在数亿个未标记结构上进行训练。研究进一步展示了前向碎片化模型如何通过识别谱图不一致的片段,并对其进行针对性的重掩码和去噪,从而实现推理时的扩展。FRIGID在扩散模型基础上已表现出强劲性能,而推理时扩展显著提升了其准确性,在具有挑战性的MassSpecGym基准测试中Top-1准确率超过18%,并在NPLIB1上将领先方法的Top-1准确率提高了三倍。实证分析表明,FRIGID的性能随推理时计算资源的增加呈对数线性扩展,为从头结构解析的持续改进开辟了新方向。

质谱解析扩散模型分子生成人工智能化学结构鉴定
q-bio 04-21 00:00

线性阈值网络的时标极限与全局稳定性分析

本研究针对具有不对称神经相互作用和异质耗散的线性阈值网络,在结构Lyapunov对角稳定性条件下,通过引入一个单参数网络族,探究了其全局渐近稳定性。该网络族在快速极限下收敛于投影动力系统,在慢速极限下收敛于不连续硬选择器系统。研究证明,在LDS条件下,快速极限系统具有全局指数稳定性,慢速极限系统具有全局渐近稳定性。数值证据表明,通过分析这两个极限端点,为建立具有生物合理递归和对角耗散的LTN的全局稳定性提供了结构化的理论路径。

线性阈值网络全局稳定性时标极限lyapunov稳定性神经动力学动力系统
q-bio 04-21 00:00

深度生成模型在DNA反应动力学与冷冻电镜分析中的应用

本研究探索了深度生成模型如何通过融合领域知识与深度学习,推动复杂生物问题的分析。在DNA反应动力学方面,提出了ViDa框架,利用变分自编码器与几何散射变换生成生物物理学上合理的DNA反应动力学模拟嵌入,并将其降维至二维空间,以可视化DNA杂交和链置换反应,使模拟结果更易解释并揭示新机制。在冷冻电镜方面,系统综述并评估了原子模型构建的深度学习方法,提出了Struc2mapGAN(从蛋白质结构生成高保真冷冻电镜密度图)和CryoSAMU(通过跨注意力融合密度特征与蛋白质语言模型的结构嵌入,增强中等分辨率密度图)。这些工作展示了深度生成模型在解析生物机制和推进结构生物学分析方面的潜力。

深度生成模型dna反应动力学冷冻电镜变分自编码器蛋白质结构建模生物物理模拟
q-bio 04-21 00:00

RosettaSearch:基于多目标推理搜索的蛋白质序列设计新方法

研究团队提出了RosettaSearch,一种用于蛋白质序列优化的推理时多目标优化方法。该方法将大型语言模型作为生成优化器,结合RosettaFold3结构预测模型计算的奖励,在搜索算法中实现可控的探索与利用。在大规模评估中,RosettaSearch成功优化了由LigandMPNN生成的400个次优序列,恢复了后者单次解码无法产生的高保真设计。结果显示,其设计的结构保真度指标提升了18%至68%,设计成功率提高了2.5倍。该方法还成功泛化至计算生成的蛋白质骨架,并展示了结合视觉语言模型的多模态扩展潜力。

蛋白质设计多目标优化推理时搜索大型语言模型结构预测
q-bio 04-21 00:00

生物医学数据中的“泽塔定律”:多少数据才足够做出科学发现?

本文提出一个基于数据协方差算子谱结构的可发现性标度律框架,用于预测增加数据何时能显著提升模型性能。研究发现,许多性能指标(如AUC)可表示为编码器和跨模态算子的可识别谱模式上累积信噪比能量的函数。在温和假设下,这种累积遵循类似黎曼ζ函数的标度律,由协方差谱和信号能量的幂律衰减主导。表示学习方法通过将有用信号集中到更早的稳定模式中来提高样本效率。该框架预测了交叉机制:简单模型在小样本量下表现最佳,而一旦有足够数据稳定额外自由度,更高容量或多模态编码器将超越它们。

标度定律生物医学数据多模态学习谱分析表示学习样本效率
q-bio 04-21 00:00

适应性景观导航:进化如何穿越崎岖的基因型-适应度地形

本文系统回顾了适应性景观理论,该理论将进化描述为种群在基因型、表型与适应度构成的复杂地形中的导航过程。文章厘清了关键概念(如上位性、崎岖性、可及性),并揭示了基因型-表型图谱的保守结构特性如何通过形成大型连通中性网络,深刻影响进化动态。作者进一步比较了基因型-表型图谱与基因型-适应度图谱两个层面的导航机制,并提出了一种基于进化结果、适用范围更广的新导航性度量方法。最后,文章探讨了放宽静态景观中适应度单调路径的常见假设,将如何从根本上改变适应性景观导航的本质。

适应性景观进化导航基因型-表型图谱上位性中性网络进化动力学
q-bio 04-21 00:00

因果性作为最小能量原理:基于变分原理的网络因果框架

传统因果模型(如格兰杰因果、结构方程模型)难以处理复杂网络中的循环和高阶动力学。本研究提出一个基于变分原理的因果框架,将因果性解释为沿网络连接从高能态到低能态的方向性能量流。利用霍奇理论,网络流被分解为耗散分量和捕获稳定循环相互作用的持久调和分量。应用于静息态fMRI连接数据时,该变分框架揭示了传统因果模型无法检测到的稳健循环因果模式,凸显了变分原理在因果分析中的价值。

因果推断变分原理霍奇理论网络动力学fmri分析循环因果
q-bio 04-21 00:00

泊松流模型揭示青少年肌阵挛癫痫的皮层折叠模式

本研究提出了一种基于泊松方程的皮层折叠模式分析新方法。该方法从皮层表面的平均曲率场梯度出发,通过求解泊松方程得到一个平滑的标量场,其表面梯度定义了折叠组织的流表示。这种表示能够对脑沟-脑回模式进行空间一致的表征,为研究青少年肌阵挛癫痫(JME)中分布式的皮层结构改变提供了一个原理性的几何框架,克服了传统皮层厚度测量对JME中细微、空间分布异常敏感性不足的局限。

皮层折叠泊松流模型几何框架神经影像癫痫脑沟回模式
q-bio 04-21 00:00

树突状细胞空间聚类如何增强T细胞活化:基于概率ABM与PS-PDE的建模研究

本研究通过构建空间动态模型,探讨树突状细胞(DC)在淋巴结中的空间聚类如何影响T细胞活化。作者提出了一种新颖的概率性基于智能体模型(ABM),并由此推导出描述T细胞活化与运动的确定性表型结构偏微分方程(PS-PDE)。利用该方程,他们解析近似了给定DC群体的拓扑结构和聚类水平下的预期T细胞刺激分布。分析表明,具有中等刺激摄取水平的T细胞从高水平的DC聚类中获益最大,其活化丰度与异质性均显著提升。敏感性分析进一步识别了能实现快速且稳健异质性T细胞活化的关键T细胞特性。

免疫建模空间动力学树突状细胞t细胞活化偏微分方程基于智能体模型
q-bio 04-21 00:00

利用隐藏出生事件信息恢复系统发育动力学推断的可识别性

研究表明,对于时间依赖的出生-死亡过程,仅凭系统发育树无法唯一推断其参数。然而,当获得关于重建树分支上隐藏出生事件的额外信息时,即使是最一般情况下的参数可识别性也能得以恢复。这适用于个体在单时间点或随时间以时变速率被采样的模型。更重要的是,研究证明,当突变发生在出生事件时(假设两种不同的突变积累模型),序列中本身就包含了关于隐藏出生事件的信息,从而使所有时变出生-死亡模型的参数变得可识别。因此,只要进化模型允许突变在出生(如物种形成、传播或细胞分裂)时积累,系统发育动力学推断就是可识别的。

系统发育动力学参数可识别性出生-死亡过程隐藏事件突变积累进化模型
q-bio 04-21 00:00

抗生素谱如何影响多物种群落中耐药菌丰度

本研究通过建立多物种群落生态学理论模型,分析了抗生素谱(即药物对不同物种的作用分布)对耐药菌丰度的影响。研究者开发了一个简单的数学度量,用于量化复杂相互作用网络中一个类群通过所有直接和间接相互作用对另一个类群的影响。基于此,推导出不同抗生素谱对微生物群落中耐药类群丰度的预期效应,为优化抗生素选择的实证研究提供了正式的理论基础。

抗生素耐药性多物种群落生态学理论相互作用网络数学模型
AI速览助手