今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

定量生物学

2026-01-28 01-28 15:26

今日q-bio领域研究聚焦于计算与理论方法的创新,以解决生物系统多尺度复杂性、数据整合瓶颈及预测精度等核心挑战。主要看点如下:

  1. 物种分布建模新框架:LabelKAN利用KAN网络联合学习物种-环境与物种-物种关系,显著提升稀有物种预测精度,并能识别关键关联物种与群落结构,为生态保护提供新工具。
  2. 系统发育计算加速:LvD算法通过树分解将似然计算复杂度从O(n)降至O(log n),实现了系统发育推断的速度飞跃,并具备并行潜力,有望推动大规模进化分析。
  3. 酶与分子设计突破:EnzyPGM通过残基-原子双尺度注意力精准建模酶口袋-底物互作;BADGER框架则增强扩散模型对结合亲和力的控制,两者均显著提升了生成分子的性能与实用性。
  4. 大规模数据整合架构:字节偏移索引架构将化学数据库整合的算法复杂度从O(N×M)降至O(N+M),实现740倍加速,解决了万亿级数据整合的工程瓶颈。
  5. 神经机制与计算模型:延迟耦合神经场模型为视觉运动错觉提供了机制解释;图式化主动推理框架则从计算角度阐释了大脑快速泛化经验的神经基础,连接了行为、理论与神经数据。
  6. 疾病演化与传播规律:数学模型揭示骨髓增殖性肿瘤突变发生平均需63年,扩张期约9年;车辆移动数据分析明确了美国养猪场疾病传播的关键风险与保护因素,为防控提供定量依据。

今日速览 · 定量生物学

今日暂无更新,展示最近一批(2026-01-28,UTC)

q-bio 01-28 00:00

LabelKAN:基于KAN网络的物种分布联合建模新框架

针对全球生物多样性保护中物种分布预测的挑战,本研究提出LabelKAN框架。该框架基于Kolmogorov-Arnold Networks (KANs),能够同时学习物种-环境关系与物种-物种关系,实现生态群落层面的联合学习。在鸟类物种分布建模中,LabelKAN显著提升了绝大多数物种(尤其是稀有和难预测物种)的预测性能,并能更准确地识别物种空间格局与群落结构。以北美大蓝鹭为例,该方法可有效识别对其种群衰退最敏感的关联物种与群落。

物种分布模型kan网络群落生态学联合学习生物多样性保护深度学习
q-bio 01-28 00:00

收缩循环网络如何构建平滑的神经表征:正则动力学驱动的嵌入理论

本研究为收缩循环神经网络在时间序列预测中形成平滑、保持拓扑结构的内部表征提供了统一理论框架。针对生物系统中常见的正则动力学输入(如环面或圆上的周期/准周期运动),论文整合了广义同步、嵌入保证和可微性机制,证明在温和条件下标准收缩架构即可实现输入历史的平滑嵌入。该框架阐明循环网络的表征本质上是历史性的:网络状态编码的是输入历史的有限窗口而非瞬时刺激,并给出了表征维度如何随驱动系统内在维度扩展的具体预测。

循环神经网络神经表征动力学嵌入广义同步拓扑保持时间序列预测
q-bio 01-28 00:00

LvD算法:计算系统发育树似然性的新方法,速度提升显著

本文提出了一种名为LvD(通过分解计算似然性)的新算法,用于替代Felsenstein于1973年提出的经典修剪算法来计算系统发育树的似然性。该算法基于对系统发育树的不同分解方式,适用于所有标准核苷酸模型。其核心优势在于,将似然性计算更新的最坏时间复杂度从现有方法的 $O(n)$ 降低至 $O(\log n)$($n$ 为分类群数量),并在实践中带来了可观的加速效果,加速程度取决于树的平衡性。研究还探讨了其在并行计算中的应用,表明该方法允许每个位点的似然性在 $O(\log n)$ 的并行时间内完成。通过大量模拟和实证数据集的测试,证实了该理论进展能带来显著的实践速度提升。

系统发育学似然计算算法优化计算生物学并行计算
q-bio 01-28 00:00

延迟耦合神经场模型揭示视觉频闪错觉的神经机制

本研究提出并分析了一个延迟耦合神经场模型,以解释由运动刺激(如旋转的车轮)子采样引起的频闪运动错觉(如车轮倒转错觉)。模型考虑了信号沿轴突投射传播所需的时间延迟,将每个神经模块组织为编码角度偏好的神经元环。研究发现,延迟会产生一系列具有不同量化传播速度的共存行波凸起解。通过基于界面的渐近方法,将神经场动力学简化为低维延迟微分方程组,详细分析了速度选择、稳定性、夹带和状态转换。规律脉冲输入会诱导不同速度状态之间的转换,包括与强迫方向相反的运动,从而捕捉了视觉混叠和频闪运动反转的关键特征。

神经场模型延迟耦合视觉错觉动力学分析频闪运动计算神经科学
q-bio 01-28 00:00

EnzyPGM:面向底物特异性酶设计的口袋条件生成模型

本研究提出EnzyPGM,一个用于底物特异性酶设计的统一生成框架。针对现有生成模型无法精确建模酶口袋与底物间相互作用的问题,EnzyPGM通过残基-原子双尺度注意力模块(RBA)联合建模残基内依赖关系及口袋残基与底物原子间的细粒度相互作用,并利用残基功能融合模块(RFF)将酶功能先验融入残基表示。模型在包含83,062个酶-底物对的新数据集EnzyPock上进行了验证,实验表明其性能达到最优,平均结合能比EnzyGen降低0.47 kcal/mol,展现了其在设计具有精确催化环境酶方面的优越性。

酶设计生成模型蛋白质工程底物结合人工智能计算生物学
q-bio 01-28 00:00

PCEvo:通过虚拟进化路径学习分子表示,提升少样本预测性能

本研究提出PCEvo方法,旨在解决分子表示学习中因标记数据稀缺导致的少样本泛化能力差的问题。该方法的核心在于构建分子对之间化学上可行的虚拟编辑路径,并将分子对的标签转化为沿路径的逐步监督信号。通过引入路径一致性目标,强制要求连接同一对分子的不同替代路径具有预测不变性。在QM9和MoleculeNet数据集上的实验表明,PCEvo显著提升了基线方法的少样本泛化性能。

分子表示学习少样本学习虚拟进化路径路径一致性ai for science性质预测
q-bio 01-28 00:00

字节偏移索引架构加速万亿级化学数据整合,性能提升740倍

本研究针对现代化学信息学中大规模化学数据库整合的瓶颈,提出了一种基于字节偏移索引的创新架构。通过整合PubChem、ChEMBL和eMolecules三大公共化学库,构建了用于分子属性预测的精选数据集。该架构将算法复杂度从$O(N \times M)$降至$O(N + M)$,使整合任务从预计100天的暴力搜索时间缩短至3.2小时,实现了740倍的性能飞跃。研究还系统验证了1.76亿条数据库条目,揭示了InChIKey分子标识符的哈希碰撞问题,并采用无碰撞的完整InChI字符串重建了数据处理流程。

化学信息学大数据整合索引架构算法优化分子标识符性能基准
q-bio 01-28 00:00

XIMP:跨图消息传递提升分子性质预测精度

本文提出跨图交互消息传递(XIMP)方法,用于解决数据稀缺场景下分子性质预测的难题。该方法创新性地在多个相关图表示(如分子图、骨架感知连接树、药效团编码扩展简化图)之间同时进行层内和跨层消息传递,整合了互补的化学抽象信息。与以往局限于单一抽象或非迭代跨图通信的方法不同,XIMP支持任意数量的抽象表示,并在每一层实现直接与间接的交互。在十项不同的分子性质预测任务中,XIMP在多数情况下超越了现有最优方法,其可解释的抽象表示作为归纳偏置,引导模型学习既定的化学概念,从而在低数据环境下显著提升了泛化能力。

分子性质预测图神经网络跨图消息传递药物发现低数据学习化学信息学
q-bio 01-28 00:00

GPCR-Filter:基于深度学习的GPCR调节剂高效精准发现框架

本研究提出了GPCR-Filter,一个专门用于发现G蛋白偶联受体(GPCR)调节剂的深度学习框架。该模型整合了ESM-3蛋白质语言模型与图神经网络,通过注意力融合机制学习受体-配体间的功能关系。基于超过9万对实验验证的GPCR-配体数据,GPCR-Filter在多个评估中均优于现有方法,并能泛化至未见过的受体和配体。实验成功识别出5-HT$_{1A}$受体的微摩尔级激动剂,证明了其在复杂信号系统药物开发中的有效性与可扩展性。

深度学习药物发现gpcr蛋白质语言模型图神经网络ai制药
q-bio 01-28 00:00

GenPairX:硬件算法协同设计加速器,提升配对末端读段比对效率

本研究提出GenPairX,一种硬件算法协同设计的加速器,旨在解决基因组分析中配对末端读段比对的计算瓶颈。其核心创新在于:1)提出一种新颖的过滤算法,联合考虑配对中的两个读段以提升过滤效率,并用轻量级比对算法替代大部分昂贵的动态规划操作;2)设计了两种专用硬件机制来支持新算法。评估显示,在不损失准确性的前提下,GenPairX的每瓦吞吐量分别比领先的基于CPU和基于加速器的读段比对器高出1575倍和1.43倍。

基因组学硬件加速算法优化计算生物学高通量测序
q-bio 01-28 00:00

数学模型揭示骨髓增殖性肿瘤发展规律:突变发生需63年,扩张期约9年

本研究通过数学模型分析JAK2V617F+经典骨髓增殖性肿瘤(MPN,包括真性红细胞增多症和原发性血小板增多症)的发生与发展过程。研究发现,从胚胎发育到第一个肿瘤细胞出现并开始增殖的平均时间为$63.1 \pm 13$年,且突变发生率随年龄呈指数增长(符合Gompertz模型),而非恒定。一旦突变发生,克隆群体扩张至诊断的时间则相对恒定,约为$8.8$年。模型进一步揭示,真性红细胞增多症比原发性血小板增多症的突变发生时间约长1.5年,但扩张时间相似。这表明MPN的发生与衰老机制相关,并为疾病发展提供了清晰的时间框架。

骨髓增殖性肿瘤数学模型jak2v617f突变肿瘤发生动力学衰老机制克隆扩张
q-bio 01-28 00:00

解码大脑皮层微环路:生成模型揭示神经连接的低维蓝图

本研究提出了一种生成模型,旨在从高维、复杂的神经连接数据中,提取指导大脑皮层微环路发育的低维“蓝图”。该模型成功地将小鼠皮层微环路的详细连接图谱压缩到一个潜在空间中,并发现该空间中的特定、可解释的方向与可理解的网络属性直接相关。基于此,研究团队开发了一种新方法,通过在该潜在空间中导航,可控地生成具有特定结构特征的全新合成微环路。这项工作为探究神经环路的设计原理以及结构如何决定功能提供了新途径,并可能为开发更先进的人工神经网络提供信息。

生成模型神经连接潜在空间大脑皮层微环路结构功能
q-bio 01-28 00:00

绘制全球生态防疫地图:识别可降低人畜共患病风险的优先区域

本研究提出了一种新方法,通过整合野生动物疾病传播风险、土地保护状态、森林恢复潜力及机会成本等多源数据,绘制了全球热带地区高分辨率(1公里)的生态防疫优先区域地图。研究发现,在50个国家中,有27.7万平方公里区域可通过生态恢复、19.8万平方公里区域可通过防止森林砍伐来有效降低人畜共患病溢出风险,其中95%的区域目前未受保护。研究还提供了一个交互式平台,允许用户调整参数以识别不同尺度的优先干预区,为制定具有成本效益的生态防疫策略提供了关键的空间决策支持。

人畜共患病生态防疫空间制图森林恢复生物多样性保护公共卫生
q-bio 01-28 00:00

协作图套索:多组学网络重建新方法

本研究提出“协作图套索”方法,通过引入协作惩罚项和双正则化方案,改进多组学数据整合与网络推断。该方法能协调不同组学层对网络结构的贡献,并分别控制层内与层间的稀疏性。同时,作者开发了基于稳定性的超参数调优准则XStARS。模拟与真实数据应用表明,该方法能有效恢复已知生物学相互作用并提示新的、生物学上一致的连接。

多组学整合网络重建图套索协作学习生物信息学正则化
q-bio 01-28 00:00

BADGER:基于扩散模型的药物设计新框架,显著提升结合亲和力

本研究针对基于结构的药物设计中扩散模型对结合亲和力控制不足的问题,提出了通用框架BADGER。该框架通过两种互补策略增强模型对结合亲和力的感知:1)在采样过程中以即插即用方式应用基于梯度的亲和力信号(分类器引导);2)将亲和力条件直接整合到扩散模型训练中(无分类器引导)。BADGER可应用于任何扩散模型,使生成分子的配体-蛋白质结合亲和力相比现有方法提升高达60%。此外,该框架还可扩展至多约束引导,联合优化结合亲和力、类药性(QED)和合成可及性(SA),以设计更现实且可合成的候选药物。

药物设计扩散模型结合亲和力人工智能分子生成多目标优化
q-bio 01-28 00:00

基于去甲肾上腺素启发的增益调制缓解联合训练中的稳定性间隙

持续学习中的“稳定性间隙”指引入新任务时,旧任务性能出现的暂时性下降。本研究受去甲肾上腺素在不确定性下短暂增强神经元增益的机制启发,提出一种动态增益缩放优化技术。该技术通过调节有效学习率和重塑局部损失函数景观,在任务边界处平衡模型的适应性与稳定性。在MNIST、CIFAR和mini-ImageNet等数据集上的联合训练实验表明,该方法能有效缓解稳定性间隙,同时保持模型整体精度,提升了任务转换的鲁棒性。

持续学习稳定性间隙增益调制神经启发优化算法联合训练
q-bio 01-28 00:00

美国养猪场车辆移动模式与猪病传播风险分析

本研究通过分析18个月的车辆GPS数据与6621个美国养猪场信息,揭示了车辆(驾驶室与拖车)移动模式在猪繁殖与呼吸综合征(PRRS)和猪流行性腹泻(PED)传播中的关键作用。研究发现,车辆访问频率和近期接触过阳性农场是主要的传播风险因素,而车辆对农场的“忠诚度”(固定使用)以及清洁消毒事件则是保护性因素。多变量模型显示,若运输车辆在发货前一天接触过阳性农场,则每周每增加一次访问,农场PRRS和PED检测呈阳性的几率分别增加234%和243%。

疾病传播车辆移动风险因素猪病防控gps数据分析生物安全
q-bio 01-28 00:00

基于图式的主动推理模型揭示大脑快速泛化经验的神经机制

本研究提出了一种新颖的图式化分层主动推理(S-HAI)计算框架,将预测处理和主动推理与图式机制相结合。该模型通过高层生成模型编码抽象任务结构,低层模型编码空间导航,两者通过映射抽象目标到物理位置的“接地似然”连接。模拟实验表明,S-HAI能够复现空间导航任务中基于图式的快速泛化行为特征,并成功模拟了啮齿动物内侧前额叶皮层中观察到的关键神经编码模式,如任务不变的目标进展细胞和目标身份细胞。这为连接行为、神经数据和理论的图式学习与推理提供了机制性解释。

主动推理图式学习神经编码预测处理认知泛化计算模型
q-bio 01-28 00:00

单链亚硫酸氢盐测序中读段修剪的内在限制与不确定性感知框架

本研究揭示了单链全基因组亚硫酸氢盐测序(ssWGBS)中读段修剪存在根本性限制。分析表明,由于Adaptase介导的加尾和亚硫酸氢盐诱导的序列简并性,生物序列与人工添加序列的边界在单读段水平上存在不可区分区域,导致任何确定性决策规则都存在严格正的贝叶斯错误率。研究特别指出,配对末端读段中边界定位存在根本不对称性:Read 2表现出具有动力学结构的伪迹,支持受限的读段级推断;而Read 1中的伪迹则源于几何驱动的读穿事件,在单读段水平上无法明确定义。基于此,研究将ssWGBS读段修剪重新定义为约束推断问题,并引入了一个保守框架,该框架仅在可观测证据(包括短程核苷酸纹理)支持下操作,揭示了基因组保留与残留伪迹风险之间的可解释权衡,并避免在边界本质上无法解析时进行强制判定。

dna甲基化单链测序读段修剪计算生物学生物信息学不确定性推断
q-bio 01-28 00:00

调控DNA序列的长期演化:基于生物物理真实基因型-表型图谱的模拟研究

本研究通过整合转录因子- DNA相互作用模型,构建了一个全局、生物物理真实且定量的基因调控基因型-表型图谱。利用这一图谱,研究者模拟了顺式调控元件(如启动子和增强子)的长期演化过程,旨在回答若干基础问题:从头演化出调控元件需要多长时间?序列空间中存在多少非平凡的调控功能?它们之间的连通性如何?以及何种调控架构最有利于快速且可演化的CRE进化。本文为从生物物理机制出发,连接系统生物学、合成生物学与进化生物学提供了定量框架。

基因调控顺式调控元件基因型-表型图谱生物物理模型演化模拟转录因子
q-bio 01-28 00:00

肿瘤生长中的超无序性:多尺度结构失序与空间非平稳性

本研究提出“超无序性”概念,描述肿瘤生长中空间、力学和代谢因素在多尺度上失配导致的结构状态。它不仅是异质性增加,更是跨尺度无序共存与空间非平稳性的结合。研究者利用胃癌组织切片图像,通过纹理熵、微结构碎片化、方向各向同性和多尺度熵变等指标,构建了标准化的超无序指数。分析发现,结构破坏在肿瘤内分布不均且跨尺度部分解耦,表现为生长驱动的多尺度不协调,而非均匀随机变异。这导致异质性随采样尺寸呈现反常标度、粗粒化无法收敛,以及肿瘤核心与侵袭前沿存在系统性差异。该框架有助于判断有限组织样本的测量结果何时能代表整体肿瘤,何时受尺度和位置依赖效应主导。

肿瘤生长超无序性多尺度分析组织架构空间异质性计算病理学
AI速览助手