今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

定量生物学

2026-03-04 03-04 15:28

今日q-bio领域研究呈现多学科交叉与计算驱动趋势,聚焦于从分子到生态系统的复杂系统解析与设计。核心进展体现在利用新型计算框架(如图神经网络、神经符号智能体、拓扑数据分析)解析生物网络与动态,并推动精准医学与合成生物学应用。

  1. 图神经网络确立神经元分类新基准:在线虫神经元分类任务中,基于注意力的图神经网络(如GAT)在利用空间与连接特征时显著优于传统方法,为神经连接组分析提供了更强大的工具。
  2. 神经符号智能体实现逆向药物预测:结合定量世界模型与大语言模型推理,新框架能通过模拟基因编辑逆向预测药物反应,为“少样本”精准肿瘤学提供了可解释的解决方案。
  3. 环境波动驱动物种分布差异的新机制:理论模型揭示,即使没有栖息地偏好,时间波动的环境也足以导致物种丰度的空间差异,其分布特性由迁移与波动强度的平衡决定。
  4. 稀疏自编码器解码单细胞基础模型的“黑箱”:分析揭示Geneformer等模型内化了丰富的通路知识并形成结构化的特征模块,但在扰动响应中缺乏明确的调控逻辑,提示关联与因果的差距。
  5. 拓扑数据分析揭示神经响应的高阶模式:应用于小鼠视觉皮层数据,通过持续性同调捕捉视频刺激下神经活动的动态拓扑特征(如环结构),为理解群体神经编码提供了新视角。
  6. GPU加速将单细胞分析带入“分钟级”时代rapids-singlecell框架通过GPU并行计算,将千万级细胞数据的标准分析流程从数小时缩短至分钟,解决了大规模数据处理的瓶颈。

2026-03-04 速览 · 定量生物学

2026-03-04 共 23 条抓取,按综合热度排序

← 返回日历
q-bio 03-04 00:00

秀丽隐杆线虫神经元分类基准分析:图神经网络显著优于传统方法

本研究为秀丽隐杆线虫神经元分类建立了基准,系统比较了四种图神经网络方法(GCN、GraphSAGE、GAT、GraphTransformer)与四种非图方法(逻辑回归、MLP、LOLCAT、NeuPRINT)。基于功能连接组,利用空间、连接和神经元活动三类特征对感觉神经元、中间神经元和运动神经元进行分类。结果表明,基于注意力的图神经网络在空间和连接特征上显著优于基线模型。神经元活动特征表现不佳,可能源于底层神经元活动数据的时间分辨率较低。该基准验证了图神经网络的有效性,并强调了空间和连接特征是预测线虫神经元类别的关键。

神经元分类图神经网络秀丽隐杆线虫基准测试功能连接组
q-bio 03-04 00:00

神经符号智能体框架:通过可逆世界模型预测结直肠癌药物反应

本研究提出了一种神经符号智能体框架,以解决精准肿瘤学中“数据多、样本少”的困境。该框架将基于Sanger GDSC数据集(N=83)的定量机器学习世界模型与基于大语言模型的智能体推理层相结合,实现了稳健的药物反应预测(r=0.504)。其核心创新在于“逆向推理”:智能体通过模拟CRISPR基因编辑(如修复APC或TP53),预测特定基因组改变如何影响药物敏感性,并能区分治疗机会与背景性耐药。该框架在人类临床数据上得到验证(p=0.023),为癌症研究提供了透明且可解释的人工智能路径。

精准肿瘤学神经符号ai药物反应预测可解释ai结直肠癌逆向推理
q-bio 03-04 00:00

环境波动足以驱动物种丰度在空间上的显著差异

本研究通过一个空间分隔群落的最小模型,揭示了即使在没有持续地点偏好的情况下,随时间变化的波动环境也足以导致物种在不同地点的丰度产生显著差异。研究量化了这种非平衡效应,重点关注“两点不平等性”(即物种在一对地点间丰度的对数比)的分布。分析表明,迁移带来的松弛效应与波动强度之间的平衡决定了分布的整体和极值统计特性。研究还发现,在环境波动存在时间相关性的情况下,会出现噪声诱导的向双峰不平等性的转变,并探讨了有限迁移率在时间相关环境中的进化优势。

物种丰度差异环境波动非平衡生态学空间模型迁移率噪声诱导转变
q-bio 03-04 00:00

化学反应的拓扑约束:从生命起源到合成网络设计

本研究从化学反应的拓扑结构出发,推导出在平衡增长状态下,反应网络生长(或收缩)速率的上界。该上界由一个拓扑量——最大放大因子控制,该因子通过冯·诺依曼最大最小问题在可行通量上定义。研究通过随机网络集合的数值测试验证了该约束,为理解生命起源中的代谢网络演化及设计合成化学反应网络提供了新的理论工具。

化学反应网络拓扑约束生长速率平衡增长最大放大因子生命起源
q-bio 03-04 00:00

实验室环境下长腿蚁运动行为的随机建模研究

本研究通过大量实验室轨迹追踪实验,对孤立长腿蚁(A. gracilipes)的运动行为进行随机建模分析。研究发现,结合主动布朗运动模型和“跑-停-转”模型,能够从定性和定量上复现实验中观察到的轨迹统计特征。研究识别了不同个体间具有可重复性的转向角、奔跑时间和等待时间的概率分布,并且解析预测与从轨迹中经验测量的量之间具有良好的一致性。该模型有助于从模拟和分析角度更好地理解和预测运动生态学,甚至能洞察运动背后的生成机制和蚂蚁的感觉系统。

随机建模运动行为长腿蚁轨迹分析生物物理学
q-bio 03-04 00:00

稀疏自编码器揭示单细胞基础模型:蕴含丰富生物学知识但缺乏调控逻辑

本研究首次系统地将稀疏自编码器(SAEs)应用于两大单细胞基础模型Geneformer和scGPT,以解析其内部表征。通过分析超过10万个特征,发现模型内部存在大量叠加现象,但特征高度结构化:29%-59%的特征可注释到已知生物学通路(如Gene Ontology、KEGG),并形成共激活模块和跨层信息通路。然而,在基因组规模的CRISPRi扰动数据测试中,仅6.2%的转录因子显示出调控靶点特异性响应,表明模型虽内化了丰富的关联性生物学知识(如通路、蛋白互作),但编码的因果调控逻辑极少。

稀疏自编码器单细胞基础模型可解释性基因调控表征学习生物信息学
q-bio 03-04 00:00

智能体如何应对不确定性?选择定理揭示预测性内部状态的必要性

本文通过证明定量的“选择定理”,阐明了在不确定性下进行稳健决策的智能体所需的内在结构。研究表明,在结构化行动条件预测任务族上实现较低的“平均情况遗憾”,会迫使智能体必须实现一种预测性的、结构化的内部状态。该结果涵盖了随机策略、部分可观测性以及在任务分布下的评估,且不假设最优性、确定性或对显式模型的访问。技术层面,研究将预测建模简化为二元“投注”决策,并证明遗憾界限限制了次优投注的概率质量,从而强制执行分离高边际结果所需的预测性区分。在完全可观测设置中,这近似恢复了干预性转移核;在部分可观测性下,则意味着类似信念的记忆和预测状态的必要性。

智能体决策不确定性选择定理预测状态部分可观测性平均遗憾
q-bio 03-04 00:00

分子动力学模拟揭示亨廷顿蛋白外显子1的构象变化:环境共溶剂调控聚集倾向

本研究通过全原子分子动力学模拟,探究了亨廷顿病相关蛋白HTT外显子1在不同聚谷氨酰胺(polyQ)长度(Q21、Q40、Q70)下的构象动力学。模拟发现,polyQ长度增加导致回转半径($R_g$)和溶剂可及表面积($SASA$)增大,表明蛋白质构象更舒展、更易暴露于溶剂。研究进一步测试了甲醇、三氯乙烯等有机共溶剂的影响,发现疏水性溶剂(如三氯乙烯)能显著诱导Q21和Q40构象扩张,而甲醇则引起轻微收缩。这是首个系统研究共溶剂对HTT外显子1构象动力学的模拟工作,为理解基因-环境互作在亨廷顿病中的作用提供了计算依据。

分子动力学模拟亨廷顿病蛋白质构象聚集倾向环境共溶剂基因-环境互作
q-bio 03-04 00:00

纳米金刚石热雷达实现活细胞全光学热导率成像

本研究提出了一种基于纳米金刚石-金膜混合平台的频域荧光测温法(FD-FTM),实现了对活细胞内局部热导率(κ)的无标记、亚微米分辨率定量成像。该方法利用荧光纳米金刚石作为纳米温度计,金膜作为光热源,通过调制频率调控热穿透深度,测量不确定度约10%。研究首次在细胞核染色质区域测得热导率比细胞质高约10%,并在肌萎缩侧索硬化症模型中解析了与蛋白质液-液相分离相关的热导率变化,为解码细胞内代谢、疾病机制及应激响应提供了新工具。

热导率成像纳米金刚石无标记检测细胞热力学亚微米分辨率生物物理
q-bio 03-04 00:00

BoGA框架:深度学习引导进化优化加速蛋白质设计

本研究提出BoGA框架,将进化搜索与贝叶斯优化相结合,以高效探索巨大的蛋白质序列空间。该框架将遗传算法作为代理模型循环中的随机提案生成器,基于先验评估和模型预测对候选序列进行优先级排序,实现了数据高效的优化。通过在序列和结构设计任务上的基准测试,并应用于设计针对肺炎链球菌关键毒力因子肺炎溶素的肽结合剂,BoGA加速了高置信度结合剂的发现,展示了其在多样化蛋白质设计目标中的潜力。

蛋白质设计贝叶斯优化进化算法深度学习序列优化肽结合剂
q-bio 03-04 00:00

反应网络中显式催化的自催化核心识别方法

本研究将反应网络中自催化核心的识别方法推广至包含显式催化的体系。在显式催化(如实体同时作为反应物和产物)存在时,仅检查化学计量矩阵无法确定自催化核心的存在与数量,需要更精细的代数分析。研究证实,此类核心在Koenig图中仍可表示为“fluffles”结构,在矩阵上对应不可约的Metzler子矩阵,但其对角线元素不再严格为负。此外,研究引入了“硬自催化核心”概念,并证明在单位化学计量条件下,每个自催化核心可由至多2个基本回路叠加构成。

自催化核心反应网络显式催化化学计量矩阵图论分析代谢网络
q-bio 03-04 00:00

拓扑数据分析揭示小鼠视觉皮层对视频刺激的神经响应模式

本研究利用拓扑数据分析方法,分析了Sensorium 2023数据集中数千个小鼠视觉皮层神经元对多样化视频刺激的响应。通过为每个视频构建逐帧的立方体复形,并应用Zigzag持续性同调来捕捉拓扑结构随时间演化的动态。这些动态特征通过持续性景观图进行总结,提供了时间特征的紧凑向量化表示。研究重点关注一维拓扑特征(数据中的环),这些特征反映了神经协同激活的协调、周期性模式。通过聚类不同视频重复试验产生的拓扑神经表征,结果表明这些拓扑描述符能够可靠地区分对不同刺激的神经响应。这项工作揭示了演化中的神经元活动与可解释的拓扑特征之间的联系,推动了拓扑数据分析在揭示复杂动力系统中神经编码的应用。

拓扑数据分析神经编码持续性同调视觉皮层时间动态小鼠
q-bio 03-04 00:00

结合声学与预期神经网络表征提升脑电音乐识别

本研究提出一种基于脑电图(EEG)的音乐识别新方法,通过区分声学特征和预期相关的神经网络表征作为教师目标,显著提升了识别性能。模型在预测这两种表征的预训练后,表现优于未预训练的基线模型,且结合两者能产生互补增益,效果超过通过随机初始化形成的强集成模型。结果表明,教师表征类型影响下游任务表现,且表征学习可受神经编码原理指导。该方法无需人工标注,直接从原始信号计算预期表征,反映了超越起始时间或音高的预测结构,为研究多层预测编码提供了新工具。

音乐识别脑电图神经网络表征神经编码预测编码表征学习
q-bio 03-04 00:00

输入驱动Hopfield网络的序列检索动力学理论

本研究为Hopfield网络中的序列推理建立了动力学理论。通过分析结合快速联想检索与慢速推理动力学的双时间尺度架构,研究者推导出了自持记忆转换的明确条件,包括增益阈值、逃逸时间和坍缩机制。该工作为理解联想记忆模型中的序列性提供了数学基础,连接了经典Hopfield动力学与现代推理架构。

hopfield网络序列推理联想记忆动力学理论双时间尺度
q-bio 03-04 00:00

多物种空间拓扑分析新方法:揭示癌症与生态系统的隐藏关系

本研究提出了一种基于拓扑数据分析(TDA)和计算几何的可扩展框架,用于量化多物种数据中的高阶空间相互作用。传统持久同调(PH)方法只能分析单一物种的空间形状,而新方法能区分四种关键模式:多物种共有的特征、在其它物种存在时消失的特征、仅当多物种共存时才显现的特征,以及在其它物种存在时仍保持的特征。该方法已应用于合成肿瘤微环境模型的行为识别和结直肠癌组织样本中物种间空间相互作用的分析。

拓扑数据分析多物种交互空间拓扑癌症微环境计算几何
q-bio 03-04 00:00

基于主次流形的RNA结构聚类与多尺度校正新方法

本研究提出了一种基于主次流形(PSM)的新方法,用于在环面(torus)上分析RNA数据,以解决RNA结构重建中的原子碰撞问题。该方法结合PSM与DBSCAN,形成了PSM-DBSCAN聚类技术,显著提升了聚类精度和对噪声的鲁棒性。进一步应用于多尺度校正,可在微观和介观尺度上有效解决RNA骨架碰撞。模拟与比较研究表明,该方法在精度和可扩展性上均优于现有方法,为复杂RNA结构校正提供了稳健基础,对结构生物学和生物信息学具有广泛意义。

rna结构分析主次流形多尺度校正聚类算法结构生物学生物信息学
q-bio 03-04 00:00

BioChemInsight:自动化提取专利中化学结构与活性数据的开源平台

本研究提出了BioChemInsight开源平台,旨在解决药物发现中化学结构与生物活性数据自动化关联提取的瓶颈。该平台整合了DECIMER Segmentation、MolNexTR、GLM-4.5V及PaddleOCR等技术,实现了化学结构识别、化合物标识符关联以及生物活性数据提取与单位归一化。在涵盖15个治疗靶点的181项专利评估中,三项核心任务的平均提取准确率超过90%。分析表明,专利覆盖的化学空间与公共数据库ChEMBL高度互补,BioChemInsight能有效挖掘ChEMBL中代表性不足的化学信息,将数据预处理时间从数周缩短至数小时,为定量构效关系建模与靶向筛选提供了更丰富的数据基础。

化学信息学专利挖掘结构活性关系自动化提取药物发现开源工具
q-bio 03-04 00:00

FastDesign:基于基序分治与结构对抗搜索的快速通用RNA设计算法

本研究提出了一种快速通用的RNA设计算法FastDesign,旨在解决寻找能折叠成目标二级结构的RNA序列这一计算难题。该方法创新性地结合了基序层面的分治策略与结构层面的对抗搜索。首先,将目标结构分解为基序树,为每个基序设计部分序列;其次,借鉴计算语言学中的立方剪枝策略,递归组合部分序列以优化基于整体构象的指标;最后,通过新颖的全结构对抗搜索进一步优化序列,抑制错误折叠并提升基于最小自由能的性能。该算法在效率和性能上均达到领先水平,在Eterna100基准测试和长链RNA(如16S rRNA)设计中表现优异,将平均折叠概率从0.18提升至0.39,且速度提升一个数量级。

rna设计分治算法结构优化计算生物学序列设计基序分解
q-bio 03-04 00:00

向日葵嵌套核心种质库构建及其在关联研究与表型组学中的应用

研究团队从752份向日葵种质资源中,利用MSTRAT软件构建了包含48、96、144和384个品系的嵌套式核心种质库。这些种质库分别代表了总遗传多样性的47%、59%、78%和100%。该方法以12个精选品系为内核逐步扩展,旨在优化关联分析并提升对生物与非生物胁迫相关性状的表型描述能力。

核心种质库关联分析表型组学遗传多样性向日葵育种
q-bio 03-04 00:00

GPU加速单细胞分析框架rapids-singlecell:将分析时间从小时缩短至分钟

随着单细胞测序数据集规模达到数千万细胞级别,传统基于CPU的分析流程面临严重瓶颈。本文提出的rapids-singlecell是一个GPU加速框架,深度集成于scverse生态系统,直接操作AnnData数据结构。该框架基于CuPy数组和NVIDIA RAPIDS生态系统构建,为标准scanpy分析步骤(如预处理、降维、聚类、批次校正等)提供近乎即插即用的GPU替代方案,相比优化后的CPU基线实现了数百倍的加速,将分析时间从数小时缩短至数分钟,同时保持一致的生物学解释。

单细胞分析gpu加速计算生物学高通量测序rapids
q-bio 03-04 00:00

决策能力随年龄变化的机制研究需要理论神经科学的介入

本文指出,当前关于认知老化的研究仍主要依赖单一行为指标和描述性神经分析,与理论神经科学的最新进展脱节。作者主张将衰老研究融入现代计算神经科学框架,利用潜在状态建模、动态系统、编码模型、表征几何学和循环神经网络等工具,为个体衰老轨迹的差异提供机制性解释,从而推动对全生命周期决策能力的深入理解。

认知老化决策机制理论神经科学计算模型神经动力学生命周期
q-bio 03-04 00:00

随机传代下重组率修饰因子的演化:时间变异性可逆转经典预测

经典‘减少原理’认为,在稳定的选择平衡下,降低重组率的中性修饰等位基因会被青睐。本研究引入了一个最小化随机模型:在二倍体模型中,一个中性修饰位点调控两个受选择位点的重组率,且修饰杂合子的重组率在世代间随机波动。研究发现,当重组率恒定不变时,减少原理严格成立;但当重组率随机变化时,入侵结果由随机矩阵乘积的顶部李雅普诺夫指数决定。仅重组率的时间变异性(无需选择波动)就足以逆转确定性模型的预测方向。入侵不仅取决于平均重组率,更依赖于重组率的完整分布及其跨世代的累积顺序。这表明,传代过程中的时间变异性是重组率演化中一个独立且性质独特的驱动力。

重组率演化减少原理随机过程修饰基因种群遗传学李雅普诺夫指数
q-bio 03-04 00:00

肿瘤-巨噬细胞互作数学模型揭示免疫表型重编程机制

本研究构建了一个包含肿瘤细胞、M1型、M2型及具有双表型特征的M3型巨噬细胞的数学模型。通过分析系统稳定性条件、全局敏感性分析和分岔分析,发现巨噬细胞极化速率κ和静息巨噬细胞基线水平M0是系统动力学的关键决定因素。利用近似贝叶斯计算进行参数推断和动态模拟,模型成功复现了八个肿瘤样本的演化轨迹。结果显示,较低的肿瘤负荷与较高的M1型巨噬细胞浸润及延迟的M3型巨噬细胞激活峰值时间显著相关。生存分析进一步表明,增强的M1型巨噬细胞浸润和延迟的M3型巨噬细胞激活峰值时间均与更长的生存时间相关。该研究为理解肿瘤-巨噬细胞相互作用的动态机制提供了理论框架,并提出了两个潜在的临床预后标志物。

肿瘤免疫数学模型巨噬细胞极化动力学分析预后标志物
AI速览助手