今日速览 · Fortune Health

q-bio 03-12 00:00

SDSR：基于谱图理论的物种树重建分治算法

本文提出SDSR算法，一种基于谱图理论的可扩展分治方法，用于解决大规模物种树重建中的两大挑战：基因树与物种树之间的不一致性，以及计算复杂度。该方法递归地将物种集划分为子集，使用用户指定的物种树算法（如CA-ML或ASTRAL）构建子树，最后合并成完整树。理论分析表明，在多物种溯祖模型下，SDSR具有恢复保证。实证评估显示，与直接在全数据集上运行相比，结合SDSR可将运行时间缩短高达10倍，同时保持相当的树重建精度。

物种树重建分治算法谱图理论计算效率系统发育学多物种溯祖模型

q-bio 03-12 00:00

JEDI模型：通过共享嵌入空间跨任务推断神经动力学

本研究提出了JEDI（联合嵌入神经动力学推断）模型，旨在解决从有限、嘈杂的高维神经记录数据中识别跨任务神经动力学机制的挑战。该模型通过在学习循环神经网络（RNN）权重之上构建一个共享的嵌入空间，能够在一个统一框架内捕捉不同任务和情境下的神经动态。实验表明，JEDI不仅能准确学习鲁棒且可泛化的条件特异性嵌入，还能通过逆向工程恢复其动力学的基本固定点结构和特征谱（eigenspectra）中的关键特征。最后，模型被应用于猴子伸手运动期间的皮层记录，为运动控制的神经动力学提供了机制性见解。

神经动力学循环神经网络跨任务学习嵌入空间计算神经科学运动皮层

q-bio 03-12 00:00

神经流形线性解码理论：揭示大脑如何高效处理连续变量

本研究发展了一套统计力学理论，将连续变量（如物体位置、大小）的线性解码效率与神经流形的几何特性联系起来。该理论能够处理复杂的神经响应变异性，并成功应用于真实数据，揭示了猴子视觉通路中解码物体位置和大小的能力沿层级递增。这为理解大脑内部表征结构与任务表现之间的关系提供了新的理论框架。

神经解码神经流形统计力学连续变量视觉通路线性回归

q-bio 03-12 00:00

利用受限玻尔兹曼机揭示大规模神经活动中的统计结构

本研究利用受限玻尔兹曼机（RBM）这一统计物理模型，成功分析了来自艾伦研究所视觉行为Neuropixels数据集、覆盖小鼠多个脑区的约1500-2000个神经元的同时记录活动。RBM通过引入隐变量扩展了最大熵模型框架，能够捕捉高阶依赖关系并显式提取有效的神经元相互作用网络。模型生成的数据在成对及高阶相关性、群体活动分布等复杂统计特性上与真实数据高度吻合。推断出的耦合参数揭示了群体活动的协调模式，并显示出清晰的解剖学结构：视觉皮层内的神经元相互作用更强，而跨脑区的耦合则较弱。

计算神经科学统计物理模型大规模神经记录受限玻尔兹曼机高阶相关性有效相互作用

q-bio 03-12 00:00

EAD：自适应去噪调度加速3D分子构象生成

本文提出了一种新的等变异步扩散模型（EAD），用于3D分子生成。该模型结合了异步自回归模型和同步扩散模型的优势：通过异步去噪调度更好地捕捉分子的层次结构关系，同时保持分子级的生成视野。针对复杂关系，模型引入了动态调度机制来自适应地确定去噪时间步。实验结果表明，EAD在3D分子生成任务上达到了最先进的性能。

分子生成扩散模型异步去噪3d构象自适应调度

q-bio 03-12 00:00

从单细胞基础模型scGPT中提取出高效造血算法

本研究首次通过机制可解释性方法，从单细胞基础模型scGPT中提取出一个紧凑且具有生物学意义的造血算法。研究者发现scGPT内部编码了一个具有显著发育分支结构的造血流形。他们提出了一种通用的三阶段提取方法，无需在目标数据集上重新训练，即可将模型内部表示转化为独立的算法。在严格的供体留出基准测试中，该算法在伪时间排序和关键细胞亚型分类（如CD4/CD8 AUROC 0.867）上均优于现有方法，且计算效率显著提升。对提取出的核心算子的分析揭示了其浓缩的生物学逻辑，解析出T/淋巴、B/浆细胞、粒细胞和单核/巨噬细胞四大基因程序。

单细胞分析基础模型机制可解释性造血发育算法提取生物信息学

q-bio 03-12 00:00

如何利用掩码语言模型优化蛋白质工程：提出随机束搜索采样方法

本文针对蛋白质语言模型在优化生物特性时采样方法不足的问题，提出了一种灵活有效的采样策略——随机束搜索。该方法利用掩码语言模型高效评估序列单点编辑邻域伪困惑度的特点，将生成过程重构为全序列评估，从而能够灵活地结合多个优化目标进行引导。研究通过计算机模拟和针对抗体治疗的实际体外实验进行了系统评估，结果表明采样方法的选择对优化效果的影响至少与模型本身同等重要，凸显了这一未充分探索领域的研究价值。

蛋白质工程语言模型采样方法抗体优化机器学习生物信息学

q-bio 03-12 00:00

LabConstrictor：将Jupyter笔记本打包为可安装桌面应用，解决生命科学软件部署难题

生命科学研究依赖开源学术软件，但安装复杂、环境依赖和分发维护困难阻碍了其广泛使用。LabConstrictor通过基于GitHub的自动化流水线，将Jupyter笔记本打包成可一键安装的桌面应用。它自动检查环境依赖，并为用户提供统一的启动页面，包含文档、笔记本链接和版本检查。通过隐藏代码单元格并结合交互控件，提供类似应用程序的体验。该工具简化了开源软件的部署、安装和共享流程，有助于加速新计算方法的传播并促进跨实验室的常规复用。

软件部署jupyter笔记本生命科学开源软件桌面应用可重复性

q-bio 03-12 00:00

SNPgen：基于潜在扩散模型的表型监督基因型表示与合成数据生成

本研究提出SNPgen，一种两阶段条件潜在扩散框架，用于生成表型监督的合成基因型数据。该方法结合GWAS指导的变异选择（1024-2048个与性状相关的SNP）、用于基因型压缩的变分自编码器，以及通过无分类器引导以二元疾病标签为条件的潜在扩散模型。在UK Biobank 458,724名个体针对四种复杂疾病（冠状动脉疾病、乳腺癌、1型和2型糖尿病）的评估中，使用合成数据训练的模型在“合成训练-真实测试”协议下，其预测性能与使用真实数据相当，接近使用2-6倍更多变异位点的全基因组PRS方法。隐私分析确认了零相同匹配、接近随机的成员推断（AUC ≈ 0.50）、保留的连锁不平衡结构以及与源数据的高等位基因频率相关性（r ≥ 0.95）。

合成基因型潜在扩散模型隐私保护gwas变分自编码器多基因风险评分

q-bio 03-12 00:00

连续扩散变换器设计合成调控元件，验证损失降低39%

本研究提出了一种参数高效的扩散变换器模型，用于生成200bp的细胞类型特异性调控DNA序列。通过用配备2D CNN输入编码器的变换器去噪器替换DNA-Diffusion的U-Net主干，模型在13个周期内就达到了U-Net的最佳验证损失（减少了60倍），且收敛损失降低了39%。通过BLAT比对，模型对训练数据的记忆率从5.3%降至1.7%。消融实验表明CNN编码器至关重要，移除后验证损失会增加70%。进一步应用DDPO微调，以Enformer作为奖励模型，预测调控活性提升了38倍。在独立预测任务上与DRAKES进行交叉验证，证实了改进反映了真实的调控信号，而非奖励模型过拟合。

扩散模型变换器合成生物学dna序列生成调控元件设计深度学习

q-bio 03-12 00:00

衣藻“无眼”突变体光趋性反转的细胞透镜效应理论

本研究提出了一个定量理论，解释了衣藻“无眼”突变体光趋性行为与野生型相反的现象。研究完善了细胞体作为透镜聚焦光线的简化分析，并将其整合到光趋性自适应模型中。模型揭示，当细胞折射率高于水时，内部光线会形成焦散，导致光感受器在旋转周期内接收到两种竞争信号：缓慢变化的直接光照信号和快速变化的透镜聚焦信号。光趋性符号的反转源于鞭毛对时间导数更高信号的响应占主导地位。该理论预测了方向选择中的双稳态现象，可通过单细胞追踪实验验证。

光趋性细胞透镜衣藻生物物理模型信号竞争突变体

q-bio 03-12 00:00

跨物种迁移学习：利用小鼠数据提升人类皮层抑制性神经元转录组预测

本研究复制并扩展了Gouwens等人（2020）提出的电生理-转录组学映射框架，利用艾伦研究所公开的小鼠和人类皮层Patch-seq数据集。研究聚焦于GABA能抑制性中间神经元，分析了3,699个小鼠视觉皮层神经元和506个人类新皮层神经元。通过标准化电生理特征和稀疏主成分分析，重现了原研究中的主要类别分离。研究开发了一种基于注意力的BiLSTM模型，可直接处理结构化的IPFX特征族表示，避免了稀疏主成分分析，并通过学习到的注意力权重提供特征族层面的可解释性。最终，评估了跨物种迁移学习设置：模型在小鼠数据上预训练，然后在人类数据上针对对齐的4类任务进行微调，相对于仅使用人类数据训练的基线，提升了人类数据的宏F1分数。这些结果证实了Gouwens流程在小鼠数据中的可重复性，表明序列模型可以匹配特征工程基线，并证明从小鼠到人类的迁移学习可以为人类亚类预测带来可衡量的增益。

跨物种迁移学习电生理-转录组学映射抑制性中间神经元注意力机制patch-seq生物信息学

q-bio 03-12 00:00

丹麦高致病性禽流感从野鸟向牛群传播风险评估模型

本研究开发了一个数据驱动的定量风险评估模型，用于评估高致病性禽流感病毒（HPAIV）从野鸟向丹麦牛群溢出的风险。模型整合了鸟类流感雷达、eBird鸟类观测和牛群密度数据，并利用美国已观察到的溢出数据进行校准。结果显示，在频率依赖模型中，丹麦牛群每周预期引入病例低于0.35例，高风险时段集中在12月至次年3月，高风险区域主要分布在丹麦海岸线和德国边境附近。该模型为加强高风险区域的早期预警和针对性监测提供了科学框架。

禽流感溢出风险风险评估模型数据驱动丹麦野鸟-牛群传播

q-bio 03-12 00:00

MIG-Vis：利用互信息引导扩散模型揭示高级视觉皮层语义选择性

本研究提出MIG-Vis方法，旨在直接揭示高级视觉皮层（如下颞叶皮层）中神经群体如何组织成具有语义选择性的结构化子空间。该方法首先通过变分自编码器从神经群体中推断出解耦的组级潜在子空间，随后利用互信息引导的扩散合成过程，可视化每个潜在组编码的特定视觉语义特征。在猕猴下颞叶皮层的多会话神经尖峰数据集上的验证表明，该方法识别出的神经潜在组对物体姿态、类别间转换及类内内容等多种视觉特征具有清晰的语义选择性，为高级视觉皮层的结构化语义表征提供了直接、可解释的证据。

计算神经科学视觉皮层编码扩散模型语义选择性潜在子空间互信息

q-bio 03-12 00:00

基于LLM代理的组学数据发现框架：将静态文献转化为可执行资源

本研究提出了一种基于大语言模型（LLM）的智能代理框架，旨在解决生物医学组学数据难以被计算复用的难题。该系统能够自动获取组学相关文献，将非结构化信息（如正文、补充文件和代码库中的关键信息）整合并转化为可搜索的研究对象。代理工具集可执行从提取文章元数据、识别下载已发表数据，到运行容器化定量分析流水线等一系列任务。实验表明，该系统从PubMed Central文章中自动提取元数据的精确度达80%，在重新量化蛋白质组学数据时，与原始报道的差异表达蛋白有63%的重叠。更重要的是，代理能够识别语义相似的研究、判断数据兼容性并进行跨研究比较，如在肝纤维化研究中揭示了一致的蛋白质调控模式。该工作为将静态文献大规模转化为可查询、可执行的资源奠定了基础。

组学数据llm代理数据复用生物医学文献自动化分析跨研究比较

q-bio 03-12 00:00

单细胞如何在极低浓度下感知化学信号源方向？

本研究探讨了单细胞在极低化学引诱剂浓度下的方向感知机制。在受体活性呈离散状态、细胞决策时间远短于达到稳态浓度所需时间的条件下，研究推导了受体结合时间与位置的联合分布解析式。分析表明，早期结合事件携带的方向信息量远超后期事件。基于此发现，研究提出了利用早期受体结合统计数据进行信号源定位的估计方法，证明即使仅有少量结合事件，细胞也能快速准确地推断扩散化学信号源的方向。

单细胞传感化学趋向性扩散信号早期事件信息理论生物物理

q-bio 03-12 00:00

疫情下青年心理症状网络模块控制的重分布

本研究分析了2020至2023年间美国14,181名18-24岁青年在五个疫情阶段的心理健康数据。通过构建高斯图模型和识别症状社区，研究发现青年心理症状网络的模块化架构在疫情期间保持稳定，但模块间的控制权发生了显著转移：早期由压力相关症状主导，后期则分散至情绪、认知和社交等多个领域。重采样分析表明，节点强度稳定性高，模块间控制稳定性中等，而模块内平均控制则相对较弱。这提示长期危机可能重塑心理病理学症状域间的控制关系。

心理症状网络模块控制covid-19青年心理健康高斯图模型最小支配集

q-bio 03-12 00:00

ATP浓度与磷酸化自由能调控细胞生化系统中的触发波传播

本研究通过热力学一致的反应-扩散模型，揭示了细胞内ATP浓度与非平衡参数γ（γ = [ATP]/(K_eq[ADP][P_i])）如何调控磷酸化-去磷酸化系统中的触发波动力学。研究发现，ATP和γ不仅调节波速，还能逆转传播方向并重塑支持触发波的参数区间。此外，维持传播所需的最小临界激发半径也依赖于ATP浓度和磷酸化自由能。这些发现将细胞内能量状态确立为触发波行为的调控因子，将代谢条件与波传播的空间动力学联系起来。

触发波atp调控磷酸化反应扩散非平衡热力学细胞信号

q-bio 03-12 00:00

微观优势如何转化为宏观主导：空间竞争中的对称性破缺机制

本研究通过一个随机模型，揭示了竞争种群如何将微小的空间优势转化为宏观主导地位。模型将资源竞争过程解耦为“发现”和“垄断”两个阶段。研究发现，初始的对称性破缺由首次通过时间的极值统计控制：微小的线性空间劣势需要指数级更大的种群规模才能克服。然而，暂时的优势无法稳定主导地位，必须存在非互惠的相互作用偏差，才能抑制局部波动，驱动系统进入稳定的吸收态。

空间竞争对称性破缺极值统计非互惠作用吸收态种群动力学

q-bio 03-12 00:00

相场模型模拟细胞凋亡过程，助力癌症治疗研究

本研究提出了一个相场模型框架，用于模拟由激活场诱导的内在或外在细胞凋亡过程，并推导了其背后的构型力学原理。该模型能够探索启动或减少凋亡所需的不同条件，可作为计算治疗测试的起点。通过模拟，研究展示了改变凋亡机制时产生的不同类型细胞动力学，并应用于探究细胞收缩、膜起泡、空腔形成和碎片化等形态转变。最后，将模拟特征与电子显微镜图像进行比较，为模型提供了额外支持。

相场模型细胞凋亡计算生物学癌症研究形态转变

24 小时跨学科精选

定量生物学

2026-03-12 速览 · 定量生物学

SDSR：基于谱图理论的物种树重建分治算法

JEDI模型：通过共享嵌入空间跨任务推断神经动力学

神经流形线性解码理论：揭示大脑如何高效处理连续变量

利用受限玻尔兹曼机揭示大规模神经活动中的统计结构

EAD：自适应去噪调度加速3D分子构象生成

从单细胞基础模型scGPT中提取出高效造血算法

如何利用掩码语言模型优化蛋白质工程：提出随机束搜索采样方法

LabConstrictor：将Jupyter笔记本打包为可安装桌面应用，解决生命科学软件部署难题

SNPgen：基于潜在扩散模型的表型监督基因型表示与合成数据生成

连续扩散变换器设计合成调控元件，验证损失降低39%

衣藻“无眼”突变体光趋性反转的细胞透镜效应理论

跨物种迁移学习：利用小鼠数据提升人类皮层抑制性神经元转录组预测

丹麦高致病性禽流感从野鸟向牛群传播风险评估模型

MIG-Vis：利用互信息引导扩散模型揭示高级视觉皮层语义选择性

基于LLM代理的组学数据发现框架：将静态文献转化为可执行资源

单细胞如何在极低浓度下感知化学信号源方向？

疫情下青年心理症状网络模块控制的重分布

ATP浓度与磷酸化自由能调控细胞生化系统中的触发波传播

微观优势如何转化为宏观主导：空间竞争中的对称性破缺机制

相场模型模拟细胞凋亡过程，助力癌症治疗研究