q-bio
03-30 00:00
本研究提出QHap,一种利用量子启发式优化解决单倍型定相(haplotype phasing)这一NP-hard计算难题的新工具。其核心是将定相问题重构为Max-Cut问题,并采用GPU加速的弹道模拟分岔求解器进行求解。在人类高度多态性的MHC区域,QHap在保持零切换错误率的同时,相比现有工具实现了4至20倍的加速。该框架整合了基于读长的区域定相和基于SNP的染色体级定相两种策略,并通过整合染色质构象捕获数据,将定相区块连续性提升了最高15倍,实现了近乎染色体跨度的单倍型重建。
单倍型定相量子启发优化计算基因组学max-cut问题gpu加速
q-bio
03-30 00:00
本研究提出并验证了光谱相干指数(SCI),一种用于评估核磁共振蛋白质结构集合质量的无模型、旋转不变性指标。SCI通过计算模型间距离方差矩阵的参与比有效秩来量化构象变化的协调性,有效区分真实实验集合与合成噪声集合(AUC-ROC达0.973)。在包含110个蛋白质的大型队列测试中,SCI展现出高敏感性与特异性,并与残基水平实验波动数据(RMSF)及高斯网络模型预测的灵活性模式广泛一致。研究表明,SCI最适合作为多指标质量控制工作流的一部分,用于评估异质性蛋白质集合。
蛋白质结构构象异质性质量评估核磁共振无模型指标光谱相干
q-bio
03-30 00:00
本研究评估了在网状进化(如杂交)场景下,传统系统发育比较方法(PCMs)的性能。通过在不同系统发育网络拓扑结构上模拟连续性状演化,并测试基于分叉树假设的PCMs,研究发现,频繁或近期的杂交事件、性状的快速演化(高演化速率)以及超亲分离现象,会显著增加祖先性状估计、演化速率估计和模型选择的误差。这些因素使性状值偏离基于树模型的预期,导致参数估计整体误差增大。研究为研究复杂演化历史的学者提供了重要参考。
系统发育比较方法网状进化性状演化杂交模型评估模拟研究
q-bio
03-30 00:00
本研究利用ADNI队列的1824次T1加权MRI扫描,提出通过计算灰质-白质边界清晰度系数(BSC)的纵向变化率(即每年边界退化速度),来预测轻度认知障碍(MCI)向阿尔茨海默病(AD)转化的时间。该方法聚焦于大脑灰白质界面,将捕捉到的边界退化速率时间斜率特征输入随机生存森林模型进行分析。结果显示,基于BSC斜率的模型测试C指数达到0.63,较基线参数模型(C指数0.24)提升163%。相比昂贵的PET成像($5000-$7000)或需要脑脊液采集的方法,结构MRI($800-$1500)成本更低,此时间生物标志物有望用于患者安全筛查和风险评估。
阿尔茨海默病轻度认知障碍mri影像生存分析生物标志物预测模型
q-bio
03-30 00:00
本研究提出一个多尺度建模框架,将基因组尺度的约束性代谢模型与动态生物反应器模拟相结合。针对动态模拟中反复求解线性规划带来的数值挑战,该工作采用简约通量平衡分析描述胞内代谢,并用神经网络替代模型中的嵌入式优化问题。该代理模型提供了优化映射的光滑近似,避免了模拟过程中的重复求解。在E. coli补料分批发酵的案例中,该模型在底物限制条件下成功预测了胞内通量,而原线性规划问题在此条件下无解。该框架为生物反应器配置中基因组尺度模型的动态模拟提供了连续的胞内代谢表征。
代谢模型多尺度模拟神经网络代理通量平衡分析生物反应器计算生物学
q-bio
03-30 00:00
本文提出了一种基于最大熵和连续归一化流(CNF)的推断框架,用于从观测到的群体神经活动中识别连接性结构。传统方法在训练低秩循环神经网络(lrRNN)时可能恢复出与底层动力学无关的虚假结构。本研究首先刻画了lrRNN中连接性结构的可识别性条件,然后通过流匹配训练,学习与观测动力学一致的、最大无偏的连接权重分布。该方法能捕捉经验数据中发现的复杂分布(如重尾连接),并在合成数据集(产生多稳态吸引子、极限环和环形吸引子)和大鼠前额叶皮层决策记录中得到验证。
神经连接推断流模型最大熵低秩网络动力学系统计算神经科学
q-bio
03-30 00:00
本研究首次对基于无源性控制的闭环神经调控治疗耐药性癫痫进行了严格的数学分析。通过使用经典的Epileptor神经群体模型,研究证明:1)癫痫发作动力学在标准形式下既不被动也不可被动化;2)尽管缺乏无源性,足够强的被动反馈仍能稳定癫痫动态;3)通过适当的输出重设计可使发作动态被动化。该工作为新型闭环神经调控的传感器放置和反馈设计提供了理论框架,有望提升现有仅18%患者无发作的临床疗效。
癫痫控制无源性控制闭环神经调控神经群体模型耐药性癫痫数学分析
q-bio
03-30 00:00
研究发现,印度跳蚁(Diacamma indicum)在集体觅食时,领路者倾向于选择最短路径,但这反而降低了整个蚁群的行进速度,形成了典型的“布雷斯悖论”。该悖论通常归因于自私个体,但本研究通过定量模型揭示,在高度合作的蚁群系统中,进化压力对“最短路径识别”的选择,同样会迫使群体陷入次优的全局状态。这证明了悖论可以在没有个体自私性的情况下,从探索与利用的权衡中自然涌现。
布雷斯悖论蚁群行为探索与利用集体决策复杂系统进化压力
q-bio
03-30 00:00
本研究针对药物警戒领域缺乏可靠参考数据集的难题,开发了一个欧盟范围内的时间索引参考数据集。研究团队从欧盟药品注册中心获取了1513种集中授权产品的当前及历史产品特性摘要,利用DeepSeek V3大语言模型提取不良反应信息,并程序化提取了包括标签变更在内的监管元数据。最终构建的数据库包含1995年至2025年间的17,763个产品特性摘要版本,涵盖110,823个药物-不良反应关联,并精确记录了不良反应被纳入产品标签的时间。该数据集首次整合了不良反应被官方确认的时间信息,支持将分析限制在确认前时期,从而能够更准确地评估信号检测方法的早期预警性能,并为不同分析方法间的比较提供了标准化基准。
药物警戒信号检测参考数据集大语言模型欧盟药品监管不良反应
q-bio
03-30 00:00
本研究对近期关于颅外检测人脑超弱光子发射(UPE)作为脑活动非侵入性生物标志物的说法提出质疑。通过实验发现,在严格暗室条件下,头部UPE信号强度远低于某些研究报告的水平,且检测到的信号主要被背景光主导。此外,波长<600 nm的光子会被头皮和颅骨组织强烈衰减,而更长波长的光子又超出了常用光电倍增管(PMT)的有效光谱响应范围。因此,即使检测到头部UPE,信号也更可能来自头皮而非大脑。研究强调了严谨实验设计的重要性。
超弱光子发射脑活动检测生物光子学实验方法学背景干扰非侵入性生物标志物
q-bio
03-30 00:00
本研究结合条件自回归模型与隐马尔可夫模型,分析了芬兰1750-1850年间基于教区记录的麻疹死亡数据。模型识别出五种具有时空差异的、反复出现的感染状态,揭示了此前未知的传播动态。研究发现,约1812年后,最典型的空间传播模式发生转变,这可能与芬兰重大行政变革后交通网络的变化有关。该方法为复杂时空数据的模式提取提供了新工具。
时空建模传染病动力学隐马尔可夫模型历史流行病学条件自回归
q-bio
03-30 00:00
本文建立了动力系统结构可辨识性分析中微分代数方法与对称性方法之间的理论联系。通过引入“参数对称性”概念——一种保持观测输出不变但改变参数的特殊对称性,作者证明:一个参数组合是局部结构可辨识的,当且仅当它是模型所有参数对称性的微分不变量。该工作统一了传统微分代数方法与基于李对称性的分析框架,并提供了基于参数对称性的可辨识性判定新途径,最后通过两个经典生物数学模型验证了方法的有效性。
结构可辨识性参数对称性微分代数动力系统数学模型系统辨识
q-bio
03-30 00:00
本研究探索了历史语言学中计算谱系学的自动化替代方案。传统方法依赖专家标注的同源词集,耗时且受限。论文比较了两种全自动方法:一种使用单字/概念特征进行自动同源聚类;另一种应用基于配对隐马尔可夫模型的多序列比对(MSA)直接从词汇数据中提取谱系信号。评估显示,MSA方法推断出的谱系树与Glottolog专家分类更一致,能更好地预测类型学变异,并提供更清晰的谱系信号,为突破专家标注瓶颈、实现全球规模的语言谱系研究提供了有前景的可扩展路径。
计算谱系学历史语言学多序列比对自动化方法语言演化谱系信号
q-bio
03-30 00:00
研究通过分析4000多名参与者在Ganzflicker(快速红黑交替闪烁)刺激下产生的幻觉文字描述,发现视觉想象力(从无到生动)的个体差异显著影响幻觉内容。利用自然语言处理工具进行主题建模发现,想象力强的参与者倾向于描述复杂、自然主义的内容(如人脸),而想象力弱的参与者则报告简单的几何图案。此外,通过众包感官运动规范分析,发现想象力强的参与者在描述中使用了感知关联更丰富的语言。这些发现可能反映了早期视觉区域与高阶区域之间协调程度的个体差异。
视觉幻觉视觉想象力ganzflicker自然语言处理主题建模个体差异
q-bio
03-30 00:00
本研究提出了一种名为MarS-FM(马尔可夫空间流匹配)的新型生成模型,用于高效模拟蛋白质分子动力学。传统分子动力学模拟计算成本高昂,而现有生成模型常因学习固定滞后转移密度而受限于频繁但无信息的转变。MarS-FM通过学习底层马尔可夫状态模型定义的离散状态间的转移,实现了比隐式或显式溶剂分子动力学模拟快两个数量级的采样速度。在包含多达500个残基、具有显著化学和结构多样性的蛋白质结构域(包括解折叠事件)的广泛基准测试中,MarS-FM在RMSD、回转半径和二级结构含量等结构观测指标上均优于现有方法。
分子动力学生成模型马尔可夫状态模型蛋白质模拟计算加速流匹配
q-bio
03-30 00:00
本文提出TurboESM,一种针对蛋白质语言模型(PLMs)推理时KV缓存内存瓶颈的3位超高效量化方案。通过创新性地解决旋转位置编码(RoPE)与正交变换的不兼容性,引入面向氨基酸激活流形的头级SVD校准、针对非对称K/V分布的双查找表策略,以及1位量化Johnson-Lindenstrauss残差校正,在ESM-2 650M模型上实现了KV缓存内存从330 MB降至47 MB(7.1倍降低),同时在多种蛋白质家族的自回归解码中保持余弦相似度>0.96。该方法还通过Triton融合内核优化了注意力计算,但因其预填充阶段存在21-27 ms开销,更适用于内存受限而非低延迟短序列场景。
蛋白质语言模型kv缓存量化3位量化旋转位置编码内存优化推理加速
q-bio
03-30 00:00
本研究通过分析RAID数据集,评估了人类对仿射图像失真(旋转、平移、缩放)和高斯噪声的感知响应。使用均方误差(MSE)建立了人类对这些失真的检测阈值,并通过ANOVA和Tukey Kramer检验进行统计分析。结果显示,观察者对高斯噪声最为敏感,其检测阈值最低。傅里叶分析进一步表明,高频分量可作为高斯噪声的视觉掩蔽,高频能量与检测阈值之间存在强相关性。此外,谱方向性影响旋转感知。研究还利用PixelCNN模型发现,图像概率与大多数失真的检测阈值显著相关,表明统计似然性影响人类的视觉容忍度。
视觉感知图像失真检测阈值高斯噪声傅里叶分析pixelcnn
q-bio
03-30 00:00
本研究从生物学通用第一性原理出发,提出了一种多细胞自组织的新理论框架。通过将细胞的基本特性建模为动态图,该理论为理解大肠杆菌等多细胞系统的自组织过程提供了新视角。这一框架有望指导多细胞生物学的实验与计算研究,并为控制和工程化多细胞系统提供理论支持。
多细胞自组织基因调控动态图模型系统生物学生物工程