q-bio
04-03 00:00
本研究通过提取静息态脑电的多种可解释特征,探索帕金森病(PD)的皮层网络动力学改变。特征分为标准特征(如谱功率、相位同步)和动力学特征(如非周期活动、神经元雪崩统计)。研究发现,标准特征能有效区分PD患者的用药状态(PDoff vs PDon),而动力学特征在区分PD患者与健康对照时表现优异。组间比较揭示了PD患者存在δ功率降低、θ相位同步增强以及跨频率耦合改变等特征。结果表明,动力学特征能提供疾病相关的皮层网络组织改变的补充信息,为开发非侵入性PD生物标志物提供了新框架。
帕金森病脑电图网络动力学生物标志物机器学习
q-bio
04-03 00:00
本研究提出了一种新颖的双视图混合模型框架,用于对不规则采样的纵向数据进行聚类分析。该框架将静态基线协变量与纵向生物标志物轨迹整合在一个统一的概率模型中,其中时间模式通过神经常微分方程进行建模。模型训练采用期望最大化算法,并引入稀疏性对数惩罚项,以增强子群发现的解释性。将该模型应用于爱尔兰ANCA相关性血管炎患者队列,成功识别出血清肌酐轨迹异质且终末期肾病结局存在差异的亚组。
纵向聚类混合模型神经ode疾病亚型血管炎生物标志物
q-bio
04-03 00:00
本研究利用秀丽隐杆线虫完整的突触和神经肽连接组,构建了一个统一的多层网络框架,将解剖结构与功能通信联系起来。通过统计物理的平衡原理,从突触连接组推断出结构衍生的功能连接性,并将其与非突触连接组直接比较。结果揭示了四种通信机制的功能专门化:拓扑依赖层(稳定运动回路)、拓扑弹性调制层(支持全局调控)、纯非突触网络(维持生存与稳态)以及纯突触机制(介导快速感觉运动处理)。这些发现表明,突触与非突触信号形成了互补的架构,分别优化了速度、调制、鲁棒性和生存,为理解不同通信模式如何协同维持大脑功能提供了通用策略。
神经连接组学非突触信号多层网络功能专门化秀丽隐杆线虫统计物理模型
q-bio
04-03 00:00
本研究首次对复杂大规模血管网络中的分子通信进行了系统的通信理论分析。基于新建立的MIGHT闭合解析信道模型,推导了泊松信道噪声模型,并揭示了血管网络中的分子通信与无线多径通信之间的结构相似性。研究建立了适用于分子通信的经典多径信道度量(如均方根时延扩展、相干带宽),并推导了信道频率响应和功率时延分布的闭合表达式。在此基础上,提出了一种适用于血管网络的相干判决反馈检测器,并展示了如何利用多径度量来指导关键系统参数的选择。
分子通信血管网络多径信道信道建模信号检测通信理论
q-bio
04-03 00:00
本研究建立了一个自洽的自由能框架,通过同时最小化膜的弯曲弹性和溶质熵,在有限溶质库中共同确定膜的形状和渗透压。该模型将渗透压视为热力学变量而非外部参数,揭示了膜力学与溶剂熵之间的非线性耦合。这种耦合修正了球形囊泡的经典Helfrich稳定性判据,不稳定性源于全局自由能竞争而非线性分析。计算得到的临界压力与Helfrich预测值相差数个数量级,并与大小单层囊泡的模拟结果一致。该框架适用于涉及生物分子凝聚物限域、合成囊泡以及渗透压驱动封装平台开发的细胞环境。
膜生物物理学渗透压囊泡形变自由能模型稳定性分析软物质
q-bio
04-03 00:00
随着生物数据集规模超过系统内存,数据访问已成为机器学习训练的主要瓶颈。annbatch是一个原生集成于anndata的mini-batch加载器,支持直接在磁盘数据集上进行核外训练。在单细胞转录组、显微镜图像和全基因组测序基准测试中,annbatch将数据加载吞吐量提升了一个数量级,并将训练时间从数天缩短至数小时,同时完全兼容scverse生态系统。它为可扩展的生物AI建立了实用的数据加载基础设施。
生物信息学大数据训练单细胞分析数据加载优化scverse生态
q-bio
04-03 00:00
本研究提出了一种名为“数据筛分”的GPU加速采集框架,旨在解决高通量固态纳米孔实验中产生的海量数据存储与处理瓶颈。该框架将实时事件检测集成到测量流水线中,通过轻量级的滚动平均和最小-最大值触发算法,并行识别跨通道的分子易位候选事件,并选择性地存储和分析易位时刻附近的数据快照。该系统能将存储数据量减少高达98%,同时完整保留从微秒级蛋白质动力学到秒级核酸纳米颗粒事件的全时间范围分子特征。连续基线监测还支持自主闭环控制,例如在高浓度DNA实验中实现自动去堵塞,将非生产性堵塞状态时间降至接近零,且不中断并行测量。该框架为长时程、高带宽单分子实验及其他事件驱动传感平台提供了硬件无关的基础。
纳米孔传感实时处理数据压缩gpu加速事件检测单分子分析
q-bio
04-03 00:00
本文提出QuantumXCT,一种混合量子-经典生成框架,将细胞间通讯推断重新定义为学习细胞状态分布间由相互作用诱导的状态转换问题。该方法将转录组谱编码到高维希尔伯特空间,训练参数化量子电路来学习将基线非相互作用细胞状态映射到相互作用状态的酉变换,从而无需先验生物学假设即可发现通讯驱动的细胞状态分布变化。模型在合成数据和卵巢癌-成纤维细胞共培养系统的单细胞RNA-seq数据上得到验证,能够准确恢复复杂的调控依赖关系(包括反馈结构),并识别出如PDGFB-PDGFRB-STAT3轴等主导通讯枢纽。
量子机器学习细胞通讯生成模型单细胞转录组状态转换量子电路
q-bio
04-03 00:00
本文提出了一种名为CEP-IP的新型可解释机器学习框架,旨在识别单细胞RNA测序数据中具有强成对单调基因模块关系的细胞亚群。该框架以目标基因为核心,通过Spearman-Kendall双重过滤识别共表达基因,利用广义可加模型量化关系强度,并通过拐点分析将转录空间分层。在三个独立数据集(前列腺癌、大脑皮层、胶质母细胞瘤)上的验证表明,CEP-IP能够识别出具有不同生物学功能的细胞亚群,例如免疫相关过程或核糖体/翻译通路富集的细胞。
单细胞转录组可解释ai细胞亚群基因共表达拐点分析生物信息学
q-bio
04-03 00:00
本研究提出了BIOGEN,一个用于RNA-seq转录模块事后解释的、基于证据的多智能体推理框架。该框架结合了生物医学检索、结构化推理和多评判验证,旨在生成具有明确证据和置信度标签、可追溯的簇级解释。在沙门氏菌数据集上,BIOGEN在BERTScore(0.689)、语义对齐分数(0.715)和KEGG功能相似性(0.342)方面表现优异,且幻觉率为0.000,显著优于仅使用大语言模型的基线(0.100)。在另外四个细菌RNA-seq数据集上,BIOGEN在相同固定流程下也保持了零幻觉率。结果表明,仅靠检索不足以实现可靠的生物学解释,基于证据的编排对于透明且可溯源的转录组学推理至关重要。
转录组学抗菌耐药性多智能体推理证据溯源rna-seq分析生物信息学
q-bio
04-03 00:00
研究团队通过两个关键创新显著提升了单细胞生物学基础模型的性能:一是将预训练数据规模扩展至1.16亿个细胞,远超现有模型;二是首次在预训练中大规模利用生物标注作为监督信号。由此训练出的TEDDY模型家族包含6个基于Transformer的模型(参数量7000万至4亿),在多项下游任务(如识别未见过的供体疾病状态、区分病变与健康细胞)中表现大幅超越现有方法,且性能随数据量和参数规模可预测地提升。
单细胞测序基础模型生物标注transformer疾病识别ai生物医学
q-bio
04-03 00:00
本研究提出Nullstrap-DE通用框架,旨在解决RNA-seq差异表达分析中假发现率控制与统计功效难以平衡的核心挑战。该框架无需修改DESeq2、edgeR等现有方法的实现,通过从基因特异性零假设下拟合的模型生成合成零数据,并应用相同的检验统计量,从而推导出满足目标FDR水平的阈值。理论证明其能渐近控制FDR并保持功效一致性。模拟与真实数据应用表明,Nullstrap-DE能在多种场景下实现可靠的FDR控制与高统计功效,优于单独使用参数方法或非参数检验。
差异表达分析假发现率控制统计功效rna-seq计算生物学生物信息学
q-bio
04-03 00:00
本研究提出DeepIMC(深度逆映射校准)框架,用于解决基于智能体(ABM)的流行病模型校准计算量大的难题。该方法利用双向长短期记忆(BiLSTM)神经网络,直接从合成的流行病时间序列数据中学习到流行病学参数的逆映射关系,从而在推理时无需重复模拟即可快速估计参数。与传统的近似贝叶斯计算(ABC)方法相比,DeepIMC在5000个异质疫情场景的模拟研究中,显著提高了参数恢复的准确性,生成了更精确的预测区间,并将计算时间缩短了一个数量级以上。该框架已集成于开源R包epiworldRCalibrate中,为实时疫情建模与政策分析提供了高效工具。
机器学习流行病模型模型校准智能体模型参数估计计算加速
q-bio
04-03 00:00
本研究提出了一种数据驱动的快速眼动睡眠(REMS)倾向性测量方法,定义为在积累额外非快速眼动睡眠(NREMS)之前进入REMS的概率。通过分析人类、大鼠和小鼠的睡眠周期数据,研究发现三个物种的REMS倾向性均随NREMS时间增加而上升至峰值,随后衰减。在REMS开始时,其倾向性与REMS持续时间呈正相关,表明NREMS时长不仅影响REMS的发生,也影响其持续时间。该发现为理解哺乳动物超短睡眠周期的调控机制提供了新视角。
睡眠周期快速眼动睡眠非快速眼动睡眠跨物种研究数据驱动模型
q-bio
04-03 00:00
本研究提出了并行化分层连接组(PHC)框架,将传统仅处理时间序列的状态空间模型(SSM)升级为时空循环网络。PHC的核心创新在于将SSM的神经元层与突触层解耦,并引入多传输循环机制,使信号能在每个时间窗口内沿分层连接组进行空间传播,同时保持O(logT)的并行计算效率。该框架首次实现了在完全可并行化的训练流程中,整合脉冲神经网络动力学与SSM并行性,并强制执行包括Dale定律、短期可塑性在内的五项生物学约束。在UEA多元时间序列基准测试中,PHCSSM模型在性能上与最先进的SSM相当,同时将参数复杂度从$\Theta(D^2 L)$降低至$\Theta(D^2)$。
脉冲神经网络状态空间模型时空循环并行计算生物约束参数高效
q-bio
04-03 00:00
本研究针对肿瘤在免疫应答和治疗干预下的进化与生态动力学难题,构建了数学模型,描述效应细胞、化疗耐药肿瘤细胞和免疫耐药肿瘤细胞在不同免疫逃逸策略下的相互作用。模型纳入了耐药与敏感肿瘤亚群间的竞争与合作关系,识别了在不同治疗强度下决定肿瘤持续、消除及表型优势的阈值条件。这些结果为设计靶向与联合疗法提供了理论框架,并为缓解治疗耐药性提供了策略见解。
肿瘤进化免疫逃逸化疗耐药数学模型联合疗法阈值条件
q-bio
04-03 00:00
本研究在膝关节接触力学的有限输入条件下,系统评估了五种深度代理模型架构。研究基于足球运动员变向动作的有限元模拟数据,在完整、姿态干扰、载荷干扰及最小输入四种条件下进行跨受试者验证。结果表明,在完整输入下,局部-全局混合模型表现最佳且鲁棒性最强;而在最小输入条件下,不同模型各有优势:历史上下文模型在整体和高应力区域误差更低,混合模型能更好地重建高风险区域,分层模型则在热点定位上表现更优。研究强调,评估应转向关注现实输入约束下风险相关信息的保留能力。
生物力学深度学习代理模型膝关节有限元分析模型评估
q-bio
04-03 00:00
本研究针对脑电图(EEG)分析中数据段边缘的相位估计不准确问题,评估了四种常用方法(Phastimate、SSPE、ETP、PhastPadding)的性能,发现它们存在系统性偏差和相位偏移。为解决此问题,作者提出了自回归填充相位估计(PEAP)方法,该方法能有效防止强带通滤波引起的伪影。与现有方法相比,PEAP无显著偏差,并将连续相位估计的准确率提高了3.2%至9.2%。分析表明,现有方法的系统性偏差可能影响相位依赖性研究结果的有效性和可比性,而PEAP为此提供了一个更可靠、更准确的替代方案。
脑电图分析相位估计自回归填充系统偏差信号处理神经科学
q-bio
04-03 00:00
本研究针对系统发育相关连续性状的进化建模,提出了一种贝叶斯推断框架,用于处理由多个参数子过程组成的混合高斯系统发育模型(MGPMs)。该方法基于易于并行化的群体蒙特卡洛(PMC)算法,并采用高效算法计算系统发育相关观测值的似然。研究通过模拟测试验证了方法的推断和模型评估能力,并在真实数据集上应用表明,基于自然分类精心选择的进化模型能更好地拟合观测数据。相关方法已集成于R包bgphy中。
贝叶斯推断系统发育学混合高斯模型连续性状进化蒙特卡洛方法模型评估
q-bio
04-03 00:00
本研究探讨了磁共振测量神经组织中质子自旋相干性,能否作为探测从分布式信念到承诺行动转变的“边界几何”的物理探针。分析表明,检测到的信号是双量子SU(1,1)对相干的特征,与短期记忆表现和清醒时的心脏相位动态相关。研究建立了抽象几何框架与物理自旋系统之间的数学桥梁——Bures度量,并认为该信号标志着系统进入了单模压缩耗尽、集体跨模压缩出现的深度边界状态。
神经科学量子相干磁共振几何框架边界状态集体压缩