细胞群体生长模型新解:平方根噪声不影响长期种群适应度
本研究分析了一个具有尺寸调控的细胞群体随机生长模型,其中个体细胞遵循带平方根噪声的指数生长过程。核心发现是:在维持尺寸稳态的所有分裂与调控机制下,种群长期增长率精确等于单细胞平均生长率,表明此类生长噪声对长期适应度是中性的。此外,研究给出了稳态细胞尺寸分布及总细胞数波动的精确解,为区分不同生长噪声机制提供了具体特征。
今日速览 · AI 导读
自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。
AI 导读
今日看点(自动摘要):q-bio: 细胞群体生长模型新解:平方根噪声不影响长期种群适应度;q-bio: Peakspan:量化人类功能巅峰期的新指标;q-bio: STAR-GO:通过整合本体语义与结构提升蛋白质功能预测
数据源:arXiv 官方 RSS(physics / math / cs / q-bio / econ / astro-ph 等)。
标题与摘要由 DeepSeek 进行中文润色,便于快速浏览;外链跳转至原文。
AI 速览助手:点击卡片“速览全文”可拉取 arXiv HTML,生成全文要点并缓存;右下角悬浮按钮可随时展开/收起速览。
自动抓取:每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。
往期回顾:点击上方“往期回顾”进入日历页,按月查看每日抓取总数,并跳转到对应日期速览。
2025-12-08 共 20 条抓取,按综合热度排序
本研究分析了一个具有尺寸调控的细胞群体随机生长模型,其中个体细胞遵循带平方根噪声的指数生长过程。核心发现是:在维持尺寸稳态的所有分裂与调控机制下,种群长期增长率精确等于单细胞平均生长率,表明此类生长噪声对长期适应度是中性的。此外,研究给出了稳态细胞尺寸分布及总细胞数波动的精确解,为区分不同生长噪声机制提供了具体特征。
本文提出“Peakspan”概念,定义为个体在特定生理或认知领域保持其峰值功能至少90%的年龄区间。研究发现,多数生物系统在成年早期达到峰值后迅速衰退,导致功能巅峰期远短于总寿命。这种错位使人类大部分成年期处于“健康但功能衰退”状态。作者认为,延长Peakspan并恢复峰值后个体的功能,是抗衰老医学进步的关键体现,对老龄化社会的持续经济增长至关重要。
本研究提出STAR-GO框架,旨在解决蛋白质功能预测中因基因本体(GO)术语不断更新而导致的模型泛化难题。该模型创新性地将GO术语的文本定义与本体图结构相结合,学习统一的语义表示,并按照层次顺序处理以传播信息。通过将GO表示与蛋白质序列嵌入对齐,STAR-GO在零样本预测任务中取得了最先进的性能,显著提升了对新出现或未见GO术语的预测能力,为生物医学发现提供了更稳健的计算工具。
本研究突破了传统能量模型依赖对称连接的限制,将其拓展至生物更真实的兴奋-抑制(E-I)神经网络。研究揭示了非对称网络中,神经元动力学具有博弈论结构,每个神经元作为最小化自身能量的智能体。结合网络稳定性理论,研究重新审视了Wilson-Cowan等经典模型,并展示了侧抑制微环路作为对比度增强器的功能。该工作为构建生物基础更扎实、动态更稳定的神经架构提供了系统化路径。
本研究提出SSDLabeler框架,用于生成真实、带标注的半合成数据,以解决脑电图伪迹分类任务中训练数据不足的瓶颈。该方法通过ICA分解真实EEG信号,依据RMS和PSD标准进行伪迹验证,并将多种伪迹类型重新注入干净数据,从而生成更贴近真实复杂性的训练数据。实验表明,基于该数据训练的伪迹分类器,在多种条件下的原始EEG数据上,其准确性优于以往基于半合成数据或原始数据训练的方法,为可扩展的伪迹处理提供了新基础。
本研究首次尝试在生态效度高的音乐聆听场景中,使用仅四通道的消费级脑电设备,解码听众对音乐元素的选择性注意力。通过分析受试者在聆听真实录音室制作歌曲时的神经反应,研究证明了在此类轻量化、低负担条件下解码的可行性,且模型性能优于现有方法。该发现为音乐教育、个性化音乐技术和治疗干预等应用开辟了新途径。
本研究针对人类白细胞抗原(HLA)区域复杂的连锁不平衡(LD)结构,开发了一种名为条件信息相关系数(CICC)的新测量方法。该方法整合了条件概率、信息内容和单倍型感知逻辑,克服了传统方法对低频变异和单倍型组成的敏感性限制。应用CICC分析多个人类基因组数据集,在HLA区域发现了10个新的高LD区域,并识别出9个在五大全球人群中共享的强连锁区域。这一成果为疾病基因定位、群体基因组学和精准医学提供了更强大的分析工具。
本研究通过延迟逻辑模型和基于代理的进化模型,揭示了休眠持续时间如何与环境波动的时间尺度相互作用。研究发现,在时间相关的随机环境中,种群适合度与休眠时长呈强烈的非单调关系。极短的休眠能最大化线性增长但放大波动和灭绝风险;极长的休眠能缓冲环境变异性,显著延长平均灭绝时间。而一个广泛的中间休眠时长区间则同时损害增长和持久性,成为‘危险中间带’。进化模型证实了短休眠和长休眠策略之间的双稳态,表明极端策略在波动环境中具有适应性优势。
本研究将种子-链-延伸算法的理论分析扩展至包含插入和缺失(indel)突变的更真实场景。通过建立新的数学模型处理相邻锚点的依赖性和部分正确锚点的问题,证明了在总突变率低于0.159的条件下,最优链的期望可恢复性不低于1 - O(1/√m),期望运行时间为O(mn^{3.15θ_T} log n)。这弥合了先前仅考虑替换突变的理论与实际基因组数据应用之间的差距。
本研究提出一种结合思维链提示、ICD-10编码与临床本体知识图谱的方法,用于提升GPT-4生成临床记录的准确性与专业性。通过将患者基本信息、诊断编码与知识图谱检索结果融入提示工程,该方法在CodiEsp测试数据集上的六个临床案例中,其生成的临床记录质量优于传统的单样本提示方法。这为利用大语言模型自动化生成临床文档、减轻医生文书负担提供了新的技术路径。
本文提出了一种创新的MCP-AI架构,通过将模型上下文协议(MCP)与临床工作流结合,解决了医疗AI系统在上下文推理、长期状态管理和可验证工作流方面的挑战。该框架支持智能体进行长期、自适应和协作式推理,并确保符合临床逻辑与安全标准。研究通过脆性X综合征合并抑郁症诊断、2型糖尿病与高血压远程协调两个用例验证了其有效性,为可解释、可组合且安全导向的临床AI提供了可扩展基础。
本文介绍了Model Gateway,一个专为药物发现流程设计的机器学习与科学计算模型管理平台。该平台集成了大语言模型(LLM)智能体和生成式AI工具,以支持MLOps管道中的核心任务,包括动态共识模型构建、模型注册与管理、信息检索、异步提交/执行以及结果接收。平台包含模型所有者控制面板、管理员工具和API服务,在超过1万个并发客户端测试中实现了零故障率。作为模型驱动药物发现的关键基础设施,Model Gateway有望通过成熟的MLOps框架与AI工具集成,显著加速新药研发进程。
本研究将TopK和Ordered两种稀疏自编码器(SAEs)应用于自回归抗体语言模型p-IgGen,以探究其内部机制并实现生成控制。研究发现,TopK SAEs能有效识别具有生物学意义的潜在特征,但特征与概念的高相关性并不保证对生成过程的因果控制。相比之下,Ordered SAEs通过强加层次结构,能可靠地识别可操控特征,但代价是激活模式更复杂、可解释性降低。该工作推进了领域特异性蛋白质语言模型的机制可解释性研究。
本研究推广了星图结构上的生死与死生Moran过程,将选择机制从恒定适应度扩展至任意光滑的频率依赖适应度函数,涵盖演化博弈等线性特例。在弱选择条件下,通过求解特定常微分方程(组),为大规模星图种群提供了固定概率的连续近似。分析揭示了星图作为放大器、抑制器或等温体的角色取决于初始突变体放置的尺度,并给出了转变的解析阈值。数值实验表明,该近似对中等种群规模和广泛的非线性适应度函数均保持高精度。
基因组数据的爆炸式增长正推动“树思维”从传统的物种系统发育学,深度扩展到种群基因组学和细胞生物学领域。本文综述了在种群中推断祖先重组图、比较基因组学框架以及发育和癌症生物学中的谱系追踪等最新方法进展。尽管数据类型和生物背景不同,这些方法都面临着从基因组信息高效推断分支历史、整合时空信号以及将谱系结构与进化功能过程相连接等核心统计与算法挑战。认识到这些共同基础,为传统上孤立研究的领域之间的交叉融合创造了机会。
本研究提出了一种结合高保真仿真与监督式机器学习的框架,用于优化确定性侧向位移(DLD)微流控芯片的设计。该框架通过模拟细胞在微柱阵列中的变形与迁移,将细胞的弯曲刚度、剪切模量等力学参数映射至变形指数和迁移角度,从而快速预测针对特定细胞类型的最佳DLD几何结构。该方法显著减少了传统试错实验的需求,并提供了可部署的网页界面,以加速实际器件的原型开发。
本研究通过分析46名儿童、青少年及成人在聆听《小王子》时的7400多个颅内电极记录,结合语言学理论与大语言模型表征,训练神经编解码模型,绘制了大脑语言层级的定位、动态及发育图谱。研究发现,广泛的语音特征在幼儿皮层中已有稳健表征,但表征随年龄演变:快速语音特征在幼儿颞上回已存在,而缓慢的词级表征仅在年长个体的联合皮层出现。值得注意的是,大语言模型在训练中自发习得了仅存在于成人大脑中的表征模式。
针对现代组学实验产生的大量差异表达和功能富集分析结果缺乏统一管理的问题,本研究在R/Bioconductor生态系统中开发了DeeDeeExperiment。这是一个新的S4类,扩展了广泛使用的SingleCellExperiment对象,专门设计了用于存储差异表达分析和功能富集分析结果的插槽。它允许用户将多个对比结果及其元数据整合到单一数据对象中,从而提升数据的互操作性、可重复性和可管理性,简化复杂组学数据集的分析流程。
本研究扩展了经典的Kermack-McKendrick流行病模型,创新性地引入了感染年龄结构与再感染机制。理论部分,运用压缩映射原理、控制收敛定理及Volterra积分方程性质,推导出新感染人数N(t)的解析表达式,并建立了求解有效再生数R(t)的方法。实践部分,应用两种独立方法分别分析了2003年新加坡SARS疫情的新增病例数据与中国COVID-19疫情的累计死亡数据,为理解感染年龄结构传播与再感染机制下的疫情动态提供了坚实的理论与计算框架。
本文系统综述了可解释人工智能(XAI)在蛋白质语言模型(pLM)中的应用。作者将蛋白质AI建模流程划分为四个信息上下文(训练序列、输入提示、模型架构、输入-输出对),并针对每个环节描述了现有的XAI方法。研究提炼出XAI在蛋白质研究中可扮演的五种角色(评估者、多任务者、工程师、教练、教师),目前仅有评估者角色被广泛采用。文章最后强调了未来应用的关键领域,包括安全性、可信度和偏见风险,并呼吁建立社区基准、开源工具和湿实验验证,以推动蛋白质AI的可解释性发展。