今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

计算机科学

2026-03-18 03-18 15:41

今日计算机科学领域研究呈现“效率优化、安全增强与多模态融合”的鲜明趋势,模型推理、数据检索与专业应用是核心看点。

  • 研究问题/方法/主要发现/意义与应用
    1. 模型效率与推理优化:针对大模型与神经渲染的计算瓶颈,研究通过改进训练范式(如递归主干模型分离内外深度)、引入自适应采样(如SAC-NeRF)或构建高效记忆系统(如NextMem),在显著提升训练/推理速度的同时保持甚至提升性能,为部署更强大的AI模型提供了关键技术路径。
    2. 多模态数据检索与理解:面对海量异构数据,研究致力于开发统一的检索框架(如Finder)和评估多模态模型的实际应用能力(如视障导航辅助)。核心挑战在于高效融合不同模态信息并准确理解复杂场景,这对构建下一代智能信息系统至关重要。
    3. AI安全与隐私保护:研究重点覆盖模型行为对齐(如CCLUB的动态社会对齐)、防御隐蔽攻击(如DRCB阻断隐写共谋)以及保障数据隐私(如QKD联邦学习)。这些工作旨在建立可审计、可干预且能抵御动态威胁的可靠AI系统。
    4. 专业领域模型适配:研究探索如何将通用大模型有效应用于医疗(如联邦学习预测脓毒症)、工程(如GSI Agent处理绿色基础设施)等专业领域。关键是通过引入领域知识(如知识图谱)、优化数据表示(如EHR分词策略)来弥补模型的专业知识鸿沟,减少“幻觉”。
    5. 基础模型能力边界探索:基准测试(如AIDABench)揭示顶尖AI模型在端到端复杂数据分析任务上仍存在明显不足(得分不足60%),而理论研究(如基尼指数优化)则致力于揭示和改善模型在分类等基础任务中的性能失衡问题,共同推动对模型当前能力极限的认知。
    6. 生成模型的物理与逻辑约束:研究尝试将物理规律(如流体方程)或符号逻辑(如知识图谱查询)整合到生成模型(如视频扩散、神经符号推理)中,以生成更符合物理真实或逻辑一致的结果,提升生成内容的可信度与可解释性。

2026-03-18 速览 · 计算机科学

2026-03-18 共 24 条抓取,按综合热度排序

← 返回日历
cs 03-18 00:00

SAC-NeRF:基于强化学习的自适应光线采样方法,提升神经辐射场渲染效率

本文提出SAC-NeRF,一种基于Soft Actor-Critic强化学习的框架,用于优化神经辐射场(NeRF)中计算密集的光线采样过程。该方法将采样建模为马尔可夫决策过程,智能体根据场景特征学习自适应采样策略。核心创新包括:提供不确定性估计的高斯混合颜色模型、平衡质量与效率的多组件奖励函数,以及应对环境非平稳性的两阶段训练策略。实验表明,该方法在Synthetic-NeRF和LLFF数据集上,能在保持渲染质量(PSNR下降仅0.3-0.8 dB)的同时,减少35-48%的采样点,证明了数据驱动采样策略的有效性。

神经辐射场强化学习自适应采样计算机视觉渲染优化soft actor-critic
cs 03-18 00:00

Finder:多模态AI驱动的药物数据检索框架

Finder是一个可扩展的AI驱动框架,旨在解决传统药物搜索系统在处理多模态内容和手动管理方面的不足。它通过混合向量搜索技术,统一检索文本、图像、音频和视频内容,结合了稀疏词汇模型和密集语义模型。其模块化流程支持多种格式的数据摄取、元数据丰富化,并将内容存储在向量原生后端。该系统已处理超过291,400份文档、31,070个视频和1,192个音频文件,涵盖98种语言。通过混合融合、分块和元数据感知路由等技术,Finder实现了在监管、研究和商业领域的智能访问,提高了搜索的精确度和上下文相关性。

多模态检索药物搜索混合向量搜索ai框架语义搜索
cs 03-18 00:00

视觉语言模型在视障人士导航辅助中的应用潜力与局限

本研究评估了GPT-4V、GPT-4o、Gemini-1.5-Pro、Claude-3.5-Sonnet等闭源模型及Llava系列开源模型在辅助盲人与低视力人群导航任务中的表现。研究聚焦于模型在环境障碍物计数、相对空间推理和常识性寻路场景理解等基础视觉技能上的能力。结果显示,GPT-4o在所有任务中表现最优,尤其在空间推理和场景理解方面;而开源模型在复杂环境中的细微推理和适应性方面存在不足。当前模型普遍面临杂乱环境中物体计数不准、空间推理存在偏差、过度关注物体细节而忽视空间反馈等问题,限制了其实际可用性。研究表明,通过更好地结合人类反馈并增强空间推理能力,视觉语言模型在寻路辅助领域具有发展潜力。

视觉语言模型导航辅助视障人士空间推理人机交互辅助技术
cs 03-18 00:00

物理信息视频扩散模型:同时生成水流物理状态与视觉输出

本研究提出了一种物理信息视频扩散框架,用于求解带地形变化的二维浅水方程。传统流体模拟结合数值求解与渲染,计算成本高昂;而纯数据驱动的视频扩散模型则常忽略物理规律。本方法将物理约束直接整合到生成过程中,无需单独的渲染步骤,即可同时预测物理状态并生成逼真视频。实验表明,该方法在真实感与物理保真度上均优于纯数据驱动的基线模型,且生成速度远超传统“模拟+渲染”流程。

物理信息模型视频生成浅水方程流体模拟扩散模型
cs 03-18 00:00

NextMem:为LLM智能体构建潜在事实记忆框架

本文提出了NextMem,一种用于基于大语言模型(LLM)智能体的潜在事实记忆框架。针对现有文本记忆方法上下文负担重、参数化方法存在灾难性遗忘和高成本的问题,NextMem利用自回归自编码器高效构建潜在记忆,并确保准确重构。其核心创新包括两阶段训练过程(自回归重构对齐与渐进潜在替换)以及量化技术以降低存储开销。实验表明,NextMem在检索性能、鲁棒性和可扩展性方面均表现优异。

大语言模型智能体记忆自编码器潜在表示知识检索模型优化
cs 03-18 00:00

递归主干模型:通过稳定迭代算子实现高效推理与测试时扩展

本文提出递归主干模型(RSM),一种改进的递归推理方法。RSM保留了TRM风格的骨干网络,但改变了训练范式,使网络学习一个稳定、深度无关的转移算子。其核心创新在于:训练时完全分离隐藏状态历史,将早期迭代视为分离的“预热”步骤,并仅在最后一步应用损失函数。该方法还通过独立增长外递归深度$H$和内计算深度$L$,并采用随机外转移方案来缓解深度增加时的不稳定性。结果实现了比TRM快20倍以上的训练速度,同时提升准确率(错误率降低约5倍),并支持测试时扩展,推理可运行任意多步精炼步骤(例如$H_{\text{test}} \sim 20,000 \gg H_{\text{train}} = 20$),实现无需重新训练的额外“思考”。在Sudoku-Extreme和Maze-Hard等NP难题上取得高精度。

递归推理稳定训练测试时扩展迭代精炼np难题求解深度学习
cs 03-18 00:00

结构化电子病历基础模型中的分词策略权衡研究

本研究系统评估了结构化电子病历(EHR)基础模型预训练中的分词策略对下游任务性能与计算效率的影响。通过儿科EHR数据的因子设计实验,发现联合事件编码与位置时间编码在74项临床预测任务中的73项和71项上表现最优,同时分别减少了39.5%和9.6%的预训练浮点运算。针对性消融实验表明,优势源于将代码-属性对组合为单一标记的局部绑定效率,避免了模型在预训练中学习跨标记关联。在成人ICU队列的外部验证中,该优势在存在显著词汇不匹配时仍具泛化性,而时间和工作流效应则更具机构特异性。

电子病历基础模型分词策略临床预测计算效率transformer
cs 03-18 00:00

XLinear:结合频域增强与交叉滤波的鲁棒长时序预测模型

本文提出XLinear,一种基于MLP的长时序预测模型。针对MLP难以捕捉长程依赖的问题,模型将时序分解为趋势项与季节项。对于包含长程特征的趋势项,设计了增强频域注意力机制,利用频域操作捕获长期依赖。对于季节项,则提出交叉滤波模块以保持模型对噪声的鲁棒性,避免注意力机制常导致的低鲁棒性问题。实验表明,XLinear在保持MLP模型轻量架构与高鲁棒性的同时,在长程依赖捕捉能力上超越了其他基于MLP的预测器,并在测试数据集上取得了最先进的性能。

时序预测长程依赖频域分析鲁棒性mlp模型
cs 03-18 00:00

交替强化学习框架:用结构化评价提升模型性能与训练效率

本文提出交替强化学习与准则奖励框架,解决了传统方法将多维结构化奖励线性压缩为标量时,对人工评分设计敏感且忽略维度间相关性的问题。该框架通过交替优化单个语义准则元类,无需固定权重标量化。理论分析揭示了奖励聚合带来的方差收缩效应。实验在HealthBench数据集上证明,该方法在不同规模模型上,于模型性能和训练效率方面均优于标量化方法。

强化学习结构化奖励交替优化人工智能模型训练
cs 03-18 00:00

CCLUB:通过在线提示路由实现大语言模型的社会对齐自适应

针对大语言模型部署后静态安全策略难以应对动态攻击和多元安全规范的问题,本研究提出了一种无需重新训练的推理时治理框架CCLUB。该框架通过系统提示路由实现自适应社会对齐,其核心是保守共识聚类机制,仅在效用与安全相似图的交集内汇集数据,有效防止了语义相近但风险相异情境下的不安全泛化。理论分析表明CCLUB具有次线性遗憾保证,实验验证其在累积奖励上提升10.98%,平均次优差距降低14.42%。

大语言模型社会对齐在线学习提示工程安全治理多臂老虎机
cs 03-18 00:00

RegGAN:通过回归层与对抗训练提升面部表情合成的泛化能力

本文提出了一种名为RegGAN的新模型,旨在解决现有条件生成对抗网络(GAN)在面部表情合成任务中,当测试图像与训练数据分布不同时性能下降的问题。RegGAN的核心创新在于引入了一个具有局部感受野的回归层,通过岭回归损失学习表情细节,并结合一个对抗训练的细化网络来提升生成图像的真实感。在CFEE数据集上的实验表明,RegGAN在表情分类分数(ECS)、Fréchet Inception距离(FID)和QualiCLIP等指标上超越了六种先进模型,并且在人类评估中,其表情质量、身份保持度和真实感分别领先最佳竞争模型25%、26%和30%。

生成对抗网络面部表情合成图像生成泛化能力计算机视觉
cs 03-18 00:00

量子密钥分发保障的联邦学习框架,用于6G网络信道估计与雷达频谱感知

本文提出了一种由量子密钥分发(QKD)保障安全的联邦学习框架,用于下一代(6G/Beyond 6G)网络中的无线信道估计与雷达频谱感知。该框架采用BB84协议抽象和成对加性掩码技术,客户端(使用CNN进行信道估计,U-Net进行雷达分割)仅上传被掩码的模型更新。服务器在无法观察明文参数的情况下完成聚合;没有QKD密钥的窃听者无法恢复任何个体更新。实验表明,该安全联邦学习框架在信道估计上达到0.216的NMSE,在雷达感知上达到92.1%的准确率和0.72的mIoU。当存在窃听者时,量子比特误码率(QBER)上升至约25%,所有训练轮次按设计中止;模型重构误差保持在$10^{-5}$以下,证实了聚合的正确性。

量子密钥分发联邦学习6g网络信道估计雷达感知网络安全
cs 03-18 00:00

PID方法:受细胞生死启发的原型动态调整机制,提升OOD检测性能

本文提出一种名为PID(原型生死)的新型方法,用于提升机器学习模型的分布外(OOD)检测能力。针对现有基于原型的方法使用固定原型数量、难以适应不同类别内在复杂度差异的问题,PID受生物学中细胞生死过程启发,在训练过程中引入两个动态机制:原型“诞生”机制在现有原型表征不足的数据区域实例化新原型,以精细捕捉类内子结构;原型“死亡”机制则通过评估原型的判别性,修剪边界模糊的原型以强化决策边界。通过这种动态调整,模型能根据数据复杂度学习到更紧凑、分离度更高的分布内(ID)嵌入表示,从而显著增强OOD样本的检测能力。实验表明,PID在CIFAR-100等基准测试上显著优于现有方法,尤其在FPR95指标上达到了最先进的性能。

ood检测原型学习动态机制表示学习机器学习安全
cs 03-18 00:00

联邦学习框架结合知识图谱与时序Transformer,实现多中心ICU脓毒症早期预测

本研究提出一种新颖的联邦学习框架,用于解决多中心ICU脓毒症早期预测中的数据隐私与复杂时序建模难题。该框架创新性地融合了医学知识图谱以引入结构化医疗关系,并使用时序Transformer模型捕捉临床时间序列数据中的长程依赖。通过引入模型无关元学习(MAML)策略,提升了全局模型对本地数据分布的快速适应能力。在MIMIC-IV和eICU数据集上的评估显示,该方法的AUC达到0.956,相比传统集中式模型提升22.4%,相比标准联邦学习提升12.7%,为多中心协作的隐私保护预警提供了可靠方案。

联邦学习知识图谱时序transformer脓毒症预测元学习医疗ai
cs 03-18 00:00

自反思程序搜索:利用不确定性提升长上下文语言模型性能

本文针对语言模型处理长上下文时信息提取与推理不可靠的挑战,提出了SRLM框架。该框架在递归语言模型的基础上,引入了基于不确定性的自反思机制,利用模型内部的一致性、推理长度和置信度作为信号,来评估和选择最优的上下文交互程序。实验表明,SRLM在多种基准数据集和模型上均优于现有方法,在相同时间预算下性能提升最高达22%。研究发现,递归本身并非性能提升的关键,而简单的自反思程序搜索即可实现更优效果,尤其在语义密集型任务中表现突出。

长上下文处理不确定性估计自反思机制程序搜索语言模型推理
cs 03-18 00:00

揭示基尼指数在提示分类中的隐藏作用:检测与优化类别准确率失衡

本研究揭示了基尼指数在提示分类任务中作为检测和优化类别准确率失衡的隐藏作用。研究发现,无论是文本还是图像分类,都存在少数优势类别主导预测、而长尾类别准确率低的问题。作者提出了一种模型无关的后处理偏置缓解方法,利用基尼指数直接优化。在少样本新闻、生物医学和零样本图像分类上的实验表明,该方法能显著减少相对和绝对准确率失衡,在抑制优势类别主导的同时提升最弱类别的性能。

基尼指数提示分类类别失衡偏置缓解长尾分布模型公平性
cs 03-18 00:00

动态表征电路中断器:在MARL中检测并阻断隐写式共谋的新防御架构

针对去中心化多智能体强化学习(MARL)中智能体可能通过隐写术建立私有通信协议以规避监控的安全威胁,本研究提出了动态表征电路中断器(DRCB)。该方法基于AI母语框架,利用向量量化变分自编码器(VQ-VAE)将不可观测的消息转换为可审计的统计对象,并通过监控Jensen-Shannon散度漂移、L2范数码本位移等信号计算指数移动平均共谋分数。当分数超过阈值时,系统将触发从梯度空间惩罚到完全重置优化器状态的四级干预。在基于MNIST标签的上下文囚徒困境实验中,DRCB将观察者平均准确率从0.858提升至0.938,波动性降低43%,同时保持了联合奖励水平。该方法为自主系统的部署前审计提供了一条技术路径。

多智能体强化学习ai安全隐写通信表征学习可审计性防御架构
cs 03-18 00:00

超声人机接口的参数高效深度学习模型研究

本研究针对基于超声的手部姿态估计问题,在公开数据集Ultra-Pro上系统比较了六种深度学习模型。研究发现,通过采用步进学习率调度器并使用射频信号包络作为输入,一个仅4层的UDACNN模型在参数量减少87.52%的情况下,性能超越了XceptionTime模型2.28个百分点,达到77.72%的准确率,较先前基线绝对提升0.88%。结果表明,模型架构、预处理与训练策略的恰当组合对优化人机接口性能至关重要。

超声成像人机交互手部姿态估计参数高效深度学习模型比较
cs 03-18 00:00

HYQNET:在双曲空间中实现神经符号逻辑查询推理

本研究提出HYQNET模型,用于在知识图谱上回答复杂一阶逻辑查询。该模型将神经与符号方法结合,通过将查询分解为关系投影和模糊集上的逻辑运算来增强可解释性。为处理知识图谱的不完整性,HYQNET采用基于双曲图神经网络的方法在双曲空间中完成知识图谱补全,有效嵌入递归查询树并保持结构依赖。利用双曲表示能比欧几里得方法更有效地捕捉逻辑投影推理的层次结构。在三个基准数据集上的实验表明,HYQNET实现了优越性能,凸显了在双曲空间中进行推理的优势。

神经符号推理知识图谱双曲空间逻辑查询图神经网络一阶逻辑
cs 03-18 00:00

AIDABench:首个端到端AI数据分析基准测试,顶尖模型得分不足60%

研究团队推出AIDABench,一个用于端到端评估AI系统复杂数据分析能力的综合性基准。该基准包含600多个多样化文档分析任务,涵盖问答、数据可视化和文件生成三大核心维度,任务基于包含电子表格、数据库、财务报告等异构数据的真实场景构建,难度极高,人类专家在AI辅助下仍需1-2小时完成单个问题。对11个顶尖模型(包括Claude、Gemini、Qwen等)的评估显示,当前AI系统在处理此类复杂现实任务时仍面临巨大挑战,最佳模型仅获得59.43%的通过率。研究详细分析了各维度的失败模式,为未来研究指明了方向。

ai基准测试数据分析端到端评估文档理解大语言模型
cs 03-18 00:00

理解门控智能体经济:一种以稳健性优先的AI经济代理架构

本文提出“理解门控智能体经济”(CGAE)架构,将AI代理的经济权限(如交易、预算管理)与其经过对抗性稳健性审计验证的“理解能力”上限绑定。该门控机制基于三个正交的稳健性维度:约束合规性(CDCT)、认知完整性(DDFT)和行为对齐性(AGT),并采用“最弱环节”函数将稳健性向量映射为离散的经济层级。研究证明了该系统的三个关键特性:有界经济风险暴露、激励相容的稳健性投资,以及系统安全随规模增长的单调性。该架构通过时效衰减和随机重审计机制防止认证后性能漂移,首次在实证AI稳健性评估与经济治理之间建立了形式化桥梁。

ai经济代理稳健性审计理解门控安全架构激励相容对抗性评估
cs 03-18 00:00

文本与可视化融合研究综述:数据叙事中的双模态协同

本文对98篇文献进行了系统性综述,探讨了文本在数据可视化中作为叙事工具的角色。研究指出,尽管文本作为数据输入和交互方式已被广泛研究,但其在支持数据故事讲述和解释方面的功能仍较为零散。本文分析了文本在可视化中的应用方式、功能与效果,并探讨了如何设计文本来促进数据沟通。综述揭示了该领域的重要研究空白,并为未来推动文本与可视化深度融合、提升叙事清晰度和用户参与度提供了方向。

数据可视化文本叙事人机交互数据沟通信息设计
cs 03-18 00:00

CraniMem:受颅脑启发的门控有界记忆系统,提升AI代理长期任务稳定性

本文提出CraniMem,一种受神经认知启发的多阶段记忆架构,旨在解决LLM代理在长期工作流中记忆不稳定、易受干扰的问题。其核心设计包括:目标条件门控与效用标记机制、用于短期连续性的有界情景缓冲区,以及用于持久语义回忆的结构化长期知识图谱。通过定期回放高效用记忆轨迹并修剪低效用项,系统能有效控制内存增长并减少干扰。在包含噪声注入的长时程基准测试中,CraniMem相比Vanilla RAG和Mem0基线表现出更强的鲁棒性和更小的性能下降。

ai代理记忆系统知识图谱长期任务鲁棒性神经认知启发
cs 03-18 00:00

GSI Agent:面向绿色雨水基础设施的领域知识增强大语言模型框架

本文提出GSI Agent,一个专为绿色雨水基础设施(GSI)领域设计的大语言模型增强框架。针对LLMs在专业工程场景中知识不足、易产生幻觉的问题,该框架融合了监督微调、基于市政文档构建的知识库检索增强生成以及智能体推理管道三种策略。实验表明,在构建的新GSI数据集上,其BLEU-4得分从0.090显著提升至0.307,同时保持了模型的通用知识能力。这为将通用大模型系统性地适配到专业基础设施应用提供了有效路径。

绿色雨水基础设施领域知识增强检索增强生成大语言模型监督微调智能体框架
AI速览助手