今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

计算机科学

2026-03-31 03-31 15:26

今日计算机科学领域研究呈现多元化趋势,聚焦于提升AI系统效率、鲁棒性与交互能力,并探索其在复杂现实场景中的应用与影响。

  • 检索增强生成(RAG)范式革新:多项研究致力于解决传统RAG的信息碎片化与检索噪声问题。核心思路是解耦检索与生成表示(如M-RAG的键值元标记)、引入结构化语义信息(如SRAG的主题/情感标签)或优化检索架构(如Bridge-RAG的抽象桥树),以提升证据检索的精度与上下文相关性,尤其在长文本和多模态场景下效果显著。
  • AI模型能力与安全评估深化:评估重点从静态性能转向动态、以人为中心的实际影响。研究关注模型在教学、安全等复杂任务中的策略敏感性差异,并提出衡量“有害能力提升”的新安全框架,强调需评估用户借助前沿模型造成伤害的边际能力增长,为负责任的AI开发提供新指标。
  • 人机交互与机器人学习注重场景适配:研究强调智能体需更好地理解并适应复杂物理与社会环境。具体表现为:利用图表示学习压缩场景信息以辅助机器人规划通过强化学习让混合机器人自主节能应对阶梯地形;以及设计社交机器人外显系统状态以弥合人机认知鸿沟,提升协作透明度和用户体验。
  • 持续学习与高效推理寻求轻量级方案:针对模型持续学习中的灾难性遗忘问题,研究提出选择性梯度投影等动态优化方法,在保持性能的同时大幅降低内存开销。在推理效率方面,通过分析令牌依赖几何动态推断并行块粒度(GeoBlock),以提升扩散语言模型的解码效率与可靠性。
  • AI与社会、能源的互动引发系统反思:研究开始深入分析AI大规模发展带来的外部性。建模显示,AI增长与可再生能源投资可能陷入“适应陷阱”,即投资主要用于缓解算力瓶颈而非替代化石能源,反而可能加剧气候损害。这提示需从系统层面考量技术发展的能源约束与伦理路径。

2026-03-31 速览 · 计算机科学

2026-03-31 共 24 条抓取,按综合热度排序

← 返回日历
cs 03-31 00:00

M-RAG:无需文本分块的检索增强生成新范式

针对传统RAG系统因依赖文本分块而面临的信息碎片化、检索噪声和效率低下问题,本研究提出了M-RAG。该方法摒弃了粗粒度的文本块,转而提取结构化的键值对元标记:一个轻量级、意图对齐的检索键用于高效相似度匹配,一个上下文丰富的信息值用于生成。实验表明,M-RAG在LongBench子任务上,尤其是在低资源设置下,超越了基于分块的RAG基线,能够以更高效率检索到更利于生成答案的证据,验证了将检索表示与生成解耦的有效性。

检索增强生成大语言模型信息检索长文本处理结构化表示
cs 03-31 00:00

Bridge-RAG:基于抽象桥树与布谷鸟过滤器的检索增强生成新框架

本文提出了一种名为Bridge-RAG的新型检索增强生成框架,旨在同时解决传统RAG在检索精度和计算效率上的挑战。其核心创新在于引入“抽象”概念来桥接查询实体与文档块,以增强语义理解,并将抽象组织为树状结构,配合多级检索策略确保上下文充分性。为提升效率,框架采用了改进的布谷鸟过滤器进行快速实体定位,并设计了块链表结构和基于实体温度的排序机制,从时空局部性角度优化性能。实验表明,Bridge-RAG在准确率上提升约15.65%,同时将检索时间降低了10至500倍。

检索增强生成抽象桥树布谷鸟过滤器多级检索大语言模型语义理解
cs 03-31 00:00

ReCQR:通过对话式查询改写提升多模态图像检索性能

针对现有图像检索模型在处理长文本和模糊用户表达时的不足,本研究首次将对话式查询改写任务引入图像检索领域。通过利用大语言模型生成候选改写,并结合LLM-as-Judge机制与人工审核,构建了包含约7000个高质量多模态对话的ReCQR数据集。实验表明,基于完整对话历史将用户最终查询改写为简洁、语义完整的检索查询,能显著提升传统图像检索模型的准确率,为多模态系统中的用户查询建模提供了新思路。

多模态检索查询改写对话系统图像检索大语言模型
cs 03-31 00:00

SRAG:引入结构化数据增强向量检索性能

本研究提出结构化检索增强生成(SRAG)方法,通过在查询和文本块中融入主题、情感、类型(如信息型、量化型)、知识图谱三元组和语义标签等结构化信息,显著改善了传统RAG仅依赖向量表示相似性的检索方式。实验表明,该方法将问答系统的答案质量评分提升了30%(p值=2e-13),尤其在比较、分析和预测性问题中效果最为显著,实现了更广泛、多样化和情景式的检索。

检索增强生成结构化数据向量检索知识图谱大语言模型
cs 03-31 00:00

选择性梯度投影:缓解持续学习中的灾难性遗忘

本文提出选择性遗忘感知优化(SFAO),一种动态调节梯度方向的新方法,以缓解神经网络在持续学习中的灾难性遗忘问题。SFAO通过余弦相似度分析和逐层门控机制,选择性地投影、接受或丢弃参数更新,在保持模型可塑性与稳定性之间取得平衡。该方法采用高效蒙特卡洛近似,在标准基准测试中实现了与先进方法相当的精度,同时将内存开销降低了90%,尤其适用于资源受限的场景。

持续学习灾难性遗忘梯度投影神经网络优化资源高效
cs 03-31 00:00

AI教学能力评估:ChatGPT、Gemini与DeepSeek在三种教学策略下的表现对比

本研究评估了ChatGPT、Gemini和DeepSeek作为教学代理的效能,聚焦于三种教学策略:示例教学、解释与类比、苏格拉底法。在C语言初学者教学场景中,六位评委发现,在示例和解释策略上,各模型表现相似;而在苏格拉底法策略中,模型对教学策略和初始提示更为敏感。总体而言,ChatGPT和Gemini得分较高,DeepSeek得分较低,表明不同模型在教学性能上存在差异。

大语言模型教学策略ai教育模型评估苏格拉底法
cs 03-31 00:00

社交机器人助力新移民儿童语言文化学习:专家协同设计研究

针对新移民儿童在语言学习上面临的师资不足、水平不一、接触时间短等挑战,本研究通过与社会项目导师及协调员协同设计,探索了社交机器人“Maple”在文化及语言学习中的应用潜力。研究贡献包括:总结了该领域的四大核心挑战;探讨了机器人在文化导向与社区归属感培养中的作用;基于专家视角分析了社交机器人在此场景下的角色定位;并提出了初步的课堂整合设计指南,为后续与儿童及家庭的迭代设计与评估奠定了基础。

社交机器人语言学习新移民儿童协同设计文化适应教育技术
cs 03-31 00:00

GeoBlock:基于依赖几何动态推断扩散语言模型块粒度的新框架

本文提出GeoBlock,一种几何感知的块粒度推断框架,用于提升扩散语言模型的解码效率与可靠性。传统块扩散方法依赖固定规则或启发式信号确定并行更新的块大小,未考虑决定令牌能否安全并行细化的依赖几何结构。GeoBlock的核心思想是:具有强因果顺序的区域需要顺序更新,而语义连贯的区域允许并行细化。该方法通过分析注意力机制衍生的跨令牌依赖模式,直接识别几何稳定的细化区域,并在解码过程中动态确定合适的块边界。实验表明,GeoBlock无需额外训练即可无缝集成到现有块扩散架构中,在仅增加少量计算开销的情况下,显著提高了块扩散的准确性,同时保持了并行效率。

扩散语言模型并行解码依赖几何块粒度推断注意力机制高效推理
cs 03-31 00:00

评估人机安全:衡量有害能力提升的新框架

本文提出,当前前沿AI安全评估过于依赖静态基准和第三方标注,应转向以人为中心的评估,核心是衡量“有害能力提升”——即用户借助前沿模型造成伤害的能力,相较于使用传统工具时的边际增长。作者将该概念确立为核心安全指标,并基于社会科学研究提供了系统性的测量方法学指导。最后,为开发者、研究者、资助方和监管机构提出了推动该评估成为标准实践的具体步骤。

ai安全评估有害能力提升人机交互安全度量社会科学方法
cs 03-31 00:00

AI增长与可再生能源投资:是“天作之合”还是“适应陷阱”?

研究通过建模分析AI增长与可再生能源投资的均衡互动,揭示了两种截然不同的发展路径。当AI能力回报呈现超模性且性能随算力线性增长时,开发者会追求前沿规模,即使边际电力来自化石能源。这导致可再生能源投资主要用于缓解算力瓶颈,而非一对一替代化石能源,形成“适应陷阱”:气候损害加剧反而提升AI适应价值,强化对前沿算力的追求并容忍化石能源残留。反之,当AI面临收益递减和较低的规模效率时,能源成本会约束能力选择,可再生能源投资既能赋能AI又能实现边际算力脱碳,形成“适应路径”。研究表明,AI脱碳是一个均衡结果,有效政策需确保在算力扩张过程中,清洁能源始终是边际约束。

人工智能可再生能源能源经济均衡模型气候适应碳锁定
cs 03-31 00:00

AI辅助大学数学教学:情境感知模型在微积分大班中的应用研究

本研究针对大规模数学课程中教学支持难以规模化、及时化的挑战,提出了一种人机协同的解决方案。通过与教师紧密合作,团队基于2588条历史师生问答数据微调了一个轻量级语言模型,用于在课程论坛上自动回答学生提问。在由五位教师标注的150个代表性问题上,模型回答准确率达到75.3%,其中36%的回答质量被评定为等同或优于教师回复。对105名学生的调查显示,学生重视回答与课程内容的高度一致性及即时性,但仍依赖教师验证来建立信任。研究强调了混合人机工作流对于实现安全有效课程支持的重要性。

ai教育应用人机协同教学情境感知ai大规模课程支持微积分教学
cs 03-31 00:00

AlpsBench:首个基于真实对话的大语言模型个性化评测基准

随着大语言模型向终身AI助手演进,个性化成为关键方向,但缺乏黄金标准评测基准。本文提出AlpsBench,首个基于真实人机对话(来自WildChat)的LLM个性化评测基准,包含2500个长期交互序列及人工验证的结构化记忆。它定义了四个核心任务:个性化信息提取、更新、检索与利用,以评估记忆管理的全生命周期。评测发现:模型难以可靠提取潜在用户特质;记忆更新存在性能瓶颈;检索精度在大量干扰项下急剧下降;显式记忆机制能改善召回,但未必带来更偏好对齐或情感共鸣的回应。

大语言模型个性化评测记忆管理真实对话偏好对齐基准测试
cs 03-31 00:00

X平台真主党阿拉伯语讨论的参与度与注意力结构分析

本研究分析了X平台上关于真主党的阿拉伯语讨论的参与和注意力结构。通过对2026年3月1日至8日期间8,148名用户发布的15,767条推文进行分析,发现参与度分布极不均衡:尽管有数千用户参与讨论,但前1%的用户获得了61.5%的互动,前10%的用户获得了96.2%的互动。同时,89.6%的用户和79.9%的推文来自非媒体用户,但被识别为媒体的账户(通过元数据中的媒体相关关键词)每条推文的平均互动数更高(41.32次 vs 非媒体用户的30.84次),并且在最受关注的账户中占比过高。这表明,虽然发帖活动看似广泛参与,但受众注意力高度集中于少数高可见度账户。

社交媒体分析注意力不平等政治话语阿拉伯语网络参与
cs 03-31 00:00

智能体性别感知的测量框架:提升人机交互研究的严谨性与包容性

本文通过范围综述发现,当前人机交互研究中,约三分之一的研究仅操纵智能体性别而未测量其感知,且普遍依赖性别二元模型与人类中心主义,限制了知识生成并强化了现状。研究贡献了一个系统开发、理论驱动的元层次框架,为将智能体性别作为感知变量进行标签化、定义和测量提供了操作清晰性与实践指导,旨在提升该领域研究的严谨性、结果可比性及包容性。

人机交互智能体性别测量框架范围综述感知变量包容性设计
cs 03-31 00:00

LITTA:无需重训练的多模态文档检索增强框架

本文提出LITTA框架,旨在解决视觉丰富文档(如教科书、技术手册)检索中因上下文长、布局复杂和词汇重叠弱而导致的挑战。该方法的核心是在测试时利用大语言模型生成多个互补的查询变体,通过一个冻结的视觉检索器进行“延迟交互”评分,并利用倒数排名融合聚合结果。实验在计算机科学、制药和工业手册三个领域进行,结果表明多查询检索显著提升了Top-k准确率、召回率和平均倒数排名,尤其在视觉和语义变化大的领域提升明显。该方法无需重新训练检索器,且可通过控制查询变体数量来权衡精度与效率。

多模态检索查询扩展视觉文档延迟交互测试时对齐文档检索
cs 03-31 00:00

解耦几何规划与执行:一种可扩展的多智能体路径规划新框架

本文提出了一种新颖的混合优先级框架,用于解决大规模多智能体路径规划(MAPF)的可扩展性问题。该方法将问题解耦为两个阶段:第一阶段(GCP)在原始图上进行顺序几何规划,通过成本膨胀鼓励空间绕行,避免显式时间推理;第二阶段(DLC)通过分散式本地控制器执行几何路径,仅在必要时插入等待动作以解决冲突。实验表明,该方法在多达1000个智能体的标准基准地图上实现了接近线性的运行时间增长和100%的成功率,在瓶颈密集地图上有效减少了同步等待并改善了总成本(SOC)。

多智能体路径规划可扩展性解耦规划冲突解决几何规划分散控制
cs 03-31 00:00

面向机器人任务规划的上下文图表示学习

本研究探讨了如何利用图神经网络(GNN)从复杂的3D场景图中学习紧凑的上下文感知表示,以提升机器人任务规划的效率和可部署性。针对现有3D场景图包含大量冗余对象和关系导致状态空间爆炸的问题,作者构建了一个基准测试环境,用于评估经典规划器,并提出了通过学习规划域中关系结构的不变性来生成更高效任务规划表示的方法。

3d场景图任务规划图神经网络机器人感知表示学习
cs 03-31 00:00

社交机器人中介状态外显:提升分布式家庭机器人透明度与用户体验

本文针对分布式家庭机器人系统在用户视野外操作时产生的“状态感知鸿沟”问题,提出了一种实时、社交中介的状态外显方法。研究开发了一个系统,其中社交中介机器人(Pepper)通过语音更新和视觉进度条,同步并外显隐藏的移动机械臂(Stretch 3)在执行取物任务时的状态。一项被试内对照研究(N=30)表明,与基线(自主隐藏执行)相比,状态外显显著提升了用户对任务的专注度(从15.8%增至84.6%,p<.001),并大幅改善了用户对系统清晰度、可靠性、激励性和吸引力的感知(p<.001)。83%的参与者更偏好外显条件,且端到端任务完成时间无显著增加(p=.271)。结果表明,社交中介状态外显是一种有效的架构机制,可在不牺牲性能的前提下,增强分布式家庭机器人系统的透明度和用户体验。

人机交互分布式机器人状态外显透明度用户体验家庭服务机器人
cs 03-31 00:00

混合机器人学习节能空-地协同驱动,应对阶梯状地形

混合空-地机器人面临阶梯状不连续地形的能效挑战:纯轮式驱动易在边缘卡滞,而纯飞行驱动对小高度增益能耗过高。本研究提出一个能量感知的强化学习框架,训练一个单一的连续策略来协调螺旋桨、轮子和倾斜舵机,无需预定义空中或地面模式。策略在Isaac Lab中使用硬件校准的推力/功率模型进行训练,奖励函数惩罚真实的电能消耗。学习到的策略发现了融合空中推力和地面牵引力的推力辅助驱动方式。在模拟中,其能耗比纯螺旋桨控制低约4倍。策略被转移到DoubleBee原型机上执行8厘米间隙攀爬任务,其平均功率比基于规则的解耦控制器低38%。结果表明,高效的混合驱动可以通过学习产生并部署到硬件上。

混合机器人强化学习节能驱动空-地协同阶梯地形
cs 03-31 00:00

EVNextTrade:基于学习排序的电动汽车充电节点推荐系统

本研究针对电动汽车(EV)间点对点能源交易场景,首次将“推荐下一个适合交易的充电节点”问题建模为学习排序任务。作者利用包含数百万条行程记录的大规模城市EV移动数据集,整合了EV电量、交易角色、距离、充电速度及站点时间热度等多维特征。为应对供需双方移动性及多候选节点带来的不确定性,研究采用了概率相关性精炼方法生成分级标签。实验评估了LightGBM、XGBoost和CatBoost等梯度提升排序模型,结果显示LightGBM在NDCG@k、Recall@k和MRR等指标上表现最佳,尤其在早期排序质量上优势显著(NDCG@1达0.9795)。该框架为去中心化EV能源交易系统的协调与匹配提供了有效解决方案。

电动汽车能源交易学习排序推荐系统移动性预测充电基础设施
cs 03-31 00:00

SpatialPoint:空间感知点预测框架,提升具身智能定位能力

本文提出具身定位问题,即根据视觉观察和语言指令预测可执行的3D点。作者提出SpatialPoint框架,将结构化深度信息集成到视觉语言模型中,以生成相机坐标系下的3D坐标。该框架区分了可触摸点(用于直接物理交互)和空中点(用于指定放置、导航或几何关系)。研究构建了一个包含260万样本的RGB-D数据集进行训练与评估。实验表明,引入深度信息显著提升了具身定位性能,并在机器人抓取、物体放置和移动导航等真实任务中得到验证。

具身智能3d空间定位视觉语言模型深度感知机器人任务
cs 03-31 00:00

SCALE-TRACK:面向异构计算架构的异步欧拉-拉格朗日粒子追踪算法

本研究提出了SCALE-TRACK,一种可扩展的双向耦合欧拉-拉格朗日(EL)粒子追踪算法,旨在充分利用异构百亿亿次计算环境。通过采用异步耦合、缓存友好的数据结构和基于块的分区策略,该算法解决了现有EL实现的关键性能瓶颈。验证实验表明其准确性。在单GPU工作站上成功模拟了14亿个粒子,在HPC集群上使用256个GPU实现了高达2560亿粒子的追踪,展现出优异的强扩展与弱扩展性能。该软件已开源发布。

粒子追踪异构计算高性能计算多相流模拟可扩展算法开源软件
cs 03-31 00:00

受苦为何成瘾?魂类游戏中的“磨难愉悦”机制解析

本文提出“磨难愉悦”理论,解释魂类游戏如何通过持续挑战产生独特乐趣。研究识别出三个相互强化的核心机制:通过公平逆境实现精通的“游戏化培养”、面向未来成长的“抱负延迟满足”、以及集体构建共享意义的“社群神话创作”。通过分析《艾尔登法环》《空洞骑士》等游戏的设计、玩家实证研究与社区话语,论文揭示了游戏如何协调难度、时间结构与社交意义创造,将痛苦转化为复杂满足感。该框架为动机理论增添了时间维度,并为设计高难度游戏提供了具体原则。

游戏设计玩家动机磨难愉悦魂类游戏社群构建延迟满足
cs 03-31 00:00

拓扑运动规划扩散:为系绳机器人生成无缠绕路径

本文提出了一种名为拓扑运动规划扩散(TMPD)的新型生成式规划框架,旨在解决系绳机器人在复杂障碍物环境中长期导航时的线缆缠绕问题。该方法结合了终身拓扑记忆,利用扩散模型前端生成跨不同同伦类的运动轨迹候选集,再通过基于广义卷绕数的拓扑后端进行筛选和优化。在模拟环境中,TMPD实现了100%的无碰撞到达率和97.0%的无缠绕率,在几何平滑度和计算效率上均优于传统拓扑搜索和纯运动学扩散基线。

系绳机器人路径规划拓扑优化扩散模型无缠绕导航生成式规划
AI速览助手