今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

计算机科学

2026-01-21 01-21 15:41

今日计算机科学领域整体聚焦于提升AI系统的可靠性、效率与安全性,尤其在数据隐私、模型优化、人机协作及跨领域应用方面涌现出多项创新方法。

  • 隐私评估新框架:SynQP开源框架通过模拟数据评估合成数据的隐私风险,提出新的身份泄露度量(SD-IDR),实验证明差分隐私技术能有效控制风险,为合成数据应用的隐私透明评估提供了关键工具。
  • 模型效率与负载均衡:EMoE架构通过引入学习到的正交特征基进行路由,从本质上解决了MoE模型中负载不均与专家同质化问题,无需辅助损失函数即可实现负载均衡与表征多样化。
  • 人机协作编程模式:“人-人-AI三元编程”实验表明,将AI作为可见的协作者(而非替代者)能降低对AI代码的依赖,激活社会学习调节机制,从而提升编程学习效果与社会临场感。
  • 编译器赋能LLM编程:研究证实,为LLM提供编译器反馈能将其从被动代码生成器转变为主动调试智能体,显著减少语法错误,且小型模型搭配编译器有时能超越未配备编译器的大型模型。
  • 病理大模型推理优化:针对全切片图像分析,提出时空高效的稀疏注意力推理策略,通过过滤非信息性标记,在保持或提升任务性能的同时,大幅降低了GPU内存消耗和运行时间。
  • 联邦学习保险应用:提出联邦学习框架用于设计参数化保险指数,允许生产者在本地建模损失并联合优化公共指数,无需共享原始数据,有效应对了可再生能源生产损失的异质性。

2026-01-21 速览 · 计算机科学

2026-01-21 共 24 条抓取,按综合热度排序

← 返回日历
cs 01-21 00:00

SynQP:评估合成数据质量与隐私风险的开源框架

针对健康等领域合成数据应用的隐私担忧,本研究提出了SynQP开源框架。该框架通过使用模拟敏感数据来评估合成数据生成(SDG)的隐私风险,避免了原始敏感数据的泄露。研究强调了需要更公平地评估机器学习模型概率特性的隐私指标,并以此为基础提出了一种新的身份泄露风险度量方法(SD-IDR)。实验表明,差分隐私(DP)技术能有效将隐私风险控制在监管阈值(0.09)以下。该工作为提升隐私评估的透明度和可靠性提供了关键工具。

合成数据隐私评估开源框架差分隐私健康数据
cs 01-21 00:00

SolarGPT-QA:面向空间天气教育的领域自适应大语言模型

本研究提出了SolarGPT-QA,一个专为空间天气与太阳物理学教育设计的问答系统。该模型基于LLaMA-3架构,通过领域自适应预训练(使用科学文献)和教学风格微调(利用GPT-4生成、Grok-3优化的问答数据)构建。人类评估表明,在零样本设置下,SolarGPT-QA在解释太阳活动(如太阳耀斑、日冕物质抛射)对卫星、电网等的影响时,其清晰度和教育效果优于通用模型,并与指令微调模型性能相当。消融实验证实,结合领域知识与教学风格对于平衡科学准确性与教育有效性至关重要。

大语言模型领域自适应空间天气科学教育问答系统教学微调
cs 01-21 00:00

孟加拉语文本分类:大语言模型方法评估

本研究评估了三种指令微调大语言模型(LLaMA 3.1 8B Instruct、LLaMA 3.2 3B Instruct 和 Qwen 2.5 7B Instruct)在孟加拉语新闻文章分类任务上的表现。实验基于来自孟加拉国主要报纸《Prothom Alo》的数据集进行。结果显示,Qwen 2.5 7B Instruct 取得了最高的 72% 分类准确率,尤其在“体育”类别表现突出,而 LLaMA 模型的准确率在 53% 至 56% 之间。研究证明了 LLMs 在资源稀缺的孟加拉语 NLP 任务中的有效性,并为未来改进模型、处理类别不平衡和优化微调方法指明了方向。

孟加拉语nlp文本分类大语言模型指令微调资源稀缺语言
cs 01-21 00:00

人-人-AI三元编程:AI作为协作者如何提升编程学习效果

本研究提出“人-人-AI三元编程”协作模式,将AI定位为人类协作者之外的额外伙伴,而非替代者。通过一项20名参与者的对照实验发现,与传统的“人-AI”二元协作相比,三元协作显著提升了协作学习效果与社会临场感。在三元模式下,参与者对AI生成代码的依赖度显著降低,尤其在“共享式”三元协作中,成员在采纳AI建议前会主动承担理解其原理的责任。这表明,让AI的使用过程对同伴可见且可问责,能激活社会共享的“学习调节”机制,更好地保留协作编程所依赖的学习过程。

人机协作编程教育ai协作者协作学习社会临场感
cs 01-21 00:00

CoSMeTIC:面向临床研究的零知识计算稀疏默克尔树框架

本文提出CoSMeTIC框架,利用计算稀疏默克尔树(SMTs)为临床研究中的参与者数据生成可验证的包含与排除证明。该框架在保护患者个人健康信息隐私的同时,确保数据分析的完整性与可审计性,以满足监管要求。通过形式化分析其零知识特性,并在真实世界亨廷顿病数据集上进行假设检验与逻辑回归基因组分析,结果表明CoSMeTIC在提供强隐私保证的同时,保持了数据的统计保真度,为大规模临床研究提供了兼具可扩展性与实用性的解决方案。

零知识证明临床数据隐私稀疏默克尔树可验证计算基因组分析监管合规
cs 01-21 00:00

EMoE:基于特征基的专家混合路由新架构,解决负载不均与专家同质化难题

针对专家混合(MoE)模型中存在的‘富者愈富’负载不均与专家表征同质化两大核心挑战,本文提出了EMoE架构。其核心创新在于引入一个学习得到的正交特征基,通过将输入令牌投影到该特征基上,并根据其与特征空间主成分的对齐程度进行路由。这种基于几何原理的数据划分方法,无需引入相互冲突的辅助损失函数,即可从本质上促进专家负载均衡,并驱动专家学习多样化、专业化的表征。

专家混合模型负载均衡特征基路由模型效率深度学习架构
cs 01-21 00:00

SAMA:统一模型实现高质量图像分割与抠图

本文提出Segment And Matte Anything (SAMA)模型,作为SAM的轻量级扩展,旨在解决SAM在真实应用中精度不足的问题,并首次在统一框架内探索交互式图像抠图。SAMA通过引入多视图定位编码器(MVLE)捕获局部细节特征,并利用定位适配器(Local-Adapter)恢复精细边界。模型集成两个预测头,可同时生成分割与抠图遮罩。在公开数据集上训练后,SAMA在多个分割与抠图基准测试中达到最先进性能,展示了其在下游任务中的广泛适应性与有效性。

图像分割图像抠图统一模型计算机视觉sam扩展
cs 01-21 00:00

病理大模型高效推理新方法:稀疏注意力机制优化全切片图像分析

针对病理大模型在全切片图像(WSI)分析中因固定输入尺寸(如224×224)导致效率低下的问题,本研究提出了一种时空高效的推理策略。该方法通过空间感知的邻近块稀疏化注意力,并利用全局注意力分数过滤非信息性标记,在保持甚至提升下游任务性能的同时,显著降低了高分辨率WSI推理时的GPU内存消耗和运行时间。实验表明,该方法在ROI分类任务上实现了最高7.67%的性能提升,并在分割任务上取得了可比的结果。

病理大模型高效推理稀疏注意力全切片图像计算优化
cs 01-21 00:00

流式算子推断:大规模动力系统模型降维新方法

本文提出了一种名为“流式算子推断”的新方法,用于大规模动力系统的非侵入式模型降维。传统算子推断方法需要一次性处理所有数据,内存消耗大且无法在线更新。新方法通过增量奇异值分解(SVD)自适应构建低维基,并利用递归最小二乘法(RLS)在线更新降维算子,实现了从顺序到达的数据流中学习降维模型。该方法无需存储完整数据集,在基准问题和大规模湍流通道流动实验中,实现了与批处理方法相当的精度,同时内存需求降低超过99%,维度缩减超过31,000倍,预测速度提升数个数量级。

模型降维流式学习算子推断增量svd动力系统非侵入式
cs 01-21 00:00

提示语言如何影响LLM的政治分析:俄乌双语实验揭示意识形态偏差

本研究通过实验对比发现,大型语言模型(LLM)对同一份乌克兰公民社会文件的分析,会因提示语言(俄语 vs. 乌克兰语)的不同而产生系统性意识形态偏差。在语义完全相同的提示下,俄语输出倾向于呼应俄罗斯官方叙事,将公民社会行为体描述为破坏民主授权的非法精英;而乌克兰语输出则采用西方自由民主政治学的词汇,将其视为民主竞争中的合法利益相关者。这表明,仅改变提示语言即可使同一模型对相同内容产生截然不同的意识形态取向,这对AI在极化信息环境中的部署、跨语言研究应用以及多语言社会的AI治理具有重要影响。

大型语言模型意识形态偏差多语言分析政治文本分析ai治理
cs 01-21 00:00

联邦学习框架下的参数化保险指数设计:应对可再生能源生产损失异质性

本研究提出了一种联邦学习框架,用于在可再生能源生产损失存在异质性的情况下校准参数化保险指数。生产者使用Tweedie广义线性模型和私有数据在本地建模其损失,同时通过联邦优化学习一个共同的指数,无需共享原始观测数据。该方法能适应方差和连接函数的异质性,并在分布式环境中直接最小化全局偏差目标。研究实现并比较了FedAvg、FedProx和FedOpt算法,并以现有的基于近似的聚合方法为基准。在德国太阳能发电的实证应用中表明,在中等异质性条件下,联邦学习能够恢复可比较的指数系数,同时提供了一个更通用和可扩展的框架。

联邦学习参数化保险可再生能源损失建模分布式优化tweedie模型
cs 01-21 00:00

UniMo:通过思维链统一3D人体运动生成与理解

本文提出UniMo框架,旨在解决现有3D人体运动生成与理解方法之间难以相互增强、解释性差的问题。该框架通过监督微调将运动-语言信息与可解释的思维链推理整合进大语言模型,并引入基于组相对策略优化的强化学习作为后训练策略,以优化成组token,确保结构正确性和语义对齐,从而缓解运动token预测中的累积误差。实验表明,UniMo在运动生成与理解任务上均显著优于现有统一模型和特定任务模型,达到最先进性能。

3d人体运动大语言模型思维链运动生成运动理解强化学习
cs 01-21 00:00

DriveSafe:面向LLM驾驶助手的安全风险分层分类体系

本文提出了DriveSafe,一个专门针对基于大语言模型(LLM)的驾驶助手的四级分层风险分类体系。该体系包含129个细粒度的原子风险类别,涵盖技术、法律、社会和伦理维度,并基于真实驾驶法规和安全原则构建,经领域专家评审。研究通过评估六个主流LLM对不安全或不合规驾驶相关查询的拒绝行为,发现现有模型在驾驶场景下的通用安全对齐存在显著局限,常无法恰当拒绝风险请求。

大语言模型驾驶安全风险分类安全评估人机交互
cs 01-21 00:00

TIDE:基于轨迹信息的深度优先探索,解决时序扩展目标规划难题

本文提出TIDE方法,用于解决具有时序扩展目标的规划问题。传统方法将时序逻辑(LTLf)规划转化为经典可达目标规划,但缺乏引导搜索的启发信息。TIDE通过将时序问题分解为一系列更小的可达-规避子问题,利用现成规划器求解。其核心在于识别并优先处理领域图中最有希望的自动机轨迹,采用成本驱动的启发式策略引导探索,并通过自适应回溯机制从失败计划中系统恢复,保证了方法的完备性与效率。实验表明TIDE性能优异。

时序规划ltlf启发式搜索自动机任务规划机器人
cs 01-21 00:00

基于神经过程的自动驾驶赛车反应控制器:融合物理先验与安全屏障

本文提出了一种用于自动驾驶赛车间隙导航的新型反应控制框架,核心是注意力神经过程(AttNP)及其物理信息扩展版本(PI-AttNP)。PI-AttNP通过融入近似模型先验来注入物理归纳偏置,从而在F1TENTH式阿克曼转向赛车仿真环境中实现了更快的收敛速度和更高的预测精度,适用于实时控制。为确保安全,研究还推导并实现了一种基于控制屏障函数(CBF)的过滤机制,该机制可解析地强制执行碰撞避免约束,为学习到的控制器提供了一个轻量级且可验证的安全层。结果表明,该方法在保证实时约束满足的同时,具有竞争力的闭环性能。

自动驾驶神经过程控制屏障函数实时控制安全验证物理信息模型
cs 01-21 00:00

阈值差分注意力:解决注意力机制中的注意力汇与概率弥散问题

针对Softmax注意力在长上下文建模中的结构性问题——严格的归一化约束导致注意力汇(attention sinks)以及概率质量随序列增长而弥散,本文提出了阈值差分注意力(TDA)。该方法通过引入长度相关的行级极值阈值门控,仅保留超过阈值的显著值,实现了>99%的精确零值,消除了注意力汇。受差分Transformer启发,TDA还通过减去一个抑制性视图来增强表达能力。理论证明,TDA将每行虚假幸存者的期望数量控制在$O(1)$,且独立视图间的虚假匹配会随上下文增长而消失。实验表明,TDA在保持标准及长上下文基准测试竞争力的同时,实现了超稀疏性和更强的鲁棒性。

注意力机制长序列建模稀疏注意力transformer语言模型计算效率
cs 01-21 00:00

编译器赋能LLM:从被动生成到主动调试的编程智能体进化

本研究通过RosettaCode数据集的699个C语言任务实验,评估了为大型语言模型提供编译器工具(如gcc)对其编程能力的影响。实验覆盖16个不同规模的模型(1.35亿至700亿参数),发现编译器接入使编译成功率提升5.3%至79.4%,语法错误减少75%,未定义引用错误减少87%。研究证实,编译器反馈能将LLM从被动代码生成器转变为能迭代调试的主动智能体,且小型模型搭配编译器有时能超越未配备编译器的大型模型,这为降低软件工程中模型能耗提供了新思路。

编程智能体编译器反馈代码生成软件工程llm增强迭代调试
cs 01-21 00:00

LAMPS:基于LLM的多智能体系统,高效检测PyPI恶意软件包

本研究提出LAMPS,一个基于大型语言模型(LLM)的多智能体协作系统,用于检测PyPI等开源仓库中的恶意软件包。系统通过CrewAI框架协调四个角色化智能体(包检索、文件提取、分类、裁决聚合),结合微调的CodeBERT模型与LLaMA-3智能体进行上下文推理。在两个互补数据集上的评估显示,LAMPS在平衡数据集上达到97.7%的准确率,优于现有方法MPHunter;在更贴近现实、存在类别不平衡的多文件数据集上,准确率与平衡准确率均达到99.5%,显著超越了基于RAG的方法和微调的单智能体基线。McNemar检验证实了改进的显著性。该工作证明了分布式LLM推理在恶意代码检测中的可行性,并凸显了模块化多智能体设计在软件供应链安全中的优势。

多智能体系统恶意代码检测软件供应链安全llm应用pypi安全
cs 01-21 00:00

基于主成分分析的太赫兹自监督去噪去模糊深度网络

针对太赫兹成像中固有的低频模糊与高频噪声并存的问题,本研究提出了一种基于主成分分析的自监督去噪去模糊网络。该网络采用“再损坏至再损坏”的自监督学习策略,通过利用重复损坏下的不变性来捕获噪声的内在特征,随后应用PCA分解与重构来同时恢复图像的低频与高频信息。实验在四类样本上验证了其有效性,仅需少量无标签噪声图像即可训练,并能跨不同材料与测量模式实现有效的图像恢复,在提升图像质量的同时保留了原始信号的物理特征。

太赫兹成像自监督学习图像去噪图像去模糊主成分分析深度学习
cs 01-21 00:00

LLM如何重塑科研创意:控制权、贡献度与所有权的权衡

本研究通过一个包含“构思者”、“撰写者”和“评估者”三个角色的智能体系统,在低、中、高三个控制级别下,探讨了LLM智能体如何重塑科研创意过程。对54名研究人员的混合方法研究发现:1)感知到的创造力支持并不随控制权增加而线性提升;2)人类努力从构思想法转向验证想法;3)所有权成为人与AI协商的结果。研究建议,LLM智能体设计应强调赋能研究者,使其对优质创意保有所有权感,而非将其降级为自动化流程的操作员。

人机协作科研创意llm智能体所有权归属控制权权衡
cs 01-21 00:00

基于BERTopic与LLM的癌症患者访谈主题分析:提升医疗实践的患者视角

本研究利用神经主题建模(BERTopic/Top2Vec)与大型语言模型(GPT-4),对13份癌症患者访谈转录文本(共132,722词)进行分析,旨在从患者叙事中提取有意义的主题,以推动更以患者为中心的医疗实践。通过公平比较,BERTopic在关键词提取与主题一致性上表现更优,随后结合临床导向的嵌入模型(如BioClinicalBERT)进一步提升了主题的精确度与可解释性。全局分析揭示了贯穿所有访谈的两大核心主题:“癌症护理管理中的协调与沟通”以及“癌症治疗旅程中的患者决策”。尽管数据为机器翻译且未涉及临床专家评估,但结果表明,该分析流程能为临床医生提供来自患者访谈的有效反馈,支持更高效的文档导航,并强化患者声音在医疗工作流程中的作用。

主题建模患者叙事分析临床自然语言处理癌症护理bertopicllm应用
cs 01-21 00:00

基于持续同调先验的高亏格三维曲面多视角图像逆渲染

本文提出了一种结合持续同调先验的协作式逆渲染新策略,用于从多视角图像重建高亏格(即具有多个“洞”或“环柄”)的三维曲面模型。该方法通过引入捕获隧道环和手柄环等关键拓扑特征的先验知识,有效解决了重建过程中的几何、外观和拓扑模糊性问题。在基于网格的逆渲染框架内,通过梯度优化协同利用光度一致性与同调引导,成功恢复了复杂的高亏格几何结构,避免了隧道塌陷或高亏格结构丢失等灾难性失败。实验表明,与现有先进的基于网格的方法相比,该方法在倒角距离(CD)和体积交并比(IoU)指标上均表现更优,显著提升了几何精度和对拓扑失败的鲁棒性。

逆渲染三维重建持续同调高亏格曲面拓扑先验多视角图像
cs 01-21 00:00

基于RTL的脉冲神经网络硬件设计:面向静态图像分类的低功耗实现

本文提出了一种面向硬件实现的脉冲神经网络(SNN)核心设计,旨在解决边缘AI设备(TinyML)中传统人工神经网络(ANN)功耗高、延迟大的问题。该设计采用SystemVerilog实现,核心创新在于:1)使用定点算术和位级操作(移位、加法)实现漏积分发放(LIF)神经元模型,无需复杂浮点运算单元;2)集成片上泊松编码器进行随机脉冲生成;3)引入新颖的动态剪枝机制,在分类后动态禁用神经元以降低动态功耗。针对数字分类任务的仿真表明,该设计在有限时间步内快速收敛(准确率89%),且计算开销显著低于传统密集架构,为FPGA/ASIC平台上可扩展、高能效的神经形态硬件奠定了基础。

脉冲神经网络硬件加速神经形态计算低功耗设计边缘airtl实现
cs 01-21 00:00

平滑神经代理模型提升足式机器人模型预测控制性能

本研究提出了一种结合深度学习和模型预测控制(MPC)的新方法,用于足式机器人运动控制。针对神经网络学习动力学模型时存在的三个关键问题——接触事件的刚性过渡、非物理局部非光滑性以及非高斯模型误差,作者设计了“平滑神经代理”模型。该模型具有可调平滑度,能为轨迹优化提供信息丰富的预测和导数。同时,采用重尾似然函数进行训练,以更好地匹配足式机器人动力学中观察到的经验误差分布。实验表明,该方法在零样本运动任务中显著提高了MPC的可靠性、可扩展性和泛化能力,在复杂场景下成功率从0/5提升至5/5,累积成本降低2-50倍。

足式机器人模型预测控制神经网络平滑代理动力学学习轨迹优化
AI速览助手