cs
03-02 00:00
本研究提出利用生成式AI作为“意外发现引擎”,从组织现有文档中自动发现、分类和重组可复用的知识组件(如模型、框架、模式)。通过对206篇论文的分析,提取出711个组件(平均每篇3.4个),并依据Beer的生存系统模型(VSM)构建知识库。研究贡献包括:1)概念上,提出“计划性意外发现”理论,认为生成式AI能降低VSM子系统间的知识转导成本;2)实证上,提供组件库及时间/主题模式分析;3)管理上,给出组织采纳的蓝图与案例;4)社会层面,探索知识复用与环境/社会效益的关联。研究旨在推动创新组合从“突破性偏见”转向系统性知识再利用。
生成式ai知识复用生存系统模型组织知识管理多重危机应对意外发现
cs
03-02 00:00
本文针对跨文档、多模态信息合成任务中用户控制力不足的问题,提出了“信息形态体(infomorphs)”的概念。它是一种模块化、用户可引导、AI增强的转换单元,支持跨格式和模态的信息受控合成与重组。研究者构建了一个设计空间,并将其实例化为DocuCraft——一个基于画布的界面,允许用户通过可视化编排infomorphs工作流(如页面提取、内容摘要、格式转换与生成)来完成文档创作。该系统结合生成式AI与用户意图,为人机协同的文档合成提供了更灵活、透明和模块化的交互方式。
文档生成人机交互多模态合成生成式ai工作流编排
cs
03-02 00:00
本文针对模型上下文协议(MCP)服务器中数千个标准化工具的评估瓶颈,提出了首个大规模、高质量的人类化查询数据集HumanMCP。该数据集基于MCP Zero数据集构建,覆盖308个MCP服务器中的2800个工具,并为每个工具生成了多种独特的用户角色画像。这些查询模拟了从精确任务请求到模糊探索性指令的真实用户意图,旨在解决现有基准测试中因缺乏多样化、拟人化查询而导致的泛化能力差和可靠性虚高问题,为评估MCP工具的使用效果和生态系统提供了更贴近实际交互场景的评测基础。
模型上下文协议工具检索评估数据集用户查询模拟人机交互
cs
03-02 00:00
本研究挑战了传统检索增强生成(RAG)对向量数据库和语义搜索的依赖。通过系统比较,发现仅使用基础关键词搜索工具的智能体框架,在问答任务中能达到传统RAG系统 $90\%$ 以上的性能指标。该方法实现简单、成本效益高,尤其适用于需要频繁更新知识库的场景,为信息检索提供了更轻量化的替代方案。
检索增强生成智能体工具调用关键词搜索向量数据库大语言模型信息检索
cs
03-02 00:00
本文提出了TTE-v2,一种创新的混合多模态检索框架。它突破了传统双编码器依赖嵌入维度的性能瓶颈,引入了一种基于额外推理令牌预算的性能扩展范式。该框架采用级联设计:初始检索后,通过额外的推理步骤进行重排序,实现更精细的查询-候选交互。重排序阶段还为上游检索器提供了细粒度监督,用于困难负样本挖掘和假阴性过滤,形成有效的反馈循环。在MMEB-V2基准测试中,TTE-v2-7B模型取得了75.7%的最新SOTA准确率,而TTE-v2-2B模型在参数更少、外部数据更小的情况下,性能匹配甚至超越了领先的7B模型。
多模态检索推理增强级联框架性能扩展重排序
cs
03-02 00:00
本文针对超长文档主题分割任务,提出了一种基于Qwen3-0.6B的判别式分割模型。该方法通过引入跨窗口上下文融合层和边界分类头,结合重叠滑动窗口策略,支持单次处理高达13K token的输入,并能扩展用于超长文档的段落边界检测。为提升下游检索效率,还提出了一种带标量校正的向量融合方法,可将超长片段的表示无损压缩为单个向量。在WIKI-727K数据集上的实验表明,相比基于Qwen2-0.5B的生成式模型,本方法在取得更优宏平均F1分数的同时,推理速度提升了两个数量级,显著增强了长文档处理的实用性与可扩展性。
文档分割判别式模型语义分块长文本处理向量融合信息检索
cs
03-02 00:00
针对印度法律文本冗长、异构且依赖多跳推理的特点,本研究提出了一种领域分区混合检索增强生成(RAG)与知识图谱架构。系统集成了三个针对最高法院判例、法规宪法文本及印度刑法典的专用RAG管道,并构建了Neo4j法律知识图谱以捕获案例、法条、法官及引用间的结构化关系。一个LLM驱动的智能编排器动态路由查询,融合证据生成有依据且带引用的回答。在基于权威印度法律资料构建的40个问题基准测试中,该混合架构的通过率达70%,显著优于仅RAG基线(37.5%),在回答完整性和法律推理质量上均有显著提升。
法律人工智能检索增强生成知识图谱法律推理模块化系统印度司法
cs
03-02 00:00
本研究提出SPRIG(Seeded Propagation for Retrieval In Graphs),一种仅需CPU、线性时间且无需分词器的GraphRAG流程。它用轻量级NER驱动的共现图替代昂贵的LLM图构建,并采用个性化PageRank(PPR)进行检索。实验表明,该方法在保持Recall@10几乎不变的情况下,将检索延迟降低28%,为无需GPU和token成本的多跳问答图检索提供了可行路径。
图检索增强生成多跳问答cpu优化个性化pagerank命名实体识别检索系统
cs
03-02 00:00
本研究提出了一种用于反洗钱合规中负面媒体筛查的智能体大语言模型框架。该系统采用检索增强生成技术,通过多步骤流程自动搜索网络、处理相关文档,并为每个筛查对象计算负面媒体指数得分。在包含政治公众人物、监管观察名单人员、受制裁人员及普通学术来源姓名的数据集上,使用多种LLM后端进行评估,结果表明该系统能有效区分高风险与低风险个体,有望替代传统高误报率的关键词搜索方法。
反洗钱合规大语言模型智能体系统检索增强生成负面媒体筛查金融风控
cs
03-02 00:00
本文提出了Higress-RAG框架,旨在解决企业级RAG系统在复杂查询下检索精度低、生成阶段幻觉率高以及实时应用延迟高等核心挑战。该框架基于模型上下文协议(MCP),采用“全链路优化”策略,集成了自适应路由、语义缓存、双混合检索(融合稠密与稀疏检索信号)以及纠正性RAG(CRAG)等关键技术。实验表明,通过优化从检索前查询重写到检索后纠正评估的整个生命周期,该系统为企业AI部署提供了一个可扩展且抗幻觉的解决方案。
检索增强生成企业ai全链路优化混合检索自适应路由语义缓存
cs
03-02 00:00
本研究针对早期健康科技团队在资源受限下平衡AI伦理与业务需求的挑战,提出通过可视化仪表盘实现负责任AI治理。基于人本计算方法和系列设计研究,文章指出有效的治理仪表盘需与利益相关者共创、适应组织成熟度、并支持多样化的角色与任务。这项工作为支持早期健康创新中的决策与问责提供了可操作指南,并建议通过生态系统层面的协调,推动医疗AI创新更具可扩展性和多样性。
负责任ai健康科技可视化治理人本计算仪表盘设计早期创新
cs
03-02 00:00
本研究提出的Hello-Chat是一个端到端的音频语言模型,旨在解决现有大音频语言模型在感知与表达之间的脱节问题,避免产生机械的“朗读式”语音。通过利用大规模真实对话数据集和模态交错训练策略,该模型在拟人化生成方面取得突破。实验表明,Hello-Chat不仅在特定音频理解任务上达到SOTA性能,而且在韵律自然度和情感对齐方面显著优于现有基线,为下一代共情AI智能体铺平了道路。
音频大模型社交交互拟人化生成端到端模型情感对齐模态训练
cs
03-02 00:00
本文提出Task-Lens方法,对涵盖26种印度语言的50个语音数据集进行跨任务分析,评估其在9种下游语音任务中的适用性。研究发现,许多数据集包含未充分利用的元数据,可支持多种任务。通过揭示跨任务关联与资源缺口,该方法有助于研究者挖掘现有数据集的潜力,并优先为服务不足的任务和语言创建新资源。
语音数据集低资源语言跨任务分析印度语言元数据挖掘
cs
03-02 00:00
本文提出CIll框架,利用大语言模型(LLM)为模型验证自动生成归纳不变式。该框架在正确性检查与归纳性检查间迭代:当归纳性检查失败时,提取反例(CTI)并交由LLM分析,以提出能排除该反例的新不变式。CIll还结合了IC3算法与K归纳法,并通过重用IC3学习到的不变式、应用局部证明来减少冗余搜索、加速收敛。实验表明,CIll在RISCV-Formal框架下证明了完全合规性,并在NERV和PicoRV32中证明了所有非M指令的完全准确性。
模型验证归纳不变式大语言模型形式化方法硬件验证
cs
03-02 00:00
针对在线社交网络中意见极化危害社会凝聚力的问题,本研究提出了PACIFIER框架。该框架将经典的极化调控问题(如MI和ME)重新定义为序列决策任务,利用图强化学习技术,无需重复计算稳态即可制定自适应干预策略。PACIFIER具有目标无关性,可自然扩展到包含预算约束、连续内部意见、有偏同化动力学及节点移除等多种FJ模型一致场景。在真实网络上的大量实验表明,该框架在多种调控场景下均表现出强大的性能和可扩展性。
意见极化图强化学习社交网络干预序列决策fj模型算法调控
cs
03-02 00:00
本研究提出AV-LMMDetect,一种基于监督微调的大型多模态模型,用于音频-视频深度伪造检测。该方法将检测任务转化为提示性问答(“此视频是真实的还是伪造的?”),基于Qwen 2.5 Omni架构,联合分析音频与视觉流。训练采用两阶段策略:轻量级LoRA对齐,随后进行音视频编码器的全参数微调。在FakeAVCeleb和Mavos-DD数据集上的实验表明,其性能达到或超越了现有方法,并在Mavos-DD上创造了新的最优结果。
深度伪造检测多模态模型音频视频分析监督微调人工智能安全
cs
03-02 00:00
本文针对AI推理管道与云基础设施融合带来的双重攻击面,提出了一种统一的安全架构。核心贡献包括:1)整合AI治理、云安全和工控标准,构建了基于攻击者能力分层的生命周期威胁分类法;2)提出了一个覆盖安全数据工厂、强化模型供应链和运行时治理层的统一参考架构;3)通过Grid-Guard案例研究,展示了如何融合NIST AI RMF、MITRE ATLAS等多项标准,在无需人工干预的情况下抵御针对电网系统的物理-金融协同攻击,并满足多重合规要求。
ai安全云安全工控安全威胁建模合规架构基础设施安全
cs
03-02 00:00
本文研究了图中受上下文无关文法约束的可达性问题,提出了一个评估此类查询的算法框架,并分析了其理论时间复杂度。通过在实际模式基准上进行广泛实证评估,比较了不同算法变体并报告了性能权衡。结果表明,文法结构和图特征对可达性计算有显著影响,为实践中选择高效方法提供了指导。
上下文无关文法图可达性算法框架性能权衡语法约束
cs
03-02 00:00
本文系统综述了远程操控四足机器人在工业巡检、军事侦察等安全关键任务中的网络安全问题。研究整合了2019-2025年的文献与漏洞披露,提出了一个涵盖感知操纵、VR/AR操作员攻击、通信干扰等六个层面的攻击分类法,并对攻击后果进行了系统映射与时间特性分析。研究发现,现场部署的通信保护技术成熟度较高,而实验性的感知层与操作员层防御技术成熟度存在显著差距。研究还比较了六个商业平台的安全性,提供了分阶段部署指南,并指出了八个优先研究缺口。
四足机器人网络安全远程操控漏洞分析防御技术工业安全
cs
03-02 00:00
本文提出了一种利用各向同性激活函数构建动态神经网络的新方法。该方法通过对称性原理,使网络结构在神经元生成和退化过程中保持计算不变性,从而实现根据任务需求实时调整网络规模。核心在于各向同性原语的基独立性,它打破了传统逐元素激活函数对单个神经元的固有绑定,允许对网络层进行对角化重构,形成交替层间一对一的有序连接。这不仅能精确识别对网络功能影响重大的神经元连接,还为网络剪枝(等同于神经退化)和添加新支架神经元(神经发生)提供了分析不变的理论基础。文中还引入了可调参数“本征长度”来确保这种不变性。实验表明,各向同性密集网络在保持功能完全不变的前提下,渐近稀疏度可达50%。该方法为网络机制可解释性和动态拓扑结构提供了新的可能性。
动态神经网络各向同性激活神经发生网络剪枝对称性可解释性
cs
03-02 00:00
本研究提出了一个将连续反馈循环集成到个性化算法中的理论与实现框架,以解决传统静态用户画像和预定义规则无法捕捉用户偏好动态变化的问题。通过持续收集和分析用户反馈,AI系统能够实时调整其推荐、响应和交互,以更好地适应用户的当前情境和偏好。理论分析为自适应算法的收敛性和遗憾界提供了保证。在推荐系统、虚拟助手和自适应学习平台三个领域的实验评估表明,动态个性化方法相比静态方法将用户满意度提升了15-23%,同时保持了计算效率。研究还探讨了连续反馈机制的实施挑战、对用户体验的影响,并全面分析了个性化质量、计算开销与用户疲劳之间的权衡。
动态个性化连续反馈交互式ai实时适应用户满意度算法框架
cs
03-02 00:00
本文指出当前可视化分析系统的研究范式存在矛盾:其研究方法(如基于简单认知行为的设计评估)与研究目标(支持复杂的推理、问题解决等分析行为)严重不匹配,损害了研究的内部效度(系统有效性)与外部效度(方法普适性)。为解决此问题,论文主张超越传统人机交互理论,提出采用复杂认知理论(特别是问题解决理论)作为新的理论基础,以更好地指导可视化分析系统的设计与评估研究。
可视化分析复杂认知系统设计理论框架人机交互评估方法
cs
03-02 00:00
针对现有大语言模型(LLMs)去毒方法(如DPO、NPO)易受对抗性提示和微调再学习攻击的问题,本文提出REPO方法。该方法将去毒重新定义为词元级别的偏好优化问题,通过新颖的目标函数,迫使有害续写的表征向良性表征收敛。机理分析表明,REPO能对编码毒性的神经元进行深度、局部的编辑,同时保持模型的通用能力。全面评估显示,REPO在对抗再学习攻击和增强型GCG越狱等复杂威胁方面,实现了最先进的鲁棒性。
大语言模型模型安全表征学习偏好优化对抗鲁棒性去毒
cs
03-02 00:00
针对生成式推荐模型在微调时可能将用户敏感属性编码进参数的问题,本文提出了U-CAN框架。该框架通过对比分析神经元在待遗忘数据与保留数据上的激活差异,精准识别并量化风险。不同于传统的梯度擦除或二值化剪枝方法,U-CAN在LoRA适配器上引入了基于效用感知校准的自适应软衰减机制,使用可微的衰减函数选择性下调高风险参数,在有效抑制敏感信息检索路径的同时,最大程度地保留了模型的核心推理能力与网络拓扑结构。实验表明,该方法在隐私遗忘、效用保留和计算效率方面均取得了良好效果。
机器遗忘生成式推荐隐私保护低秩适配对比学习模型安全