cs
04-08 00:00
本文提出了一种专为网页文档设计的新型分块框架Web Retrieval-Aware Chunking (W-RAC),旨在解决传统分块方法在检索增强生成(RAG)系统中面临的高成本、冗余生成和可扩展性差等问题。W-RAC的核心创新在于将文本提取与语义分块规划解耦:首先将解析后的网页内容表示为结构化、可寻址的单元,然后仅利用大语言模型(LLM)进行检索感知的分组决策,而非文本生成。该方法大幅减少了LLM的token消耗,消除了幻觉风险,并提升了系统可观测性。实验表明,W-RAC在保持或超越传统方法检索性能的同时,将分块相关的LLM成本降低了一个数量级。
检索增强生成文档分块成本优化网页检索大语言模型
cs
04-08 00:00
本文提出TDA-RC框架,旨在解决大语言模型推理中单轮思维链(CoT)存在逻辑断层、而多轮方法(如ToT、GoT)成本过高的问题。该方法利用持续同调将不同推理范式映射到统一拓扑空间,量化其结构特征。核心是一个拓扑优化代理,它能诊断CoT链与理想拓扑特征的偏差,并生成针对性策略修复结构缺陷。实验表明,该方法在多个数据集上实现了推理精度与效率的优越平衡,为“单轮生成,多轮智能”提供了实用方案。
大语言模型推理优化拓扑数据分析思维链持续同调结构修复
cs
04-08 00:00
研究发现,自回归语言模型存在“逆转诅咒”,即训练时学习“A > B”却无法回答“B < A”。研究表明,采用双向监督目标(如掩码语言建模)可以缓解此问题,但其机制并非形成单一、方向无关的事实表征。相反,模型可能将正向与反向关系存储为不同的条目。这表明,目标层面的“修复”改善了逆转行为,但未必能诱导出人们期望的、统一的潜在概念泛化能力。
语言模型逆转诅咒双向监督掩码语言建模事实检索表征学习
cs
04-08 00:00
本文提出Inclusion-of-Thoughts(IoT)方法,旨在解决大语言模型在多项选择题中因干扰项存在而产生的偏好不稳定问题。该方法采用渐进式自过滤策略,重构问题以仅保留合理选项,从而降低认知负荷,使模型能更专注于正确答案。实验表明,IoT在算术、常识推理及教育基准测试中显著提升了思维链性能,且计算开销极小,同时增强了决策过程的透明度与可解释性。
大语言模型偏好稳定性思维链决策净化多项选择题推理增强
cs
04-08 00:00
针对图基CFD代理模型在振荡流中预测相位漂移的问题,本研究提出一种无需重新训练的后处理相位控制框架。核心在于为冻结的模型嵌入层寻找解耦表示,并设计尊重底层动力学的干预机制。方法上,首先利用稀疏自编码器从冻结的MeshGraphNet嵌入中提取稀疏、解耦的特征表示;然后,通过希尔伯特分析识别振荡特征对,结合SVD将空间场投影为低秩时间系数,并应用平滑的时变旋转来提前或延迟周期模态,同时保持幅相结构。实验表明,在相同的干预流程下,基于稀疏自编码器的解耦表示优于PCA或原始嵌入空间,且静态干预方法在此动态场景中失效。这项工作表明,当干预机制尊重底层动力学时,潜在空间控制可以从语义领域扩展到时间相关的物理系统,并且用于可解释性的稀疏特征同样可以作为物理意义明确的控制轴。
cfd代理模型相位控制稀疏自编码器图神经网络潜在空间干预动力学系统
cs
04-08 00:00
本研究提出SUMMIR框架,用于从体育新闻中自动生成并排序赛前赛后洞察。团队构建了包含7900篇文章、覆盖4项运动的基准数据集,并利用GPT-4o、Qwen2.5等大语言模型生成洞察。通过FactScore评估事实准确性,结合SummaC框架检测幻觉,最终通过SUMMIR模型根据用户兴趣对洞察进行重要性排序。结果表明,该方法能有效生成高质量、相关的洞察,并揭示了不同LLM在事实一致性与趣味性上的显著差异。
体育新闻分析大语言模型幻觉检测洞察排序事实一致性评估
cs
04-08 00:00
本研究首次系统评估了PDF处理框架对下游问答准确性的影响。通过比较Docling、MinerU、Marker和DeepSeek OCR四种开源框架在19种配置下的表现,使用包含36份葡萄牙行政文档(1706页)的语料库和50个问题的基准进行测试。研究发现:基于Docling框架、结合层次分割和图像描述的配置实现了最高的自动化准确率(94.1%)。元数据增强和层次感知分块对准确率的贡献大于转换框架本身的选择。基于字体重建层次结构的方法持续优于基于LLM的方法。研究证实,数据准备质量是RAG系统性能的主导因素。
文档预处理pdf转换rag系统问答准确性信息检索
cs
04-08 00:00
随着大语言模型驱动的搜索代理兴起,检索系统的主要用户正从人类转向智能体。传统基于人类点击日志训练的检索模型与代理的查询和结果消费方式存在根本性不匹配。本文提出一种新的训练范式“从代理轨迹中学习检索”,直接从代理的多轮交互轨迹中挖掘监督信号。通过分析代理行为,识别出能揭示文档效用的关键信号(如浏览动作、未浏览拒绝、浏览后推理痕迹),并据此提出LRAT框架。该框架从轨迹中挖掘高质量检索监督,并通过加权优化融入相关性强度。实验表明,经LRAT训练的检索器在不同代理架构和规模下,均能持续提升证据召回率、端到端任务成功率和执行效率。
信息检索智能体搜索轨迹学习大语言模型学习排序
cs
04-08 00:00
本文提出“合成信任攻击”这一正式威胁类别,并构建了STAM八阶段攻击模型,涵盖从侦察到事后利用的完整攻击链。研究指出,现有防御聚焦于合成媒体检测,但真实攻击面是受害者的决策层。数据显示,人类深度伪造检测准确率仅约55.5%,而LLM诈骗代理的得手率高达46%(人类操作员为18%)。为此,作者提出了五类信任线索分类法、可复现的事件编码框架,并将“冷静、核查、确认”协议转化为决策层防御方案。核心论点是:AI时代的欺诈攻击面已从“合成媒体”转向“合成可信度”。
合成信任攻击生成式ai社会工程学决策安全深度伪造防御信任模型
cs
04-08 00:00
视频预告片自动生成领域正经历从基于规则的启发式剪辑到深度生成式合成的范式转变。早期方法依赖低层特征工程和视觉显著性来选取片段,而当前基于大语言模型(LLMs)、多模态大语言模型(MLLMs)和扩散模型的系统,不仅能识别关键镜头,更能构建连贯且富有情感共鸣的叙事。本文综述了从图卷积网络(GCNs)到预告片生成Transformer(TGT)的架构演进,分析了自动生成内容对UGC平台的经济影响,并探讨了高保真神经合成带来的伦理挑战。报告为基石模型时代的AI驱动预告片生成建立了新的分类体系。
视频生成多模态ai大语言模型扩散模型自动剪辑内容合成
cs
04-08 00:00
本文首次系统研究了美国政治选区划分中广泛使用的对偶图(以人口普查区块为顶点、地理邻接为边),通过分析县、人口普查区、人口普查区块组等层级的真实数据,揭示了此类图“近乎平面、近乎三角化”的特性。研究还比较了基于随机扰动网格或Delaunay三角剖分等随机图模型,确定了最能模拟真实对偶图关键指标的模型,为后续算法开发提供了重要的图结构理论基础。
对偶图政治选区划分图模型计算社会科学图论
cs
04-08 00:00
本研究针对协作机器人在共享工作空间中,因合作者行为策略突变而引发的安全风险,提出了一种轻量级信念追踪模块UA-TOM。该模块通过选择性状态空间动态、因果注意力和预测误差信号,增强冻结的视觉-语言-动作控制主干网络,以检测行为模式的切换。在ManiSkill任务中,启用检测可将切换后的碰撞减少52%。UA-TOM在无需辅助的方法中实现了最高的检测率(±3步内达85.7%)和最短的近距离时间(4.8步),推理开销仅增加7.4毫秒。分析表明,其敏感性源于学习到的动态而非输入相关的门控机制。
机器人协作行为检测安全控制信念动态人机交互
cs
04-08 00:00
针对现有检索增强生成(RAG)系统在复杂跨模态推理上的不足,本研究提出了MG²-RAG框架。该框架通过结合轻量级文本解析与实体驱动的视觉定位,构建了层次化的多模态知识图,将文本实体与视觉区域融合为保留原子证据的统一多模态节点。在此基础上,引入多粒度图检索机制,聚合密集相似度并在图中传播相关性,以支持结构化的多跳推理。在四项多模态任务上的实验表明,MG²-RAG在实现最先进性能的同时,相比先进的图框架平均实现了43.3倍的构建速度提升和23.9倍的成本降低。
多模态检索增强生成知识图谱跨模态推理多粒度图检索视觉语言模型轻量级框架
cs
04-08 00:00
针对物理信息神经网络(PINNs)在求解Bhatnagar-Gross-Krook(BGK)模型时,标准$L^2$损失函数无法保证宏观矩准确预测的问题,本文提出了一种速度加权的$L^2$损失函数。该方法通过在高速度区域施加更强的误差惩罚,有效提升了近似解的精度。理论分析证明了该加权损失最小化能保证解的收敛性,数值实验也表明其在多个基准测试中均优于标准方法,具有更高的准确性和鲁棒性。
物理信息神经网络bgk模型加权损失函数偏微分方程求解计算流体力学数值稳定性
cs
04-08 00:00
针对大语言模型在系统性推理中易产生幻觉、性能受无关上下文干扰的问题,本研究提出Pramana方法。该方法通过基于2500年历史的印度Navya-Nyaya逻辑框架(包含怀疑分析、证据源识别、五段论、反事实验证、谬误检测和最终判定六个阶段)对Llama等模型进行微调,为模型提供认知支架。在55个逻辑问题上的实验显示,模型在语义正确性上达到100%,表明其内化了推理内容。研究开源了全部模型与数据,旨在推动AI的可解释推理研究。
大语言模型可解释推理navya-nyaya逻辑模型微调认知支架ai可靠性
cs
04-08 00:00
本研究提出了一个操作框架,用于区分元认知顺序效应是源于经典状态变化还是更深层的结构性非交换性。模型将元认知评估视为作用于内部状态空间的变换操作,将评估的反作用与可观测输出分离。研究表明,顺序依赖性排除了任何忠实的布尔交换表示。通过引入反事实确定性和评估非侵入性假设,研究推导出可检验的约束条件,违反这些约束则排除了任何经典非侵入性解释,从而证实了“真正的非交换性”。研究提供了一个明确的三维旋转模型作为数值示例,并概述了涉及感知决策后顺序信心、错误可能性和知晓感判断的行为范式。
元认知顺序效应非交换性操作框架认知建模行为范式
cs
04-08 00:00
本文提出了一种新的定量-定性混合邻近度度量方法,用于解决来自多个独立源的数据是否指向同一物理对象的识别问题。该方法针对定量特征采用概率度量,针对定性特征采用可能性度量,无需对特征值进行标准化转换即可处理因测量误差导致的数值差异。作者验证了该度量方法满足相关公理要求,并基于此提出了多种计算信息对象整体邻近度的方案。
特征邻近度对象识别混合度量信息融合概率度量
cs
04-08 00:00
本文提出ReVEL框架,将大语言模型(LLM)作为多轮推理器嵌入进化算法(EA),以自动化设计组合优化问题的启发式规则。其核心是性能画像分组和多轮反馈驱动反思两大机制:前者将候选启发式规则按行为聚类,为LLM提供紧凑的反馈信息;后者使LLM分析群体行为并生成针对性改进。EA元控制器则自适应地平衡探索与利用,选择性整合并验证改进。实验表明,ReVEL能生成更鲁棒、更多样的启发式规则,性能显著优于基线方法。
启发式设计大语言模型进化算法组合优化多轮推理自动化算法
cs
04-08 00:00
本文提出一个通用框架,用于发现组合优化问题中隐藏的代数结构,并利用其缩小搜索空间。框架包含四个步骤:识别代数结构、形式化操作、构造商空间以压缩冗余表示、在约简空间上直接优化。在规则组合任务(如患者亚组发现、分子筛选)中,合取规则构成幺半群。通过特征向量编码,证明了其与布尔超立方$\{0,1\}^n$(按位OR运算)的同构关系,从而将规则中的逻辑AND转化为编码中的按位OR。这产生了一种原则性的商空间公式,可对功能等效的规则进行分组并指导结构感知搜索。在真实临床数据和合成基准测试中,基于商空间的遗传算法在48%至77%的运行中找到了全局最优解,而标准方法仅为35%至37%,同时保持了跨等价类的多样性。
组合优化代数结构商空间学习规则发现遗传算法幺半群
cs
04-08 00:00
本文介绍了ML Defender(aRGus NDR),一个专为医院、学校等资源受限组织设计的开源网络入侵检测系统。该系统采用C++20构建,可在约150-200美元的商用硬件上部署。其核心是一个六组件处理管道,结合了基于规则的快速检测器与嵌入式随机森林分类器,并采用“最大威胁获胜”策略综合两者评分以抑制误报。在CTU-13 Neris僵尸网络数据集上的评估结果显示,系统实现了F1=0.9985,误报率低至0.0002%,且ML层将快速检测器6.61%的误报率降至零。在商用硬件上,单次分类推理延迟仅为0.24-1.06微秒,管道可稳定处理约34-38 Mbps流量。
入侵检测机器学习开源安全资源受限僵尸网络误报抑制
cs
04-08 00:00
针对大视觉语言模型推理成本高昂的问题,本文提出表征一致性剪枝器。该方法通过跨注意力剪枝器预测累积掩码,实现跨层一致且单调的视觉令牌削减。为补偿信息损失,设计了延迟修复适配器,缓存被剪枝令牌的本质信息,并采用修复损失使剪枝后表征与全令牌教师模型的一、二阶统计量匹配。实验表明,RCP可剪除高达88.9%的视觉令牌,FLOPs降低85.7%,仅带来微小的平均精度下降,且在多个基准测试上优于无需微调原模型的方法。
视觉语言模型模型剪枝表征一致性延迟修复推理加速分布偏移
cs
04-08 00:00
本文综述了如何利用未标注动作的时序视频数据来学习机器人操作的控制界面。视频能大规模捕捉物理动态,但将其转化为可靠控制仍具挑战。作者提出以“界面为中心”的分类法,将方法分为三类:直接视频-动作策略、潜在动作方法以及显式视觉界面。文章分析了各类方法的控制集成特性,并指出当前最紧迫的挑战在于“机器人集成层”——即如何将视频预测可靠地连接到机器人行为,并为此指明了未来的研究方向。
机器人操作视觉学习控制界面时序数据模仿学习
cs
04-08 00:00
本文介绍了为促进工业级广告场景下的生成式推荐研究而发布的两个大规模全模态数据集:TencentGR-1M和TencentGR-10M。这些数据集基于真实的腾讯广告日志构建,包含丰富的协同ID和由先进嵌入模型提取的多模态内容表示。任务聚焦于广告场景下的多模态序列生成,并针对高价值的转化事件引入了加权评估方法。研究提供了任务定义、数据构建流程、基线模型及优胜方案的关键发现,旨在为工业规模的生成式推荐研究提供公开基准。
生成式推荐多模态推荐广告算法序列建模工业数据集