cs
04-24 00:00
针对传统RAG方法以文本块为知识单元导致灵活性不足、三元组实体链接易受关系抽取错误影响的问题,本文提出Atom-Entity Graph架构。将知识存储为独立原子事实,结合个性化PageRank与相关性过滤,实现精准实体连接与可靠推理。在五个公开基准上,AtomicRAG算法在检索精度与推理鲁棒性上超越强基线。
检索增强生成知识图谱原子事实实体链接个性化pagerank
cs
04-24 00:00
CaST-POI 提出候选条件时空模型,通过将候选 POI 作为查询动态关注用户历史轨迹,并引入候选相对时空偏置,解决了传统方法忽略候选依赖性的问题。在三个基准数据集上,该方法显著优于现有技术,尤其在大候选池场景下表现突出。
下一兴趣点推荐候选条件建模时空模型轨迹预测位置服务
cs
04-24 00:00
ADS-POI提出一种时空状态分解框架,将用户历史行为拆解为多个并行演化的潜在子状态,每个子状态拥有独立的时空转换动力学。通过上下文条件机制选择性聚合形成决策状态,有效解耦常规移动模式、短期意图等异质信号。在Foursquare和Gowalla三个真实数据集上,全排序评估下显著优于现有方法。
兴趣点推荐时空状态分解用户行为建模子状态演化上下文聚合
cs
04-24 00:00
TASTE 提出了一个多模态音乐推荐数据集与基准框架,整合音频与文本信息。通过大规模自监督音乐编码器提取音频表示,在召回和CTR任务中验证了内容驱动的有效性。新方法 MuQ-token 能高效聚合多层音频特征,显著优于现有特征融合技术,为冷启动场景提供解决方案。
音乐推荐多模态音频特征聚合冷启动自监督学习基准框架
cs
04-24 00:00
MATRAG 提出一种结合多智能体协作与知识图谱增强检索的框架,用于可解释推荐。它包含四个专业智能体(用户建模、物品分析、推理、解释),并引入透明度评分机制。在三个基准数据集上,推荐准确率提升12.7%(命中率)和15.3%(NDCG),87.4%的解释被专家评为有用且可信。
多智能体检索增强生成可解释推荐知识图谱透明度评分
cs
04-24 00:00
针对半结构化文档(如HTML)检索中结构信息丢失的问题,本文提出SPIRE管道。它通过树结构表示文档,利用子文档、路径及局部/全局上下文机制,在保持结构完整性的同时生成精确、可解释的引用。实验表明,该方法在固定预算下比传统段落基线产生更高质量、更多样化的引用,并保持可扩展性。
结构感知检索证据检索半结构化文档可解释性子文档
cs
04-24 00:00
本文提出关联增强检索(AAR),通过训练仅4.2M参数的小型MLP,利用对比学习学习语料库中段落间的关联关系,而非语义相似度。在HotpotQA上,AAR将段落Recall@5从0.831提升至0.916(+8.6点),在密集检索失败的难题上提升28.5点。该方法无需评估集调优,训练仅需不到2分钟,推理增加3.7ms/查询。
多跳检索关联学习对比学习密集检索重排序
cs
04-24 00:00
现代视频文本检索模型在分布内数据上表现优异,但面对真实世界的查询偏移时性能骤降。本文提出包含12种扰动类型、5种严重程度的基准,并揭示查询偏移加剧了“枢纽”现象。为此,作者提出HAT-VTR测试时自适应框架,通过枢纽抑制记忆和多粒度损失,显著提升模型鲁棒性。
视频文本检索查询偏移鲁棒性测试时自适应枢纽现象
cs
04-24 00:00
DenoiseRank 首次从生成式视角解决排序学习(LTR)问题,利用扩散模型对相关标签加噪并在查询文档上反向去噪,精准预测分布。实验证明其在基准数据集上有效,为生成式 LTR 树立新标杆。
排序学习扩散模型生成式方法去噪排序机器学习
cs
04-24 00:00
针对检索增强生成(RAG)中知识冲突导致模型胡编乱造的问题,本文提出ERA(基于证据的可靠性对齐)框架。该方法将传统标量置信度改为显式证据分布,利用狄利克雷分布建模内外知识,并通过Dempster-Shafer理论量化知识冲突,从而区分认知不确定性与数据歧义。实验表明,ERA在保持答案覆盖率的同时显著提升了模型拒答的可靠性。
检索增强生成知识冲突可靠性对齐证据分布不确定性量化dempster-shafer理论
cs
04-24 00:00
Caesar 是一种新型智能体 LLM 架构,旨在从被动检索转向主动创造性发现。它通过动态上下文感知策略进行深度网络探索,并利用对抗性草稿精炼循环合成新颖见解,而非仅确认已有知识。实验表明,Caesar 在需要创造力的任务中显著优于现有 LLM 研究智能体,生成高新颖性和结构连贯性的答案。
智能体llm知识图谱创意合成网络探索
cs
04-24 00:00
本文介绍CRED-1,一个开放、可复现的域名级可信度数据集。它融合OpenSources.co和Iffy.news两个来源,并加入域名年龄、网站流行度、事实核查频率和威胁情报四个增强信号,覆盖2672个域名,赋予0.0~1.0的综合可信度评分。该数据集专为隐私保护的浏览器扩展设计,可在内容交付阶段实现客户端预辟谣。整个流程基于Python标准库构建,完全可复现,代码与数据集以CC BY 4.0协议发布。
虚假信息域名可信度预辟谣开源数据集隐私保护
cs
04-24 00:00
DiagramBank 是一个大规模科研示意图数据集,包含从顶级论文中精选的 89,422 张示意图。它通过自动化流程提取图表、文本引用,并用 CLIP 过滤器区分示意图与普通图表。每个实例配有摘要、标题及图文引用对,支持多粒度检索。该数据集以可索引格式发布,并提供检索增强生成代码库,用于示范条件化的论文 teaser 图合成,解决了 AI 科学家系统在自动生成出版级示意图上的瓶颈。
科研示意图数据集检索增强生成ai科学家论文配图多模态检索
cs
04-24 00:00
针对长序列推荐中用户兴趣频繁漂移(会话跳跃)导致的噪声问题,本文提出Mixture of Sequence(MoS)框架。该框架通过主题感知路由机制将用户序列重组为多个主题一致的子序列,并引入多尺度融合机制结合全局、短期与主题特征。实验表明,MoS在保持SOTA性能的同时计算量更低,实现了效率与效果的平衡。
长序列推荐专家混合模型兴趣漂移主题感知多尺度融合
cs
04-24 00:00
针对大语言模型在复杂查询中易产生幻觉、上下文处理能力有限的问题,本文提出KGiRAG——一种迭代式、带反馈的GraphRAG架构。该架构通过质量评估循环迭代优化输出,直至生成可靠、有依据的响应。在HotPotQA数据集上的实验表明,相比单次基线,该方法显著提升了响应的语义质量和相关性。
图增强检索迭代生成大语言模型复杂查询质量评估
cs
04-24 00:00
针对RAG在多异构数据源(如私有数据库、全球语料库、API)中路由错误频发的问题,本文提出RealRoute系统。它摒弃传统的“LLM-as-a-Router”预测式路由,采用“检索-验证”新范式:先并行、源无关地检索所有潜在证据,再通过动态验证器交叉核对并合成事实性答案。实验表明,RealRoute在多跳RAG推理任务上显著优于基线方法,并已开源提供可视化交互界面。
检索增强生成多源路由检索-验证多跳推理开源工具
cs
04-24 00:00
针对生成式推荐中语义ID(SID)生成面临的信息退化、语义退化与模态扭曲问题,本文提出三项创新:深度上下文兴趣挖掘(DCIM)、跨模态语义对齐(CMSA)与质量感知强化机制(QARM)。通过视觉语言模型对齐非文本模态,引入深度兴趣挖掘保留上下文语义,并利用强化学习筛选高质量SID。实验表明,该方法在多个基准上优于现有SID生成方法,消融研究验证了各组件的有效性。
生成式推荐语义id跨模态对齐深度兴趣挖掘强化学习信息退化
cs
04-24 00:00
本研究针对未来战争中行动方案(CoA)规划自动化需求,提出基于AI的CoA自动生成系统架构。通过分析公开军事学说,梳理CoA规划各阶段适用的AI技术,旨在解决传统人工规划在作战范围扩大、速度提升下的挑战。该架构为军事决策支持系统开发提供技术参考。
军事行动方案ai规划自动化系统作战决策系统架构
cs
04-24 00:00
Votiverse 提出了一种可配置的治理引擎,支持直接投票、按主题委托投票及混合模式。其两大创新是:治理感知层(实时监控委托网络并提供渐进式信息披露)和预测追踪问责层(记录提案的可证伪预测与实际结果)。该平台将投票从瞬时行为转变为集体学习过程,并已开源发布。
液态民主可配置治理委托投票问责机制开源平台
cs
04-24 00:00
本研究通过13位全球跨性别与非二元软件工程学生的深度访谈,发现性别认同间接影响专业选择,远程工作与创造包容技术是主要动机。尽管未遭遇直接歧视,但学生普遍经历言语侮辱与敌意,影响心理健康。研究呼吁加强机构支持、结构性改革与代表性提升,以促进学术环境包容性。
跨性别非二元软件工程教育包容性性别少数心理健康
cs
04-24 00:00
本文针对前沿AI供应商嵌入军事系统后可能影响决策边界的问题,提出“决策主权”概念,并设计了一种分层、模型无关的命令支持架构。该架构确保供应商模型可替换,而路由、约束、日志、升级和行动授权等核心功能由国家掌控,从而在保护商业秘密的同时减少战略依赖。研究基于2026年Anthropic-五角大楼争议及Project Maven历史,为采购、治理和联盟互操作性提供具体启示。
军事ai决策主权模型可替换商业秘密国家控制架构设计
cs
04-24 00:00
本研究通过实证分析,系统评估了生物医学检索管道中语料库选择、分块粒度与向量索引配置对性能与效率的影响。基于多种公开数据集与查询类型,采用LLM-as-a-judge与人工验证进行鲁棒性评估。关键发现包括:语料库聚合可提升绝对检索质量,MedRAG/pubmed在HNSW索引下表现最优,以及FAISS索引在速度与效率间的最佳权衡。
生物医学检索检索管道性能效率权衡语料库聚合向量索引
cs
04-24 00:00
本研究将人口学中的“出生顺序”概念引入科学社会学,分析超百万美国博士数据发现:同一导师指导的博士生中,后入学者在短期与长期的多项成就指标上系统性落后于先入学者。机制在于后学者从成熟学者处获得的认知刺激更少,且在同伴分化压力下研究领域更窄,限制了智力发展。该框架为理解大众科学时代的学术分层提供了新视角。
学术分层出生顺序博士生涯导师效应科学社会学
cs
04-24 00:00
本文提出“正交艺术”这一新兴艺术学科,它并非服务于AI,而是以AI无法生成的概念空间为结构定义。作为该框架的首个实例,作者以技术示意图为媒介,开创了独特的艺术实践。该工作还具备重要教学价值:通过将艺术实践植根于示意图逻辑和算法结构,为人文学科提供了进入增强机器系统领域的跨学科入口,融合艺术、工程与哲学。
正交艺术人工智能示意图美学跨学科增强机器系统