今日速览 · Fortune Health

cs 03-20 00:00

大语言模型具备心智理论吗？基于“奇怪故事”范式的比较评估

本研究探讨了当前大语言模型是否具备心智理论能力，即从文本中推断他人信念、意图和情绪的能力。通过使用人类心智理论研究中的“奇怪故事”范式，测试了五个LLM并与人类表现进行比较。结果显示，早期和小型模型的表现受相关推理线索数量及文本中无关信息的干扰影响较大。相比之下，GPT-4o展现出高准确性和强鲁棒性，即使在最具挑战性的条件下，其表现也与人类相当。这项研究为理解LLM的认知状态及其“真正理解”与“统计近似”之间的界限提供了实证依据。

心智理论大语言模型认知评估社会推理gpt-4o

cs 03-20 00:00

TherapyGym：评估与提升心理治疗聊天机器人的临床保真度与安全性

本文提出TherapyGym框架，旨在解决当前大语言模型（LLM）在心理健康支持应用中临床评估不足的问题。该框架围绕临床保真度与安全性两大支柱进行评估与优化：保真度通过自动化流程，基于认知治疗评定量表（CTRS）评估对认知行为疗法（CBT）技术的依从性；安全性则采用多标签标注方案，识别治疗特定风险（如未能处理伤害或虐待）。为校准LLM评估的偏差，研究还发布了包含116个对话、1270个专家评分的基准数据集TherapyJudgeBench。此外，TherapyGym可作为训练工具，利用CTRS和安全奖励驱动强化学习，训练模型在模拟多样化症状的患者对话中表现更佳。实验表明，经训练的模型专家评分显著提升，平均CTRS分数从0.10增至0.60。

心理健康ai临床评估治疗保真度安全对齐强化学习聊天机器人

cs 03-20 00:00

基于首词置信度的提示优化框架：提升大语言模型分类与理解能力

本文针对大语言模型在分类与理解任务中输出不确定性的问题，提出了一种基于首词置信度的不确定性校准提示优化框架。核心贡献是提出了对数尺度焦点不确定性度量，该度量通过引入标签先验概率作为风险调制因子，有效区分了来自预训练语料先验的虚假置信度与来自上下文理解的真实确定性。基于此度量，构建的UCPOF框架能够利用模型输出的首个词元来筛选高质量示例并动态优化提示。实验表明，该框架在多项任务上平均准确率提升超过6%，同时将检索触发率平均降低50.66%，在保证性能的同时显著降低了计算成本。

大语言模型不确定性校准提示优化检索增强生成首词置信度焦点损失

cs 03-20 00:00

基于大语言模型的政治人物传记自动化提取框架

本研究提出了一种名为“合成-编码”的两阶段智能体框架，旨在解决政治学研究中大规模结构化数据集构建的自动化难题。上游合成阶段利用递归智能体LLMs从异构网络源中搜索、筛选并整理传记信息；下游编码阶段则将整理后的传记映射为结构化数据。验证表明，在给定整理好的上下文时，LLM编码器的提取准确率可匹配或超越人类专家，且智能体系统能从网络资源中合成比维基百科更丰富的信息。该框架通过将证据整理为信号密集的表示，有效缓解了直接从长文本、多语言语料库编码时产生的偏差，为构建透明、可扩展的大规模政治学数据库提供了通用方案。

大语言模型智能体框架信息提取政治学自动化结构化数据

cs 03-20 00:00

确定性证据选择框架：提升检索增强问答系统的证据质量

本文提出了一种用于检索增强问答的确定性证据选择框架。针对传统向量检索仅依赖相似度得分、可能选出冗余或不完整证据的问题，该框架引入了意义效用估计（MUE）和多样性效用估计（DUE）两个固定评分程序。它们在答案生成前，基于语义相关性、术语覆盖度、概念独特性及冗余度等显式信号，独立评估每个句子或记录是否可作为证据。该方法无需训练或微调，只有当单元独立满足任务所需的事实、规则或条件时才被采纳，否则系统不返回答案。这产生了紧凑、可审计的证据集，并明确了相关文本与可用证据的界限。

检索增强问答证据选择确定性框架效用估计可解释性

cs 03-20 00:00

DynaRAG：融合静态与动态知识的检索增强生成框架

本文提出了DynaRAG框架，旨在通过动态知识集成，同时处理静态和时效性信息需求。与传统仅依赖静态语料的RAG不同，DynaRAG在检索文档不足以回答查询时，会选择性调用外部API。系统采用基于LLM的重排序器评估文档相关性，使用充分性分类器判断是否需要后备调用，并利用先进的API调用模型Gorilla v2进行精准工具调用。通过在CRAG基准上的评估，DynaRAG显著提升了动态问题的回答准确率，同时减少了幻觉生成。

检索增强生成动态知识api调用大语言模型问答系统

cs 03-20 00:00

CONSTRUCT：实时评估大语言模型结构化输出可信度的新方法

针对当前大语言模型（LLM）在生成结构化输出（如JSON）时存在的偶发性错误问题，本文提出了CONSTRUCT方法。该方法能够实时评估整个输出及其内部每个字段的可信度得分，得分越低则越可能包含错误，从而帮助用户高效分配有限的人工审核资源。CONSTRUCT无需标注训练数据或部署定制模型，适用于任何LLM（包括无logprobs的黑盒API），并能处理包含多种类型字段的复杂嵌套结构。作者还构建了一个包含可靠真实值的公开基准测试集。在包含四个数据集的基准测试中，CONSTRUCT在检测GPT-5、Gemini 3等模型输出错误方面，其精确率和召回率均显著优于其他评分方法。

大语言模型可信度评估结构化输出错误检测实时评分人工审核

cs 03-20 00:00

有害内容检测系统：超越准确率的可解释性分析

本研究对基于RoBERTa的有害内容检测模型进行了可解释性驱动的分析。尽管模型在Civil Comments数据集上表现出色（AUC=0.93，准确率=0.94），但通过SHAP和积分梯度两种后验解释方法分析发现，仅靠聚合评估指标无法揭示的系统性缺陷。分析表明，模型在间接毒性、词汇过度归因和政治敏感语境等边界案例中易出现误判。研究强调，可解释性AI应作为提升系统透明度和诊断能力的工具，而非单纯追求性能提升的杠杆，从而促进人机协同的内容审核。

可解释ai有害内容检测模型诊断后验解释人机协同自然语言处理

cs 03-20 00:00

MineDraft：通过批处理并行推测解码加速大语言模型推理

本文提出MineDraft，一种批处理并行推测解码框架，旨在通过重叠草稿生成与验证阶段来隐藏延迟，从而突破传统推测解码的顺序执行瓶颈。理论分析表明其效率显著优于标准方法。实验证明，MineDraft在吞吐量上最高提升75%，端到端延迟最高降低39%。该框架已作为插件集成至vLLM，展示了其在生产级推理系统中的实用性。

推测解码并行计算大语言模型推理加速批处理优化

cs 03-20 00:00

RoPE-ID：从几何视角解决长文本注意力机制失效问题

本研究针对RoPE位置编码在输入长度超出训练长度时性能崩溃的问题，提出了统一的几何理解。研究发现，注意力机制会促使键和查询的潜在点云紧密聚类，形成“汇令牌”，使注意力头在无需混合令牌时避免操作。长输入会破坏这种键/查询聚类分离，抑制汇令牌功能，导致病态行为。基于此，作者提出RoPE-ID方法，对部分通道应用高频RoPE，使注意力层能直接泛化到更长输入。在1B和3B参数Transformer模型上的LongBench和RULER基准测试验证了其有效性。

位置编码注意力机制长文本处理transformer几何分析模型泛化

cs 03-20 00:00

基于模式感知的智能体系统实现高效低成本NL2SQL转换

本研究提出了一种创新的模式感知智能体系统，旨在解决传统依赖大语言模型（LLM）进行自然语言转SQL（NL2SQL）任务时面临的计算开销大、数据隐私和部署成本高等问题。该系统策略性地以小型语言模型（SLM）作为主要智能体，并辅以选择性LLM回退机制：仅在检测到SLM输出错误时才调用LLM。在BIRD基准测试中，该系统实现了47.78%的执行准确率和51.05%的验证效率得分。由于约67%的查询由本地SLM处理，相比纯LLM基线，系统实现了超过90%的成本削减，单次查询平均成本降至0.0085（纯LLM系统为0.094），本地执行的查询操作成本趋近于零。

nl2sql智能体系统小型语言模型成本优化数据库交互模式感知

cs 03-20 00:00

BenchBrowser：量化语言模型基准测试与用户意图的差距

当前语言模型基准测试的元数据过于宽泛，难以准确反映其实际评估内容，可能导致模型在未测试领域出现“能力幻觉”。本文提出BenchBrowser，一个能够从20多个基准测试套件中检索与自然语言用例相关评估项目的工具。通过人工研究验证其高检索精度，BenchBrowser可生成证据，帮助从业者诊断基准测试的“内容效度不足”（对能力维度的覆盖过窄）和“收敛效度不足”（测量同一能力时排名不稳定），从而量化基准测试目标与实际测试内容之间的关键差距。

基准测试评估效度语言模型检索工具能力评估

cs 03-20 00:00

CaseLinker：用于儿童网络犯罪案件跨案分析的开源系统

本文介绍了CaseLinker，一个用于处理、分析和可视化儿童性剥削与虐待（CSEA）案件数据的模块化系统。该系统采用混合确定性信息提取方法，结合基于正则表达式的结构化数据提取和基于模式的语义分析，以提取案件关键信息并填充统一模式。CaseLinker能创建六种交互式可视化图表，并使用加权Jaccard相似度在多维度（平台、人口统计、主题、严重性等）上对相似案件进行聚类，从而支持跨案模式识别和趋势检测。在47个公开案件数据上的评估表明，该系统能有效提取信息、生成自动化洞察并进行交互式可视化，有助于减轻分析人员处理敏感材料的情绪负担并提升分析效率。

儿童网络犯罪案件分析信息提取数据可视化模式识别开源系统

cs 03-20 00:00

企业AI技术创新如何引发消费者投诉？基于保护动机理论的多方法研究

本研究基于保护动机理论，通过多方法分析揭示了企业AI技术创新与消费者投诉之间的关系。研究发现：1）企业的AI技术创新会显著增加消费者的威胁相关情绪，从而引发更多投诉；2）与AI流程创新相比，AI产品创新导致的消费者投诉水平更高。研究结合了标准普尔500公司的面板数据、Reddit用户生成内容分析以及两项受控实验，为理解消费者对AI创新的心理反应及有效管理投诉提供了理论与实证依据。

人工智能消费者投诉技术创新保护动机理论多方法研究企业战略

cs 03-20 00:00

神经AI临床可解释性：从伦理、技术与临床视角构建实用框架

本文指出当前可解释AI（XAI）在闭环神经技术中的解释方式常与临床需求脱节，提出了“临床有意义可解释性（CME）”概念。CME强调应优先提供临床相关、可操作的解释（如清晰的输入-输出关系与特征重要性），而非全面的技术细节，以避免信息过载。作者为此设计了NeuroXplain参考架构，旨在将AI输出与关键特征直观映射为临床可理解的格式，为未来神经调控设备提供技术设计指南，以更好地服务于患者治疗。

可解释ai神经技术临床决策人机交互医疗伦理闭环系统

cs 03-20 00:00

通过逐层监督实现Transformer模块化验证与控制

本文提出一种架构干预方法，通过双流处理（分离词元与上下文表示）、逐层监督（提供独立梯度信号）和门控注意力机制，在Transformer中实现可验证的模块化。实验表明，采用逐层监督训练的模型，其消融效应比标准训练模型强5-23倍，对目标行为的控制杠杆提升4倍，注意力头缩放能产生平滑、可预测的输出变化。关键发现是：逐层监督使消融效应方差从0.63%扩大至6.32%，揭示了预测与电路间的依赖关系，将可解释性从被动观察转向主动控制。

transformer模块化逐层监督可解释ai注意力机制因果控制神经网络架构

cs 03-20 00:00

Quine：将LLM智能体实现为原生POSIX进程

本文提出Quine，一种创新的运行时架构，将大型语言模型智能体直接映射为原生POSIX进程，而非在应用层构建隔离与调度机制。其核心映射为：身份对应进程ID，接口对应标准流与退出状态，状态对应内存、环境变量与文件系统，生命周期对应fork/exec/exit。通过单一可执行文件递归生成自身实例，Quine使智能体直接继承操作系统内核提供的隔离、组合与资源控制能力，并天然支持递归委托、通过exec进行上下文更新以及与Shell原生组合。分析同时指出，进程模型为执行提供了坚实基础，但认知的完整运行时模型仍需超越进程语义的扩展，如任务相对世界与可修正时间。

llm智能体操作系统进程模型运行时架构系统设计

cs 03-20 00:00

InfoMamba：一种无需注意力的混合Mamba-Transformer模型

本文提出InfoMamba，一种创新的混合架构，旨在解决序列建模中局部精细建模与长程依赖捕获的平衡难题。模型通过一致性边界分析，揭示了传统选择性状态空间模型（SSM）在捕捉高秩同步全局交互时的结构缺陷。InfoMamba的核心创新在于用概念瓶颈线性滤波层取代了Transformer中计算密集的自注意力机制，并通过信息最大化融合（IMF）策略，将全局上下文动态注入到SSM的循环流中。实验表明，该模型在分类、密集预测及非视觉任务上均超越了强大的Transformer和SSM基线，在保持近线性计算复杂度的同时，实现了更优的精度-效率权衡。

序列建模状态空间模型注意力机制混合架构信息最大化

cs 03-20 00:00

工业数据流中故障与领域漂移的区分方法研究

本文提出了一种新方法，旨在解决工业数据流监控中的一个关键问题：如何区分代表系统故障的异常变化与代表正常生产过程演变的“健康”领域漂移。该方法结合了改进的Page-Hinkley变点检测器用于识别数据分布变化，以及基于监督域适应的在线异常检测算法，并引入可解释人工智能组件辅助人工操作员进行最终判断。通过在钢铁工厂数据流上的实验验证了其有效性，有助于提升工业系统的实用鲁棒性，减少误报。

异常检测领域漂移工业数据流变点检测可解释ai在线学习

cs 03-20 00:00

RAG系统面临新型语料库投毒攻击，混合检索可有效防御

研究发现，针对检索增强生成（RAG）系统，攻击者可通过梯度引导优化恶意文档（包含休眠文档与触发文档），在推理时优先检索并操纵模型输出。在包含67,941份文档的安全问答语料库中，纯向量检索下的攻击共检索成功率高达38.0%。研究表明，无需修改底层大语言模型，仅采用结合BM25与向量相似度的混合检索架构，即可将梯度引导攻击成功率从38%降至0%。当攻击者同时针对稀疏与稠密检索信号优化时，混合检索仍能部分抵御（成功率20-44%），显著提高攻击难度。

rag安全投毒攻击混合检索梯度引导优化检索增强生成

cs 03-20 00:00

信息检索中的负采样技术综述：从随机采样到LLM生成

本综述系统梳理了密集检索中用于对比学习的负采样技术。通过分析35篇关键文献，提出了涵盖随机采样、静态/动态挖掘以及合成数据集等方法的分类体系，并重点评估了其在检索效果、计算成本与实现难度间的权衡。特别关注了传统综述中缺失的、由大语言模型驱动的现代方法，并指出了利用LLM生成合成数据这一未来重要方向。

信息检索负采样密集检索对比学习大语言模型合成数据

cs 03-20 00:00

大语言模型存在能力-表达分离现象：训练内容可提取但不会自然生成

本研究通过分析300个提示-响应对发现，大语言模型在特定条件下能够提取并追溯训练数据中的内容，但在标准生成任务中却不会表达这些已学习的信息。实验覆盖三种不同模型、十种任务场景，在创意叙事和实用建议等上下文中，均未观察到非因果解决方案框架的生成（0%，95%置信区间：[0%，1.2%]）。这表明任务条件化的生成策略能够全面抑制已学习内容在不同语境下的表达，挑战了“训练数据存在直接预测输出概率”的普遍假设。

大语言模型能力表达分离生成策略训练数据输出控制模型行为

cs 03-20 00:00

控制癫痫发作：基于图正则化平均场博弈的全脑动力学调控新框架

本文提出了一种名为图正则化Koopman平均场博弈（GK-MFG）的新框架，用于控制癫痫发作期间的高维非线性神经动力学。该方法结合储层计算来近似Koopman算子，将脑电图（EEG）动态嵌入线性潜在空间，并利用从相位锁定值（PLV）导出的图拉普拉斯约束来保持大脑的功能拓扑结构。通过交替种群与智能体控制网络（APAC-Net）求解分布控制问题，实现了对癫痫发作的鲁棒性抑制。

癫痫控制平均场博弈koopman算子脑动力学图正则化储层计算

cs 03-20 00:00

MST-Direct：基于最优传输理论的多变量地质统计模拟新方法

针对传统高斯Copula和LU分解等方法难以保持地质变量间复杂非线性依赖关系（如双峰分布、阶跃函数、异方差性）的问题，本研究提出了一种基于最优传输理论的新算法MST-Direct。该方法利用Sinkhorn算法，将多变量作为一个整体进行匹配，直接拟合联合分布，同时保持空间相关结构，从而更准确地再现复杂的地质统计模式。

最优传输地质统计模拟非线性依赖sinkhorn算法多变量分析

24 小时跨学科精选

计算机科学

2026-03-20 速览 · 计算机科学

大语言模型具备心智理论吗？基于“奇怪故事”范式的比较评估

TherapyGym：评估与提升心理治疗聊天机器人的临床保真度与安全性

基于首词置信度的提示优化框架：提升大语言模型分类与理解能力

基于大语言模型的政治人物传记自动化提取框架

确定性证据选择框架：提升检索增强问答系统的证据质量

DynaRAG：融合静态与动态知识的检索增强生成框架

CONSTRUCT：实时评估大语言模型结构化输出可信度的新方法

有害内容检测系统：超越准确率的可解释性分析

MineDraft：通过批处理并行推测解码加速大语言模型推理

RoPE-ID：从几何视角解决长文本注意力机制失效问题

基于模式感知的智能体系统实现高效低成本NL2SQL转换

BenchBrowser：量化语言模型基准测试与用户意图的差距

CaseLinker：用于儿童网络犯罪案件跨案分析的开源系统

企业AI技术创新如何引发消费者投诉？基于保护动机理论的多方法研究

神经AI临床可解释性：从伦理、技术与临床视角构建实用框架

通过逐层监督实现Transformer模块化验证与控制

Quine：将LLM智能体实现为原生POSIX进程

InfoMamba：一种无需注意力的混合Mamba-Transformer模型

工业数据流中故障与领域漂移的区分方法研究

RAG系统面临新型语料库投毒攻击，混合检索可有效防御

信息检索中的负采样技术综述：从随机采样到LLM生成

大语言模型存在能力-表达分离现象：训练内容可提取但不会自然生成

控制癫痫发作：基于图正则化平均场博弈的全脑动力学调控新框架

MST-Direct：基于最优传输理论的多变量地质统计模拟新方法