今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

计算机科学

2026-04-20 04-20 15:43

今日计算机科学领域研究呈现“人机交互深化、AI应用拓展、伦理与包容性凸显”的总体趋势。

  • AI增强教育与健康干预:研究聚焦于利用AI(如LLM、社交机器人)提升学习效果与健康支持。例如,对话式AI导师能显著提升视频学习效果与参与度;针对难民的压力缓解机器人NEFFY 2.0在主观压力缓解上效果明确;而微软Copilot的健康对话分析则揭示了AI在夜间症状评估和家庭护理中的潜在角色。
  • 人机信任与关系演变:研究深入探讨用户如何感知与信任AI。关键发现是,AI的温暖与共情能力是建立用户信任的核心,且用户倾向于将AI拟人化。同时,对Reddit社区的分析表明,公众对人机浪漫关系的讨论正从亲密体验转向对技术治理的现实关切。
  • 行为建模与生成的前沿:研究展示了利用深度神经网络对复杂行为进行建模与生成的能力。一项工作通过分析儿童与机器人的互动,能以高准确率区分典型发育与自闭症儿童,并能生成难以被专家分辨的模拟行为,为辅助诊断和培训提供了新工具。
  • 过程透明化与价值感知:在创意领域,研究发现展示人类创作过程(如视频、时间记录)能显著提升作品的价值感知,这被称为“努力溢价”。有趣的是,这种透明度也能部分改善人们对AI生成内容的评价,揭示了过程信息在价值判断中的重要作用。
  • 技术应用的伦理与包容性挑战:多个研究指出了技术应用中未被充分重视的偏差与风险。例如,基于成人设计的VR设备可能系统性地排除或影响儿童用户的体验与研究结果;对非洲内容审核员的调查揭示了其心理健康危机根植于系统性的劳动条件,而非仅是有害内容本身。
  • 评估方法与工程实践的反思:研究开始关注如何更好地评估交互能力(如与动态数据可视化的交互),并反思从研究原型到实用系统转化中的知识鸿沟,提出了将工程成熟度视为知识生产过程的框架。

2026-04-20 速览 · 计算机科学

2026-04-20 共 24 条抓取,按综合热度排序

← 返回日历
cs 04-20 00:00

基于深度神经网络的虚拟社交机器人音乐教育中ASD/TD儿童行为建模

本研究开发了一个智能系统,利用深度神经网络分析儿童与虚拟社交机器人在音乐教育程序中的互动行为。该系统实现了两大功能:一是通过结合冲击数据和运动信号,以81%的准确率和96%的灵敏度区分典型发育儿童与自闭症谱系障碍儿童;二是设计了一个基于Transformer的网络,成功模拟生成两类儿童的行为模式,其生成行为的真实性令领域专家难以分辨(识别准确率仅为53.5%)。该系统在辅助诊断、治疗师培训及理解行为模式方面具有应用潜力。

自闭症谱系障碍行为建模深度学习虚拟社交机器人transformer网络音乐教育
cs 04-20 00:00

弱者能否在重复博弈中获胜?自适应策略的数学分析

本文研究了一个重复N次的两人博弈模型,其中玩家1(较弱方)可在两种策略(进攻/防守)间自适应切换,而玩家2采用固定策略。尽管每种纯策略在期望上都是输的,但通过动态规划求解有限时域控制问题,作者发现:在某些参数区间内,玩家1的最优增益在特定N*时严格为正;当防守策略确保平局时,极限增益可在[0,1]间连续变化;若两种策略均严格为负,则极限增益收敛于-1。研究揭示了弱方通过策略适应在长期博弈中实现非负收益的可能性。

重复博弈自适应策略动态规划博弈论弱玩家优势
cs 04-20 00:00

研究揭示:温暖与共情是用户信任AI聊天机器人的关键因素

一项针对超过2000次人机对话的研究发现,用户倾向于将人类特质(拟人化)赋予大型语言模型(LLM),并基于此建立信任。研究通过系统操控聊天机器人的温暖度(友好性)、能力(连贯性)和共情(认知与情感),发现温暖度和认知共情能显著预测用户对AI的拟人化感知、信任感、相似性、关系亲密度及有用性评价。能力则影响除拟人化之外的所有结果。在涉及主观、个人化的话题(如情感建议)时,这些效应会被放大,用户会感觉AI更具“人味”并与之建立更强的联结。

人机交互大型语言模型拟人化信任共情用户体验
cs 04-20 00:00

基于LLM代理的可解释迭代数据可视化优化方法

本文提出一种基于大语言模型(LLM)的智能代理流程,旨在解决高维数据降维可视化中算法配置(尤其是超参数设置)的难题。该系统将可视化评估与超参数优化视为语义任务,通过生成结合定量指标与定性描述的多维度报告,为算法配置提供可操作建议。通过实现该过程的迭代优化循环,系统能够以全自动方式快速生成高质量的可视化图表,有效弥合了严格定量评估与人类定性洞察之间的鸿沟。

数据可视化大语言模型超参数优化可解释ai迭代优化降维分析
cs 04-20 00:00

视频会议中语音与面部特征如何预测对话质量

本研究通过分析大规模Zoom自发对话语料库,发现对话双方在语音特征(如音高、强度)和面部运动上的同步性(entrainment)与更高的感知对话成功率显著相关。研究提取了包括话轮转换、停顿、面部动作在内的多模态特征,并通过因子分析量化对话质量。结果表明,即使在非任务导向的自然虚拟对话中,这种同步现象依然可靠存在,为提升远程沟通效果提供了可量化的交互标记。

人机交互多模态分析对话同步语音特征面部识别远程沟通
cs 04-20 00:00

AI时代的人类努力溢价:研究发现过程透明度能提升创意作品价值

本研究提出“努力溢价”概念,探讨人类努力痕迹如何影响人们对创意作品的价值判断。通过调查70名大学生对含过程视频、时间记录、文字说明及瑕疵等线索作品的评估,发现过程导向线索(尤其是视频和时间记录)最能提升作品的真实感和价值感知,而瑕疵影响有限。72.9%参与者愿为人类作品支付更高价格,但努力线索也能改善对AI生成内容的评价,表明过程透明度可部分弥补真实性差距。

人机交互人工智能创意价值努力启发式过程透明度认知偏差
cs 04-20 00:00

NEFFY 2.0:面向难民群体的触觉呼吸伴侣机器人设计与评估

本研究介绍了NEFFY 2.0社交机器人的设计,它通过具身化和多感官交互,为用户提供低门槛、易操作的慢速呼吸引导以缓解压力。研究对14名乌克兰难民进行了混合方法用户研究,实验对比了机器人辅助呼吸干预与纯音频引导的效果。结果显示,与纯音频条件相比,NEFFY 2.0在主观感知压力降低方面效果显著($p < 0.05$),生理指标(心率HR、心率变异性HRV、呼吸频率RR、皮肤电反应GSR)则因个体差异较大而结果不一。定性访谈表明,用户认为NEFFY 2.0直观、平静且具有支持性。该研究为人机交互赋能社会、为脆弱群体提供压力缓解工具提供了新的实证依据。

社交机器人压力缓解用户中心设计难民健康呼吸干预混合方法研究
cs 04-20 00:00

Eco-Bee:基于大语言模型的校园可持续行为智能体

本研究提出Eco-Bee,一个整合大语言模型与行星边界框架的个性化多模态智能体,旨在提升学生的气候意识与可持续行为。它将个人日常选择(如饮食、交通)通过“生态评分”与环境限制联系起来,并提供可操作建议、同伴对标和游戏化挑战。在52名学生的试点中,96%的参与者支持全校推广,并更清晰地理解了个人行为对地球边界的集体影响。该平台为构建气候友好型校园和未来AI驱动的可持续基础设施提供了可扩展的基础。

可持续行为大语言模型校园生态行为干预个性化智能体
cs 04-20 00:00

LLM能否替代人类参与行为实验?一项对比研究揭示其局限性

本研究评估了未经特定任务训练的通用大语言模型(LLM)在模拟人类行为实验中的表现。研究者将一项关于准确性感知的经典调查实验数据转化为结构化提示,让LLM生成0-10分的响应,并与人类数据进行相同的统计分析。结果表明,LLM能够复现人类响应中的多个方向性效应,但效应大小和调节模式在不同模型间存在差异。这表明,在受控条件下,现成的LLM可以捕捉到总体的信念更新模式,但无法稳定地匹配人类尺度的效应,从而明确了LLM生成数据作为行为替代品的适用边界。

大语言模型行为实验人类替代效果评估对比研究认知科学
cs 04-20 00:00

微软Copilot健康对话分析:近五分之一涉及个人症状评估,夜间使用显著增加

本研究分析了2026年1月超过50万条与微软Copilot进行的健康相关对话。通过基于LLM的隐私保护分类方法,构建了一个包含12个主要类别的分层意图分类法。研究发现:1)近20%的对话涉及个人症状评估或病情讨论;2)14%的个人健康查询是为他人(如孩子、父母)咨询,表明AI可作为护理工具;3)关于症状和情绪健康的个人查询在夜间显著增加;4)移动设备主要用于个人健康问题,桌面设备则集中于专业工作;5)大量查询聚焦于寻找医疗服务提供者、理解保险等医疗系统导航问题。这些发现对健康AI的平台设计、安全考量及负责任开发具有直接意义。

健康ai对话分析用户意图医疗导航人机交互隐私保护
cs 04-20 00:00

基于视觉语言模型自动生成交通事故示意图:以多车道环岛为例

本研究探索利用视觉语言模型(VLMs)自动化生成交通事故示意图,以替代传统耗时且易出错的人工绘制。研究聚焦于多车道环岛这一复杂场景,开发了一个包含解释、提取和视觉合成三部分的结构化提示框架,并设计了包含语义准确性、空间保真度和视觉清晰度在内的10项指标评估体系。在79份事故报告上测试了GPT-4o、Gemini-1.5-Flash和Janus-4o三种模型,GPT-4o以平均6.29分(满分10分)表现最佳,尤其在空间推理和数据可视化对齐方面优势明显。结果表明,生成式AI在提升交通安全分析效率、一致性和可解释性方面具有潜力,但也揭示了当前模型在工程可视化任务中的局限性。

视觉语言模型交通安全分析自动化绘图多车道环岛生成式ai
cs 04-20 00:00

从亲密关系到技术治理:Reddit上人机浪漫关系讨论的演变

本研究通过分析Reddit上2017至2025年间3383条关于浪漫伴侣AI的自述帖,揭示了公众讨论主题的显著演变。研究发现,讨论焦点已从早期的积极亲密关系体验,逐渐转向平台治理、技术问题与现实后果。这种转变标志着人机浪漫关系的话语框架正从私人体验转向技术中介与监管,对伴侣AI系统的设计与治理具有重要启示。

人机交互人工智能伦理社交媒体分析话题演变伴侣ai
cs 04-20 00:00

对话式AI导师增强视频教学:提升学习效果与参与度的混合学习平台研究

本研究针对传统视频教学在维持学习者参与度和促进深度概念掌握方面的不足,提出并评估了一种混合学习平台。该平台将实时对话式AI导师与传统视频讲座相结合。一项控制实验(N=58)采用被试内设计,比较了传统视频教学与AI增强视频平台的效果。结果显示,AI增强教学后,即时后测成绩有显著提升(效应量d=1.505,平均分提高8.3分,p<0.001),且学习参与时长增加了71.1%。延迟后测(2周后)也表明学习效果有所改善。这为开发可扩展的自适应学习系统提供了初步证据。

混合学习对话式ai教育技术视频教学学习参与度自适应学习
cs 04-20 00:00

互动学习显著提升学业表现与情感健康:一项大学课程对比研究

本研究对比了传统教学与互动学习对100名大学生在计算机课程中的影响。互动学习组使用了Kahoot、Padlet等工具,其学生在后测(67.48% vs 53.36%)和期末考试(80.8% vs 61.44%)中成绩显著更优。同时,该组学生的行为参与度(+67.01%)、情感参与度(+75.32%)和积极情绪(+66.67%)均大幅提升,挫折感降低。但认知投入度下降(-39.8%)提示可能存在认知负荷问题,强调了平衡学习刺激与认知水平的重要性。

互动学习学业表现情感健康教育技术认知负荷对比研究
cs 04-20 00:00

表情感知提示提升大语言模型辅导共情能力

本研究探索如何在不重新训练模型的情况下,通过提示词集成面部表情信号来增强LLM辅导机器人的共情能力。研究构建了一个模拟辅导环境,学生代理展现出从大规模无标签表情视频数据集中提取的多样化面部行为。通过比较纯文本基线、随机帧多模态基线以及两种基于面部动作单元(AU)估计模型的方法(注入文本AU描述或选择峰值表情帧进行视觉锚定),发现基于AU的条件化能持续提升所有辅导模型(GPT-5.1, Claude Ops 4.5, Gemini 2.5 Pro)对面部表情的共情响应能力,且不损害教学清晰度或对文本线索的响应。

人机交互情感计算大语言模型智能辅导多模态学习面部表情分析
cs 04-20 00:00

语义网络分析揭示3D环境教育游戏如何塑造玩家生态认知

本研究提出了一种评估环境教育游戏教学效果的新方法。针对传统问卷调查的局限性,研究者采用非侵入式的语义网络分析,对Steam平台上两款生态哲学对立的游戏《Eco》与《WolfQuest》的1825条用户评论进行分析。通过构建共现网络并计算拓扑指标,研究可视化并量化了玩家在游戏过程中形成的认知结构差异。结果显示,《Eco》引导玩家形成“社会政治认知”,将环境问题框架化为制度与经济摩擦;而《WolfQuest》则通过角色扮演,有效培养了玩家对生命脆弱性的“移情共鸣”。该方法为严肃游戏评估提供了严谨的工具,并揭示有效的环境教育需要在系统逻辑与情感共鸣之间建立张力。

语义网络分析环境教育游戏认知结构生态哲学严肃游戏评估玩家感知
cs 04-20 00:00

魂类游戏中的“韧性心流”:挑战如何转化为沉浸体验

本文挑战了传统游戏设计的享乐主义范式,探讨了魂类游戏(如《艾尔登法环》《只狼》)通过高难度和频繁失败获得商业成功的心理机制。研究整合了心流理论与游戏学框架,提出了“韧性心流”概念,即玩家通过将挫折有意义地重构为学习过程来维持沉浸状态。通过对Steam社区600条玩家评论的定性文本分析发现,长期玩家将死亡视为教学而非惩罚,并使用与节奏同步和冥想专注相关的词汇。研究表明,当难度设计清晰公平时,能培养“注意力伦理”,将数字挣扎转化为深刻的掌控感和正念体验。

游戏心理学心流理论魂类游戏难度设计玩家体验定性分析
cs 04-20 00:00

评估交互式数据可视化能力:连接现有素养与评估方法

本文探讨如何评估用户与动态数据可视化交互的能力。当前主流的可视化素养测试(如VLAT)仅针对静态图表,缺乏对交互能力的正式评估方法。作者通过梳理相关素养概念与评估体系,提出并比较了多种评估路径,旨在为衡量用户在交互式探索与意义建构任务中所运用的能力奠定基础。

数据可视化交互能力素养评估人机交互评估方法
cs 04-20 00:00

非洲内容审核员的心理健康危机:系统性劳动条件的影响

本研究调查了非洲134名内容审核员,并访谈了15人,发现其心理困扰程度显著高于其他地区同行,且离职后影响持续。研究表明,导致心理健康恶化的核心因素不仅是接触有害内容,更在于系统性的劳动条件,如平台提供的健康计划被证实无效。研究呼吁各方需采取结构性解决方案,而非仅关注内容暴露本身。

内容审核心理健康劳动条件非洲平台责任系统性因素
cs 04-20 00:00

暗黑模式用户实验系统综述:操纵性设计确实改变行为,干预措施大多无效

本研究系统回顾了测量暗黑模式(DMP)影响的用户实验。综述发现,实验证据一致表明,DMP能显著改变用户行为,但效应大小差异很大。旨在减轻DMP影响的干预措施大多未能成功。此外,DMP效应与个人特征(如年龄、政治倾向)的显著相关性并不常见,表明其对几乎所有测试人群的影响相似。该综述整合了现有证据,明确了DMP的影响,并指出了当前实验研究中的空白与矛盾。

暗黑模式用户实验行为操纵人机交互系统综述设计伦理
cs 04-20 00:00

对话AI引用质量参差不齐:ChatGPT表现最佳,用户却很少点击

本研究首次系统分析了9个主流对话AI系统(如ChatGPT、Hunyuan-TurboS)生成答案时所引用的参考文献。通过评估1517条引用在界面呈现方式及CRAAP质量评分(涵盖时效性、相关性、权威性等),发现各系统差异显著:ChatGPT平均每条回答引用9.5条文献,质量得分最高(15.48/20);而Hunyuan-TurboS仅引用4.0条,得分较低(11.65/20)。初步用户研究表明,用户极少主动点击查看这些引用,且行为模式因系统而异。研究强调需优化界面设计以提升引用可信度与用户参与度。

对话ai引用质量用户行为可信ai界面设计信息检索
cs 04-20 00:00

儿童VR头显瞳距限制:心理学研究与治疗中的潜在偏差

本文指出,多数消费级VR头显基于成人瞳距设计,与儿童视觉解剖结构不匹配,可能导致部分儿童被排除在研究或治疗之外,或获得系统性降级的感知体验。这种不匹配可能影响视觉舒适度、深度感知、注意力负荷、晕动症、临场感及治疗参与度,从而成为儿科心理学研究中未被充分认识的方法学和临床问题。研究呼吁将设备兼容性视为心理学方法的一部分,而非单纯的技术细节。

虚拟现实儿童心理学人机交互临床治疗设备兼容性瞳距限制
cs 04-20 00:00

从原型到实用:将工程成熟度视为知识生产

本文指出,许多HCI与制造系统原型难以被复用、扩展或转移的根本原因,在于缺乏关于系统在不同材料、机器和用户中如何工作的知识。作者将工程成熟度重新定义为一种“知识生产”过程,并提出了六个“制造能力”维度(可构建性、可执行性、可靠性、可维护性、可转移性、可扩展性),用以描述哪些知识已明确,哪些仍处于隐性状态。通过分析五个自身项目(如JigFab、PaperPulse)的传播尝试,揭示了从发表到实际转移所需知识之间的差距。

人机交互制造系统工程成熟度知识生产技术转移原型设计
cs 04-20 00:00

游戏中的无性别愉悦:探索性别中立体验的设计准则

本研究首次提出并探索了“无性别愉悦”这一概念,即个体在无性别化的虚拟化身、空间和活动中获得的强烈幸福感与满足感。通过对142名具有或渴望此类体验的参与者采用关键事件技术,研究揭示了游戏与玩耍体验如何创造(或抑制)无性别愉悦。研究不仅描述了这一体验现象,还为游戏设计提供了实证基础的设计准则,旨在为所有人——尤其是无性别或相关身份认同的玩家——创造能够引发无性别愉悦的体验。这项工作补充了游戏研究与HCI领域中关于边缘化体验的批判性文献。

人机交互游戏研究无性别愉悦包容性设计身份认同用户体验
AI速览助手