今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。

AI 导读

今日看点(自动摘要):cs: 数据共享管道的能耗建模与优化策略;cs: Memory-DD:一种用于时序预测的低复杂度树突启发神经元模型;cs: 量子嵌入混合深度强化学习提升电网动态安全控制效率

速览说明

数据源:arXiv 官方 RSS(physics / math / cs / q-bio / econ / astro-ph 等)。

标题与摘要由 DeepSeek 进行中文润色,便于快速浏览;外链跳转至原文。

AI 速览助手:点击卡片“速览全文”可拉取 arXiv HTML,生成全文要点并缓存;右下角悬浮按钮可随时展开/收起速览。

自动抓取:每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

往期回顾:点击上方“往期回顾”进入日历页,按月查看每日抓取总数,并跳转到对应日期速览。

2025-12-05 速览 · 计算机科学

2025-12-05 共 24 条抓取,按综合热度排序

← 返回日历
cs cs 12-05 00:00

数据共享管道的能耗建模与优化策略

本文提出了一种新颖的方法,用于建模和估算数据共享管道在不同执行配置下的能耗。该方法还能识别跨管道共享阶段的复用潜力,这是减少大型数据共享联盟能耗的关键。通过仿真实验验证,该方法为跨组织管道优化和制定节能执行策略奠定了基础。

energy efficiencydata-sharing pipelinesmodelingestimationreuse strategiescs.dbcs.dc
cs cs 12-05 00:00

Memory-DD:一种用于时序预测的低复杂度树突启发神经元模型

本文提出Memory-DD,一种专为时序数据预测设计的低复杂度树突启发神经元模型。该模型由两组不含非线性激活函数的神经元构成,却能实现非线性映射,有效捕捉时序依赖关系。在18个时序分类基准数据集上,其平均准确率达89.41%,超越LSTM 4.25%;在9个回归数据集上性能与LSTM相当,同时参数量减少50%,计算复杂度降低27.7%。

dendrite-inspired neurontemporal predictionlow-complexitytime-serieslstmcs.necs.ai
cs cs 12-05 00:00

量子嵌入混合深度强化学习提升电网动态安全控制效率

本文针对未来高比例逆变器并网电网的动态安全控制难题,提出了一种量子嵌入的混合深度强化学习框架。该模型利用噪声中尺度量子计算能力,在IEEE 39节点测试系统上验证了其性能,展示了在解决复杂微分代数方程和提升控制效率方面的应用潜力,同时也指出了当前存在的局限性与未来改进方向。

dynamic security controldeep reinforcement learningquantum computingpower gridinverter-based resourceseess.sycs.sy
cs cs 12-05 00:00

MultiGA:利用多源大模型种子优化遗传算法性能

本文提出MultiGA方法,首次将多源大语言模型(LLM)的集体能力引入遗传算法。该方法从开源和闭源等多种LLM中采样以初始化种群,通过中性适应度函数评估,并迭代重组优化,直至获得最优解。在文本转SQL、行程规划、GPQA科学问答及BBQ偏见基准测试中,MultiGA能收敛至最适合任务的LLM的准确率水平,为在不确定单一模型选择的任务中集成多个LLM奠定了基础。

genetic algorithmlarge language modelmulti-source seedingoptimizationnatural language processingcs.necs.ai
cs cs 12-05 00:00

LegalWebAgent:基于大语言模型的网页代理助力司法可及性

本文提出LegalWebAgent框架,利用多模态大语言模型驱动的网页代理,帮助普通公民克服获取法律服务的障碍。该框架通过“询问-浏览-执行”三阶段流程,能理解用户需求、自主导航网页、与表单日历等元素交互,并最终完成信息整合或具体操作。在模拟魁北克民法用户典型服务流程的15项真实任务测试中,其平均成功率高达84.4%,展现了在复杂现实场景中的高度自主性。

legalwebagentlarge language modelweb agentaccess to justicemultimodalcs.hccs.cycs.ai
cs cs 12-05 00:00

检索增强提示在代码漏洞检测中优于微调方法

本研究系统评估了检索增强提示在代码漏洞检测任务中的表现。实验表明,使用语义相似示例的检索增强提示方法,在20个示例下F1分数达74.05%,优于随机示例的少样本提示(F1: 36.35%)和微调后的Gemini模型(F1: 59.31%),且无需训练成本。虽然微调CodeBERT性能更高(F1: 91.22%),但检索增强提示在效率与性能间取得了更好平衡。

code vulnerability detectionretrieval-augmented promptingfew-shot learninglarge language modelsfine-tuningcs.crcs.secs.aics.cl
cs cs 12-05 00:00

重新思考教育AI评估:TEACH-AI框架与基准

本文提出TEACH-AI框架,旨在解决当前教育领域生成式AI评估过度依赖技术指标、忽视教学本质的问题。该框架基于广泛文献综述,包含十个可衡量的评估组件与实用工具包,从社会技术、教育理论和应用角度重新定义“有效”AI,强调学习者主体性、情境化学习过程与伦理考量,为AI系统的设计、开发与评估提供跨领域、以教学为基础且利益相关者协同的指导。

ai evaluationeducationgenerative aipedagogyframeworkcs.hccs.lgcs.cycs.ai
cs cs 12-05 00:00

高风险决策中负责任LLM部署:结合去中心化技术与人机交互

本文提出一个负责任部署LLM决策支持系统的框架,旨在解决高风险领域应用中的数据安全、能力评估和责任追溯难题。该框架强调部署前阶段通过人机多轮交互协作,评估不确定样本及事后可解释AI技术的稳定性,并建议结合区块链、IPFS等去中心化技术在组织内部署本地LLM,以创建不可篡改的活动记录,实现自动化审计。研究在Bert-large-uncased、Mistral及LLaMA系列模型上进行了测试,验证了其在商业贷款等金融决策场景中支持负责任决策的潜力。

llmhigh-stakes decisionresponsible aidecentralized technologyhuman-ai interactionblockchainaccountabilityfinancial decisioncs.hcq-fin.cpcs.cycs.ai
cs cs 12-05 00:00

HAI-Eval:首个衡量人机协同编程效能的基准测试

本研究提出了HAI-Eval基准测试,旨在评估人类与AI在编程任务中的协同效能。其核心创新在于设计了一系列“必须协作”的问题模板,这些问题对单独的LLM或人类都难以解决,但通过有效协作可以完成。研究通过45名参与者和5个先进LLM的对比实验发现,人机协作将任务通过率从单独LLM的0.67%和单独人类的18.89%显著提升至31.11%,并揭示了一种新兴的“共同推理”伙伴关系。

human-ai collaborationcodingbenchmarklarge language modelevaluationcs.hccs.secs.ai
cs cs 12-05 00:00

MindFuse:一个用于营销策略共创的可解释生成式AI框架

本文提出了MindFuse框架,旨在将生成式AI从单纯的内容生成工具转变为营销策略的协作伙伴。它融合了基于点击率的AI引导共创与大型语言模型,能够从真实广告数据中提取、解释并迭代传播叙事。该框架覆盖营销全生命周期,通过基于注意力的可解释性诊断广告效果,并实时优化活动。机构部署验证其效率提升高达12倍。

generative aiexplainable aimarketing strategylarge language modelscontent co-creationcs.mmcs.ai
cs cs 12-05 00:00

AI 评分新方法:利用近域数据实现人类水平准确性的自动反馈

本研究提出了一种利用近域数据(如往年相似问题数据)自动评估学生开放性简答题的新框架。该方法无需预先编写评分标准,在课堂实践中易于部署。实验表明,其性能显著优于现有机器学习模型及未经微调的大型语言模型(如 GPT 系列),在某些情况下准确率提升超过 10-20%。该工作首次形式化了基于近域数据的自动简答评分问题,为大规模教育中的及时、详细反馈提供了可行方案。

automated gradingshort-answer questionsnear-domain dataai in educationfeedback scalingcs.hccs.lgcs.cycs.ai
cs cs 12-05 00:00

芬兰K-12学生AI能力影响其风险认知:低能力者担忧创造力下降,高能力者关注系统偏见

本研究通过对163名芬兰高中生的共现网络分析发现,学生自我感知的AI能力与其风险认知密切相关。能力较低的学生更关注个人与学习相关风险,如创造力下降、批判性思维缺失和滥用;而能力较高的学生则更担忧系统性及制度性风险,如算法偏见、信息不准确和作弊问题。研究结果强调了将AI素养纳入课程、提供教师指导及制定相应政策的重要性,以促进AI在K-12教育中的公平与个性化整合。

artificial intelligencek-12 educationrisk perceptionai competenceco-occurrence analysisfinlandcs.hccs.cycs.ai
cs cs 12-05 00:00

AI医疗文书助手可能引发患者安全风险,用户反馈揭示关键问题

一项针对美国大型医院系统AI医疗文书助手用户反馈的研究发现,AI在转录过程中出现的错误,尤其是在药物和治疗信息方面,可能引发多种患者安全风险。研究采用混合方法,通过定量和定性分析揭示了这些潜在风险,但指出仍需进一步研究以评估其绝对风险程度。

ai scribepatient safetyclinical documentationtranscription errorhealthcare aics.lgcs.cy
cs cs 12-05 00:00

AI末日论再审视:2025年超级智能风险叙事缺乏实证支持

本文对2025年两篇预测超级人工智能将在十年内毁灭或淘汰人类的报告进行了批判性分析。文章指出,支撑其核心论点的“智能爆炸-超级智能-致命错位”链条,在2023-2025年的实证记录中均未观察到关键现象(如持续的递归自我改进、自主战略意识)。当前生成式模型仍是狭窄的统计产物,缺乏实现灾难性场景的属性。研究认为,存在性风险论调主要是一种意识形态干扰,掩盖了监控资本主义的巩固与算力极端集中的现实,并被2025年AI投机泡沫所放大。

artificial intelligenceexistential risksuperintelligencespeculative bubbleempirical evidencecs.cycs.ai
cs cs 12-05 00:00

面向边缘集群的可持续性感知大语言模型推理策略

本文针对大语言模型(LLM)推理过程的高能耗与高碳排放问题,提出了一种面向边缘集群的可持续性感知推理框架。该框架通过在NVIDIA Jetson Orin NX和Ada 2000设备组成的集群上,实施基于碳足迹和延迟感知的路由策略,旨在平衡推理延迟与碳排放。实验表明,批处理大小为4时能在吞吐量与能效间取得较好平衡,而更大的批次则面临GPU内存饱和风险。

llmedge computingsustainabilitycarbon footprintinferenceenergy efficiencycs.dc
cs cs 12-05 00:00

WebAssembly 在浏览器、边缘与云端的服务器无化工作流性能对比分析

本研究评估了基于 WebAssembly (Wasm) 的服务器无化工作流在浏览器、边缘节点和云服务器上的一致执行性能。通过测量冷/热启动延迟、步骤延迟、工作流总时长、吞吐量及 CPU/内存利用率,发现 AOT 编译和实例预热能显著降低启动延迟。对于小负载工作流,浏览器凭借完全内存数据交换表现出竞争力;而随着负载增大,边缘和云端节点的 AOT 执行在计算和内存密集型阶段性能优势明显。

webassemblyserverlessworkflowperformanceedge computingcloud computingcs.dc
cs cs 12-05 00:00

微服务雾边计算能效资源管理综述:现状与未来方向

本文系统综述了2020-2024年间136项关于微服务架构下雾计算与边缘计算的能效资源管理研究。研究聚焦服务放置、资源供给、任务调度与卸载、资源分配及实例选择五大子领域,基于优化技术、目标及方法优劣进行分类。文章指出当前各管理组件间缺乏协同,并展望了AI驱动优化、量子计算及无服务器计算等未来研究方向,为构建更集成、高效、可持续的边缘计算系统提供参考。

fog computingedge computingmicroservicesresource managementenergy efficiencycs.dc
cs cs 12-05 00:00

Fast ACS:基于文件的低延迟有序消息投递系统设计

本文介绍了Fast ACS的设计,这是一个用于大规模实时系统的文件式有序消息投递系统。它结合了远程过程调用(RPC)和远程内存访问(RMA)两种通信原语,以跨集群传输数据并高效投递给数千名消费者。系统保证了消息顺序和至少一次投递,同时避免消费者过载,允许其按自身节奏消费。该系统已部署于数十个生产集群,可处理峰值Tbps级的集群内消费者流量,并能在数秒甚至亚秒级(p99)内完成全球消息投递。

message deliverylow latencydistributed systemsfile-basedordering guaranteesscalabilitycs.dc
cs cs 12-05 00:00

混合元启发式算法助力零排放建筑窗户自动化设计

本研究提出了一种基于混合元启发式算法的窗户设计自动化方法,用于优化零排放建筑性能。该方法通过整合规则与可更新目录,对19个关键设计变量进行优化,旨在降低住宅建筑的供暖、制冷需求及热不适感。在西班牙三种气候区的测试表明,该算法在解决方案的质量和鲁棒性上均显著优于传统遗传算法,并揭示了在温暖气候下减少制冷需求的挑战,以及自动可调遮阳系统相较于固定方案的优越性。

zero-emissions buildingfenestration designmetaheuristic algorithmbuilding performance optimizationautomated designcs.ne
cs cs 12-05 00:00

澳大利亚网络资源应对技术助长虐待的现状与差距

本研究首次构建了技术助长虐待的统一分类法,并对澳大利亚306个机构网站的5万余页面进行了大规模审计。研究发现,机构网站内容严重失衡,约70%聚焦于骚扰和性虐待,而隐蔽监控、经济虐待等关键类型覆盖率不足1%。同时,支持途径有限,且内容可读性普遍偏高,可能阻碍高危人群获取帮助。该分类法与审计方法为评估机构沟通、改善受害者资源提供了可扩展的基础。

technology-facilitated abusetaxonomyweb auditaustraliadigital safetyinstitutional resourcescs.cy
cs cs 12-05 00:00

中学生使用ChatGPT-5:态度、焦虑与应对AI幻觉的策略研究

本研究对109名希腊高中生进行了为期8小时的课堂干预,考察他们在技术课程中使用ChatGPT-5时的态度、焦虑及对AI幻觉的反应。定量与定性分析显示,学生对AI持中等积极态度,但存在学习焦虑和对AI替代工作的担忧。研究发现,在遭遇AI幻觉后,许多学生采取了“认知保护”策略,即仅在自身已有知识并能验证答案的领域使用AI。研究强调了在中学教育中培养批判性AI素养的重要性。

chatgpt-5secondary educationai anxietyhallucinationai literacycs.cy
cs cs 12-05 00:00

面向所有人的AI素养课程:从讲座到互动课堂的全面升级

本文介绍了一门AI素养课程从一学分讲座课(CS 109)扩展为三学分本科课程(CS 309)的完整过程。新课程采用翻转课堂模式,结合每周异步学习模块(含专家讲座、协作阅读和伦理反思)与现场互动讨论,并设计了无需编程背景、聚焦现实问题的作业。课程最终以分析特定AI工具伦理与社会影响的项目收尾,获得了学生关于互动性、连贯性和可及性的积极反馈。所有课程材料均已开源。

ai literacycourse designflipped classroomethicsaccessible educationcs.cy
cs cs 12-05 00:00

英格兰与威尔士刑事司法系统中的概率性AI生态系统图谱

本研究首次系统性地绘制了英格兰与威尔士刑事司法系统中概率性AI工具的应用图谱。通过分析AI在警务及司法各阶段的使用情况,揭示了其运作模式、潜在效益及风险。初步发现显示,系统高度依赖私营供应商,且对生成式AI及大语言模型的兴趣日益增长。研究同时识别了数据偏见、概率输出误解、系统间累积效应及敏感数据保护等关键问题。

probabilistic aicriminal justicepolicinglarge language modelsbiasdata protectioncs.cy
cs cs 12-05 00:00

利用模型验证方法实现信息物理系统数字孪生的持续验证

本文提出一种通用方法,通过复用基于模型设计的验证技术,解决数字孪生仿真模型与不断演化的物理系统之间保持同步的挑战。该方法利用验证指标检测物理系统的异常变化,并通过基于历史数据的参数估计来修正数字孪生模型。研究以港口龙门起重机为案例,展示了该技术在工业相关场景中的应用。

digital twincyber-physical systemsmodel validationanomaly detectionparameter estimationcs.se
AI速览助手