cs
04-22 00:00
本研究对巴西YouTube平台上的疫苗辩论进行了最大规模的纵向分析,采用结合自标记与自训练的半监督立场检测框架,分类了近140万条评论。通过整合立场、时间模式、参与度指标及频道分类,揭示了支持与反对疫苗的叙事在混合媒体生态系统中的演变与传播。研究发现,极化在流行病危机期间(尤其是COVID-19)达到顶峰,但在后疫情时期变得碎片化;科学传播和数字原生频道成为支持和反对意见的主要阵地,揭示了当代健康传播的结构性脆弱。
疫苗辩论立场检测半监督学习媒体生态政治极化健康传播
cs
04-22 00:00
本文针对大型语言模型在形式化定理证明中面临的计算成本过高问题,提出了一种“学习-精炼”框架。该方法的核心洞见在于:编译器能将大量多样的证明尝试映射到一小部分结构化的失败模式中。通过利用这种“压缩”特性,系统在树搜索过程中,能够根据验证器的明确反馈进行局部错误修正,从而避免了累积冗长证明历史所带来的开销。实验表明,该方法能持续增强基础证明器的推理能力,并在PutnamBench基准测试中,在可比测试预算下,使约80亿和320亿参数模型达到了公开报告中的最优性能。
形式化验证定理证明编译器辅助大语言模型推理效率
cs
04-22 00:00
本研究提出了 CentaurTA Studio,一个基于 Web 的自改进人机协作系统,旨在解决主题分析难以规模化的问题。系统核心整合了三个阶段:1) 分离模拟器草拟与专家验证的两阶段人工反馈流程;2) 将已验证反馈提炼为可复用对齐原则的持续提示优化;3) 基于量规的评估与早期停止机制以控制流程。在三个领域的实验中,该系统在开放编码和主题构建任务上均达到最佳性能,最高准确率达 92.12%,且与人工标注者的一致性达到显著可靠水平(平均 Cohen's κ = 0.68)。消融实验表明,移除反馈循环会使性能从 90% 降至 81%,而移除批评模块或早期停止则会降低准确性或增加交互成本。完整系统在 10 轮迭代内(约 25 分钟)达到峰值性能,相比纯专家精炼效率更高。
主题分析人机协作自改进系统大语言模型反馈优化评估量规
cs
04-22 00:00
本研究通过结合访谈调查与逻辑推理任务,探究了人工智能使用行为与批判性思维表现之间的关系。研究发现,AI对批判性思维的影响并非单一正面或负面,而是取决于使用方式。参与者普遍将AI视为提升效率和学习支持的工具,但许多人报告了持续努力耐心的下降。分析表明,耐心下降和依赖倾向与较低的推理表现关联更紧密,而非背景特征。探索性聚类分析进一步揭示了AI用户并非同质群体,可分为过度依赖型、混合策略型和平衡支持寻求型等行为模式。研究主张,有效的人机协作应支持反思、验证和持续的认知努力,而非替代它们。
人工智能批判性思维认知卸载人机协作行为分析机器学习
cs
04-22 00:00
本研究提出了SPRITE,一个将游戏UI静态截图自动转换为可编辑引擎资产的创新流程。它通过结合视觉语言模型(VLMs)和结构化的YAML中间表示,解决了现有“截图转代码”工具难以处理游戏界面不规则几何形状和深层视觉层级的问题。SPRITE能够显式地捕获复杂的容器关系和非矩形布局。在专业开发者参与的评估中,SPRITE在重建保真度和原型制作效率方面表现出色,通过自动化繁琐的编码和解析复杂嵌套,有效模糊了游戏开发中艺术设计与技术实现之间的界限。
游戏ui自动化生成视觉语言模型人机交互软件工程
cs
04-22 00:00
本文提出一种二维早退策略,通过协调层间与句间早退机制,在分类任务中实现计算量的乘法级节省。该方法逐句处理输入并渐进激活深层网络,在Llama、Gemma等3B-8B参数模型上的实验表明,相比最优层间早退方案,简单任务可获得1.4-2.3倍加速,复杂多分类任务性能下降平缓。该策略与模型无关,仅需轻量级分类适配器,且与量化、剪枝等效率优化方法正交。研究表明,当语义信息沿输入结构可预测累积时,二维早退策略优势显著,有望扩展至情感分类外的序列处理任务。
大语言模型推理优化早退机制计算效率序列处理轻量适配
cs
04-22 00:00
本文提出TurboEvolve,一种多岛进化框架,旨在解决LLM驱动程序进化成本高、结果方差大的问题。其核心创新在于:1)引入“言语化采样”,提示LLM一次性生成K个多样候选程序并附带自评估权重;2)设计在线调度器,根据进化停滞情况动态调整K值以平衡探索与开销;3)提出“种子池注入”策略,通过对现有解进行聚类、扰动和精英保留,跨岛分配以兼顾多样性与优化。在多个程序优化基准测试中,该方法在固定评估预算下实现了更强的性能,并在多项任务中刷新了已知最优解。
程序进化大语言模型进化算法多岛框架采样效率优化
cs
04-22 00:00
本文提出了首个基于脉冲神经网络(SNN)的多模态大语言模型(MLLM)框架SpikeMLLM,旨在解决现有MLLM推理时计算开销和能耗过高的问题。该框架通过引入模态特定时序尺度(MSTS)和时序压缩LIF(TC-LIF)神经元,将脉冲时间步从$T=L-1$压缩至$T=\log_2(L)-1$,在保持性能接近无损的同时,显著降低了计算需求。实验表明,在InternVL2-8B和Qwen2VL-72B等模型上,其性能与FP16基线差距平均仅为0.72%和1.19%。配套的专用硬件加速器实现了相比FP16 GPU基线9.06倍的吞吐量和25.8倍的能效提升,展示了算法-硬件协同设计的巨大潜力。
脉冲神经网络多模态大模型能效优化时序压缩算法硬件协同设计神经形态计算
cs
04-22 00:00
本研究首次将脉冲神经网络(SNN)应用于核工业控制系统(ICS)的异常检测,解决了传统神经网络在顺序部署新子系统时出现的灾难性遗忘问题。通过引入基于脉冲编码的异步传感器融合技术,将异构传感器数据转换为稀疏脉冲序列(输入稀疏度达92.7%),并评估了五种持续学习策略。在HAI 21.03核ICS安全数据集上的实验表明,混合EWC+Replay方法在三个顺序部署子系统(锅炉、涡轮机、水处理)上取得了平均F1分数0.979,平均遗忘率接近零,且运算量比等效人工神经网络减少12.6倍,检测所有攻击的平均延迟仅为0.6秒。
脉冲神经网络持续学习异常检测核电站监控传感器融合灾难性遗忘
cs
04-22 00:00
本文提出 Agent-GWO,一个用于提升大语言模型复杂推理能力的动态提示优化框架。该方法将提示模板和解码超参数统一为可继承的智能体配置,并利用灰狼优化器的领导者-追随者机制,自动选择三个领导者智能体来协同引导群体更新。通过迭代收敛,框架能自动寻找到鲁棒的最优推理配置。在多个数学与混合推理基准测试上的实验表明,该方法在准确性和稳定性上均优于现有提示优化方法。
提示优化大语言模型灰狼优化器多智能体复杂推理
cs
04-22 00:00
本文提出HadAgent系统,旨在解决PoW区块链共识资源浪费与LLM智能体计算需求激增的矛盾。其核心创新在于用Proof-of-Inference共识机制取代传统挖矿,节点通过执行确定性的LLM推理任务来竞争出块权。系统采用三层区块结构(DATA、MODEL、PROOF)与独立默克尔根,实现细粒度防篡改。双层节点架构结合信任管理机制,可信节点可乐观执行实时服务,非可信节点需经完整共识验证。实验表明,原型系统对篡改记录检测率达100%,验证延迟低于毫秒级,并能有效隔离恶意节点。
区块链共识去中心化ai推理证明智能体服务信任管理系统架构
cs
04-22 00:00
本文提出ARGUS框架,通过数据流不变量解决LLM编码代理生成的GPU内核性能不足的问题。该框架引入基于分片的Pythonic DSL,利用标签函数和断言在编译时强制执行数据编排约束,并通过抽象解释和SMT求解进行验证。结合上下文强化学习规划器,ARGUS在AMD MI300X GPU上生成的GEMM、Flash Attention和MoE内核,性能达到手工优化汇编的99-104%,比现有代理系统快2-1543倍。
gpu优化编译器技术智能体系统高性能计算数据流分析
cs
04-22 00:00
本文提出了一种基于单目RGB摄像头的实时视觉方法,用于估计人类对自主移动机器人(AMR)的注意力状态。该方法整合了先进的3D人体姿态估计与头部朝向分析,以确定人员相对于AMR的位置及其视野范围,从而判断其是否注意到机器人。整个流程在NVIDIA Isaac Sim物理仿真环境中使用合成数据进行了验证。实验结果表明,该系统能可靠地实时检测人员位置与注意力,使AMR能够根据人类注意力状态安全地调整其运动策略,这对于提升工业自动化环境中的安全性与运行效率至关重要。
自主移动机器人人机交互安全视觉感知注意力估计工业自动化实时系统
cs
04-22 00:00
本研究提出了StomaD2,一个非侵入式的图像修复与检测一体化框架,旨在解决复杂成像条件下气孔表型分析的高通量、高精度难题。该系统核心是一个基于扩散模型的图像修复模块和一个针对气孔小、密、杂乱特性设计的旋转目标检测网络。网络通过列式结构、上下文感知重采样与重加权机制以及特征重组模块,显著提升了特征表示能力。在公开玉米和小麦数据集上,其准确率分别达到0.994和0.992,综合性能超越包括Oriented Former和YOLOv12在内的十种先进模型。该系统已集成至用户友好的现场操作平台,可快速提取密度、导度等八种气孔表型,并在超过130种植物上验证了其强大的泛化能力,为大规模植物表型分析、生理研究和精准农业提供了有力工具。
植物表型分析目标检测扩散模型图像修复精准农业计算机视觉
cs
04-22 00:00
本研究通过分析全球通用Top 525网站及各国本地Top 525网站的第三方追踪器连接,评估了十个国家(包括欧盟、美国、澳大利亚等)的网络追踪水平。研究发现,采用“选择退出”(opt-out)模式的澳大利亚和美国加州追踪程度最高,而采用“选择加入”(opt-in)模式的欧盟国家追踪水平普遍较低。从欧盟国家访问全球通用网站时,平均追踪器连接数比非欧盟国家少50.5%。此外,在德国样本中,不与Cookie横幅互动可使追踪器减少48.5%。结果表明,欧盟《通用数据保护条例》(GDPR)和《电子隐私指令》对减少网络追踪具有切实效果,但面对全球(尤其是美国)广告技术实践,其作用更偏向于“布鲁塞尔之盾”而非“布鲁塞尔效应”。
网络追踪隐私法规gdprcookie横幅跨国比较数据保护
cs
04-22 00:00
研究团队提出了RECURSUM,一个基于Python的领域特定语言,用于为递推关系自动生成优化的C++代码。它通过三个后端实现:模板元编程、具有架构优化的新型LayeredCodegen后端以及运行时循环评估。该工具使用类einsum符号在10-30行Python代码中指定递推关系、有效性约束和基本情况,可生成超过650行的生产级C++代码。在McMurchie-Davidson Hermite系数计算中,LayeredCodegen后端相比专家手写实现实现了9.8倍加速,相比模板元编程实现了1.9倍加速。架构分析揭示了三个可量化的优化效果:零拷贝输出参数、保证函数内联以及精确大小的栈缓冲区。研究在24种递推类型上进行了验证,涵盖纯数学、数值分析和量子化学领域。生产基准测试表明,生成的代码性能与专家基线相差在3.3%以内,证明了系统化代码生成可作为递推算法性能的上限。
代码生成递推关系高性能计算领域特定语言编译器优化
cs
04-22 00:00
本文介绍了HELIX系统,这是一个专注于高性能与高可靠性数值计算交叉领域的端到端验证代码生成系统。其核心方法是通过一系列针对中间语言的代数变换,将向量和矩阵计算转换为针对目标硬件并行或向量化处理优化的数据流。系统使用稀疏向量抽象表示部分计算,并利用代数推理证明并行分解特性。HELIX的验证基础设施在Coq证明助手中实现,融合了已验证的项重写、翻译验证、元编程和分层单子解释器等多种验证方法,能够为生成的代码提供形式化正确性保证,并支持针对特定应用的已验证数值分析。
验证编译代码生成形式化验证高性能计算代数变换llvm ir
cs
04-22 00:00
本研究探讨了分布式离线动态规划的通信复杂度。通过比较基于Bellman依赖关系的直接边界值传播和基于混合局部估计的Gossip平均两种范式,发现局部性是决定通信轮数复杂度的根本因素。研究证明,在直径至少为 $L_\varepsilon = \left\lfloor \log(1/2\varepsilon) / \log(1/\gamma) \right\rfloor$ 的图上,任何方法都无法在少于 $L_\varepsilon$ 轮内达到 $\varepsilon$ 精度,而直接传播方法能以 $O(\gamma^T/(1-\gamma) + \delta/(1-\gamma))$ 的误差在 $T$ 轮内匹配此标度。相比之下,Gossip风格的值迭代在收敛速度和渐近误差上会产生额外的 $1/\mathrm{gap}(W)$ 依赖。结果表明,谱依赖是Gossip类算法的产物,而局部性才是分布式离线动态规划的内在瓶颈。
分布式计算动态规划通信复杂度局部性离线强化学习边界值传播
cs
04-22 00:00
本研究提出了一种新颖的多目标优化工具,用于优化城市蓝绿基础设施(BGI)的布局,以提升城市洪水韧性。该工具将先进的水动力模型与定制的进化算法相结合,能够精确评估BGI对财产尺度洪水脆弱性和灾害的影响,克服了传统简化模型仅能预测淹没范围的局限。定制算法旨在最小化所需模拟次数,确保计算可行性。相比传统设计方法,该工具能自动探索广泛解空间,为决策者提供一组最优解决方案,支持明智的投资决策。
城市洪水韧性蓝绿基础设施多目标优化水动力模型进化算法灾害管理
cs
04-22 00:00
本文提出FlowSG,将场景图生成重新定义为一种渐进式生成任务,而非一次性分类问题。该方法利用VQ-VAE将场景图量化为紧凑的令牌,并通过图Transformer预测条件速度场,以联合优化连续几何(边界框)和离散语义(对象与谓词标签)。训练结合了用于几何的流匹配损失和用于令牌的离散流目标,实现了少步推理,并与标准检测器兼容。在VG和PSG数据集上的实验表明,该方法在谓词召回率和图级指标上均优于现有方法,平均提升约3个百分点。
场景图生成流匹配渐进式生成视觉关系推理图transformervq-vae
cs
04-22 00:00
本文提出一套包含五种互补可视化工具的分析方法,用于音乐表演的实证研究。该方法包括速度图、样条平滑直方图、山脊线图、堆叠条形图和组合图,并应用于1930-2012年间贝多芬五首钢琴与大提琴奏鸣曲的演奏录音数据。每种工具都能揭示数据的不同特征:速度图展现结构细节,平滑直方图暴露双峰分布,山脊线图定位整体分布,堆叠条形图揭示段落速度差异,组合图集成多维度信息。文中还提出了一种基于三次样条插值的平滑方法,并提供了完整的Python和MATLAB实现代码。
音乐可视化实证分析数据可视化表演分析贝多芬研究
cs
04-22 00:00
本研究首次系统性地评估了贝多芬五首钢琴与大提琴奏鸣曲的历史节拍器标记(来自车尔尼、莫谢莱斯和科利什),并与1930年至2012年间超过一百个乐章录音进行对比。核心发现有三:1)车尔尼和莫谢莱斯的标记在整个录音库中被持续且大幅超越,差距达15-39%,慢板乐章差异最大;2)科利什1943年的标记与录音实践吻合度显著更高;3)各乐章的快板速度传统在八十年间保持稳定,源于慢、中、快三种传统并存,其中中速传统占主导。基于统计众数速度,本文提出了一套修订的速度指示范围,为弥合历史规定与演奏现实提供参考。
音乐表演实践贝多芬研究速度标记实证分析录音分析音乐学