今日速览 · Fortune Health

cs 04-03 00:00

DOne：解耦结构与渲染，实现高保真设计稿转代码生成

针对现有视觉语言模型在设计稿转代码任务中难以兼顾整体结构与视觉细节的问题，本文提出了DOne框架。该框架通过解耦结构理解与元素渲染，引入布局分割模块、混合元素检索器及模式引导生成范式，有效解决了布局失真与细节丢失的瓶颈。在提出的高复杂度基准HiFi2Code上，DOne在视觉相似度（如GPT Score提升超10%）与元素对齐方面均优于现有方法，人工评估证实其能带来3倍的生产力提升与更高的视觉保真度。

设计稿转代码视觉语言模型布局分割元素检索代码生成人机交互

cs 04-03 00:00

逻辑门控时分前馈网络：精确模拟交替有限自动机并实现可学习

本文提出了一种逻辑门控时分前馈网络（LG-TS-FFN）的构造性框架，用于精确模拟交替有限自动机（AFA）。该架构通过引入可学习的、状态相关的偏置作为可微分逻辑门，在共享参数的线性递归中同时实现了存在（$\textsc{OR}$）和全称（$\textsc{AND}$）聚合。理论证明该网络在结构上与AFA同构，继承了其指数级简洁性：仅需$n$个神经元即可表示需要$2^n$个状态的NFA所表达的正则语言。实验表明，通过对逻辑门进行连续松弛，网络能够通过标准梯度下降从二元标签中同时恢复自动机的拓扑结构和逻辑语义，实现了对真实自动机的完美恢复。

交替有限自动机神经网络模拟逻辑门控可微分计算形式语言

cs 04-03 00:00

CLPIPS：为AI生图引入个性化相似度度量标准

本文提出CLPIPS，一种基于LPIPS改进的个性化图像相似度度量方法。针对现有客观度量标准（如LPIPS、CLIP）与人类主观判断在特定任务中不一致的问题，研究通过轻量级的人类反馈微调（仅调整LPIPS的层组合权重），使度量标准能更好地适应个体用户的感知。在人类参与迭代生成图像的实验中，使用边际排序损失进行微调，并通过斯皮尔曼等级相关性和组内相关系数评估。结果表明，CLPIPS与人类判断的相关性和一致性显著优于基线LPIPS，证明了有限的人类特定微调能有效提升人机协作文本生成图像工作流中的感知对齐。

图像相似度度量人机协作生成式ai感知对齐微调优化

cs 04-03 00:00

DarwinNet：面向智能体驱动协议合成的进化网络架构

本文提出DarwinNet，一种受生物启发的自进化网络架构，旨在解决传统网络因依赖静态、人为定义规则而导致的协议僵化和结构脆弱性问题。该架构采用三层框架（L0物理锚点、L1流体皮层、L2达尔文皮层），通过双循环“意图到字节码”机制，将高层业务意图合成为可执行代码。引入协议固化指数量化系统从高延迟智能推理向近原生执行的进化成熟度。基于Crow-AMSAA模型的可靠性增长框架验证表明，DarwinNet能将环境异常视为自主进化的催化剂，实现抗脆弱性，为零信任沙盒环境下的内生安全和智能自优化网络提供了可行路径。

自进化网络协议合成抗脆弱性智能体驱动零信任安全webassembly

cs 04-03 00:00

可信AI驱动动态混合RIS：认知MISO网络中的联合优化与抗奖励投毒控制

本文针对下一代无线网络中频谱稀缺、能量受限和直接链路不可靠的问题，提出了一种用于认知无线电网络的自适应、能量感知混合可重构智能表面。该RIS可根据收集的能量实时动态切换无源和有源工作模式。研究在考虑实际硬件损伤和级联衰落信道的情况下，通过软演员-评论家深度强化学习方法，联合优化发射波束成形和RIS相位。首次系统研究了RIS增强认知网络中针对DRL代理的奖励投毒攻击，并提出了一种基于奖励裁剪和统计异常过滤的轻量级实时防御方案。数值结果表明，所提方法在吞吐量和能耗之间取得了更优的权衡，且防御机制能在对抗条件下有效维持次级用户性能。

认知无线电网络可重构智能表面深度强化学习联合优化奖励投毒攻击安全防御

cs 04-03 00:00

机器学习赋能开放无线接入网：架构、挑战与机遇综述

本文系统综述了机器学习在开放无线接入网（O-RAN）中的集成与应用。O-RAN作为一种促进互操作性和成本效益的先进框架，其发展面临频谱管理、资源分配和安全等挑战。研究表明，机器学习技术为解决这些挑战、提升网络性能与效率带来了变革性潜力。文章通过梳理现有文献，旨在描述ML在O-RAN中的应用现状，并指出未来研究方向，以协助研究人员和利益相关者制定优化服务策略，推动智能无线网络的发展。

开放无线接入网机器学习网络架构资源分配智能网络无线通信

cs 04-03 00:00

战略竞合的计算基础：形式化序列互动与互惠机制

本技术报告为多利益相关者系统中的战略竞合行为建立了计算基础，重点研究无约束合同下合作如何随时间持续。核心贡献包括：提出有界互惠响应函数、基于k期记忆窗口的历史追踪、源自相互依赖矩阵的结构互惠敏感性，以及信任门控的互惠机制。该框架适用于人类互动与多智能体系统。在15,625种参数配置下的验证显示，合作涌现、背叛惩罚、宽恕动态等六项行为目标均超过阈值。在苹果App Store生态系统（2008-2024）的实证验证中，复现了五个阶段的合作模式，适用点达成率84.3%（p < 0.001, Cohen's d = 1.57）。

战略竞合序列博弈互惠机制计算模型多智能体系统实证验证

cs 04-03 00:00

基于学习的异构大规模全局优化协同进化框架

本文针对现实应用中出现的异构大规模全局优化问题，提出了基于学习的异构协同进化框架。该框架将优化过程建模为马尔可夫决策过程，通过元智能体为每个具有不同维度和景观的子问题自适应选择最合适的优化器。在具有复杂耦合关系的3000维问题上进行的广泛实验表明，该框架在求解质量和计算效率上均优于现有先进基线方法，并展现出对不同问题实例、优化范围和优化器的鲁棒泛化能力。

大规模优化协同进化异构问题元学习自适应优化

cs 04-03 00:00

多阶段预训练提升扩散TTS韵律建模：掩码语言建模与跨模态对比学习的结合

本研究探索了用于扩散式文本转语音（TTS）韵律建模的多阶段预训练方法。核心是训练一个说话人条件化的双流编码器，采用两阶段课程：首先进行掩码语言建模（MLM），随后使用混合音素批次进行SigLIP风格的跨模态（文本-音频）对比学习。评估表明，该两阶段方案在Grad-TTS和潜在扩散TTS系统中，于清晰度、说话人相似度和感知质量上取得了最佳综合合成效果。研究还发现，额外的同音素精炼阶段虽能提升韵律检索指标，但会损害音素判别能力并导致合成质量下降，揭示了嵌入空间指标提升与生成性能改善之间的非必然关联。

文本转语音韵律建模扩散模型对比学习多模态预训练语音合成

cs 04-03 00:00

伪装场景图像文本检索新突破：专家协作网络提升跨模态对齐能力

本文针对伪装场景理解中的跨模态对齐难题，提出了“伪装感知图像文本检索”新任务，并构建了包含约10.5K样本的专用数据集CamoIT。为解决现有检索技术因物体伪装属性和复杂图像内容导致的性能瓶颈，研究团队设计了一种伪装专家协作网络。该网络采用双分支视觉编码器，分别捕获整体图像表征和伪装物体表征，并引入一种新颖的置信度条件图注意力机制来挖掘分支间的互补性。实验表明，该方法在CA-ITR任务上实现了约29%的整体准确率提升，显著优于七种代表性检索模型。

伪装场景理解图像文本检索跨模态对齐专家协作网络图注意力机制

cs 04-03 00:00

物理信息学习框架PICWGAN：模拟恶劣天气下的真实激光雷达数据

本文提出了一种物理信息学习框架PICWGAN，用于生成恶劣天气条件下的真实激光雷达数据。该方法将信号衰减的物理驱动约束和几何一致的退化模型集成到学习流程中，有效缩小了仿真与现实的差距。在真实数据集（CADC雪天、Boreas雨天、VoxelScape）上的评估表明，该方法能精确模拟真实世界的强度模式。定量指标（MSE、SSIM、KL散度、Wasserstein距离）证明了其强度分布的统计一致性。使用该框架增强数据训练的3D目标检测模型性能优于基线，并达到了与使用真实数据训练模型相当的水平。

激光雷达仿真恶劣天气感知物理信息学习自动驾驶3d目标检测数据增强

cs 04-03 00:00

DySCo：动态语义压缩框架提升长时序预测效果

针对长时序预测中长回溯窗口易引入噪声与冗余的问题，本文提出动态语义压缩框架DySCo。其核心在于熵引导动态采样机制，能自主识别并保留高熵（信息丰富）片段，压缩冗余趋势。结合分层频率增强分解策略分离高低频模式，并通过跨尺度交互混合器动态融合全局上下文与局部表征。实验表明，DySCo可作为即插即用模块，显著提升主流模型捕获长期依赖的能力，同时降低计算成本。

时间序列预测动态压缩熵引导采样频率分解长期依赖计算效率

cs 04-03 00:00

AI与知识图谱驱动的智能图书馆目录系统

本文提出了一种智能OPAC框架，利用人工智能和知识图谱技术，将传统图书馆在线目录转变为智能发现系统。该系统集成了多个开放学术数据源，应用语义嵌入技术提升检索相关性和上下文理解。它支持语义搜索、主题过滤和基于知识图谱的可视化，以增强用户交互与探索。定量评估表明，该方法在检索效率、相关性和减轻信息过载方面均有显著提升，为现代化数字图书馆服务和下一代研究工作流程提供了实用方案。

知识图谱语义搜索数字图书馆人工智能信息检索智能发现

cs 04-03 00:00

并行近似计数新突破：非自适应采样算法实现近优复杂度

本文在近似计数与采样等价性的基础上，针对传统模拟退火算法固有的顺序/自适应依赖问题，提出了一种简单的非自适应采样算法，其样本复杂度为 $O(q \log^2 h / \varepsilon^2)$，并进一步设计出仅需两轮自适应即可达到 $O(q \log h / \varepsilon^2)$ 样本复杂度的算法，匹配了已知最优顺序算法的性能。该成果自然地导出了工作高效的并行（RNC）计数算法，并在反铁磁二自旋、单体-二聚体和铁磁伊辛模型等经典模型中展示了应用潜力。

近似计数采样算法并行计算非自适应模拟退火rnc算法

cs 04-03 00:00

情感分析中被忽视的重复拉长表达形式及其理解方法

本文关注在线交流中一种独特且强调性的表达风格——重复拉长形式（RLF），例如“soooo good”。研究通过构建首个多领域RLF数据集Lengthening（85万样本），并提出了可解释指令微调框架ExpInstruct，以提升大语言模型对RLF的理解性能和可解释性。实验表明，RLF是文档级情感的重要特征，微调后的预训练模型在性能上可超越零样本GPT-4，而ExpInstruct框架能用有限样本使开源模型在RLF任务上达到与GPT-4相当的性能和解释能力。

情感分析重复拉长形式指令微调可解释性大语言模型非正式语言

cs 04-03 00:00

非刚性三维形状对应：从基础到开放挑战与机遇

本文是一篇关于非刚性三维形状对应问题的前沿综述报告。该问题是计算机图形学中的长期挑战，对纹理传输、统计建模等应用至关重要。报告将现有方法系统性地归纳为三大范式：基于功能映射的谱方法、施加离散约束的组合公式化方法，以及直接恢复全局对齐的形变驱动方法。文章分析了每种范式的优缺点，并重点介绍了各领域的最新进展，包括利用视觉基础模型实现零样本对应、处理部分形状匹配等新兴挑战。最后，报告为研究人员和学生指出了潜在的研究方向与机遇。

三维形状对应非刚性配准功能映射计算机图形学计算机视觉零样本学习

cs 04-03 00:00

Sven：一种基于奇异值分解的高效自然梯度优化算法

本文提出Sven（奇异值下降）算法，一种用于神经网络的新型优化方法。它创新性地将损失函数分解为各数据点残差之和，而非先聚合为单一标量。通过计算损失函数雅可比矩阵的Moore-Penrose伪逆（实践中使用截断奇异值分解近似，仅保留前k个主方向），Sven能同时最小化所有数据点的残差。其计算开销仅比随机梯度下降高k倍，远低于传统自然梯度方法（与参数数量平方成正比）。理论分析表明，Sven可视为过参数化场景下的广义自然梯度方法。在回归任务中，Sven在收敛速度和最终损失上均显著优于Adam等一阶方法，且能以远低于LBFGS的时间成本达到相近性能。

优化算法自然梯度奇异值分解神经网络训练过参数化

cs 04-03 00:00

无需训练的证据聚焦：提升多模态大语言模型推理能力

本文提出了一种名为“Look Twice”的训练免费推理框架，旨在解决多模态大语言模型在回答知识密集型问题时难以有效整合视觉与文本证据的挑战。该方法通过分析模型注意力模式，自动识别图像中关键区域与检索文本中的相关片段，并利用轻量级提示标记引导模型在生成答案时重新聚焦于这些证据。实验表明，该方法在多个知识型视觉问答基准上均能提升零样本模型的性能，且在纯视觉任务和缓解幻觉方面也表现出色，无需额外训练或修改模型架构。

多模态大语言模型视觉问答推理优化注意力机制训练免费方法证据聚焦

cs 04-03 00:00

结构化LLM路由的运行时负担分配：一种跨后端全因子评估方法

本文提出，结构化大语言模型路由本质上是一个系统级的负担分配问题，而非单纯的提示工程。研究通过涵盖OpenAI、Gemini和Llama三种后端的全因子基准测试（48种配置，15,552次请求）发现，不存在通用的最佳路由模式。性能主要由后端特定的交互效应主导：在Gemini和OpenAI上可靠的路由模式，在Llama上可能出现显著的正确性下降；而压缩实现带来的效率提升也高度依赖于后端。这项工作贡献了一个可部署的框架，用于在异构后端条件下对结构化路由进行推理，并为生产级智能专家系统在正确性、成本和延迟的权衡前沿提供了实用的部署指导。

大语言模型路由负担分配跨后端评估智能体系统系统性能

cs 04-03 00:00

Bench2Drive-VL：首个面向视觉语言模型的自动驾驶闭环评测基准

本文提出了Bench2Drive-VL，这是首个将闭环评估引入基于视觉语言模型（VLM）的自动驾驶领域的基准。针对现有VLM4AD基准仅能在静态问答数据集上进行开环评估的局限，该工作通过DriveCommenter自动生成覆盖所有驾驶场景（包括严重偏离路线等罕见情况）的多样化、基于行为的问答对。它提供了一个统一的协议和接口，允许现代VLM直接接入Bench2Drive闭环环境，并与传统智能体进行比较。此外，它还包含一个灵活的推理与控制框架，支持多格式视觉输入和可配置的基于图的思维链执行。所有代码和标注数据集均已开源。

自动驾驶视觉语言模型闭环评估评测基准仿真环境

cs 04-03 00:00

基于Justness准则的互斥算法形式化验证研究

本研究通过模型检查方法，对一系列基于共享读/写寄存器的互斥算法进行了形式化验证。研究重点考察了寄存器为原子或非原子操作时算法的正确性。为确保活性属性的验证不受伪反例干扰，研究引入了“Justness”作为完备性准则，该准则依赖于对并发关系的建模。研究考虑了多种并发关系，以模拟共享寄存器工作的不同假设，并通过具体执行示例揭示了若干算法违反正确性属性的情况，在某些案例中提出了改进建议。

形式化验证互斥算法模型检查共享寄存器并发关系justness准则

cs 04-03 00:00

Foresight Learning：用大语言模型预测供应链中断，性能超越GPT-5

本研究提出了一种名为“Foresight Learning”的端到端框架，通过使用已发生的供应链中断结果作为监督信号，训练大语言模型（LLMs）生成经过校准的概率预测。该模型在准确性、校准度和精确度上均显著优于包括GPT-5在内的多个强基线模型。研究表明，训练过程能诱导模型进行更结构化、更可靠的概率推理，而无需依赖显式的提示工程。这为训练能产生“决策就绪”信号的领域专用预测模型提供了一条通用路径。为支持透明度，研究团队开源了本研究中使用的评估数据集。

供应链预测大语言模型概率预测决策智能风险管理

24 小时跨学科精选

计算机科学

2026-04-03 速览 · 计算机科学

DOne：解耦结构与渲染，实现高保真设计稿转代码生成

逻辑门控时分前馈网络：精确模拟交替有限自动机并实现可学习

CLPIPS：为AI生图引入个性化相似度度量标准

DarwinNet：面向智能体驱动协议合成的进化网络架构

可信AI驱动动态混合RIS：认知MISO网络中的联合优化与抗奖励投毒控制

机器学习赋能开放无线接入网：架构、挑战与机遇综述

战略竞合的计算基础：形式化序列互动与互惠机制

基于学习的异构大规模全局优化协同进化框架

多阶段预训练提升扩散TTS韵律建模：掩码语言建模与跨模态对比学习的结合

伪装场景图像文本检索新突破：专家协作网络提升跨模态对齐能力

物理信息学习框架PICWGAN：模拟恶劣天气下的真实激光雷达数据

DySCo：动态语义压缩框架提升长时序预测效果

AI与知识图谱驱动的智能图书馆目录系统

并行近似计数新突破：非自适应采样算法实现近优复杂度

情感分析中被忽视的重复拉长表达形式及其理解方法

非刚性三维形状对应：从基础到开放挑战与机遇

Sven：一种基于奇异值分解的高效自然梯度优化算法

无需训练的证据聚焦：提升多模态大语言模型推理能力

结构化LLM路由的运行时负担分配：一种跨后端全因子评估方法

Bench2Drive-VL：首个面向视觉语言模型的自动驾驶闭环评测基准

基于Justness准则的互斥算法形式化验证研究

Foresight Learning：用大语言模型预测供应链中断，性能超越GPT-5