学术视点

学术视点

日期:2026-06-04

|  来源:【字号:

题目:Adaptive Cross-Modal Super-Resolution Semantic Communication for Mobile AI-Generated Panoramic Video(面向移动AI生成全景视频的自适应跨模态超分辨率语义通信)

作者:H. Gao, M. Sun, X. Xu, X. Cheng, S. Han and P. Zhang

来源:Transactions on Cognitive Communications and Networking(认知通信和网络汇刊), vol. 12, pp. 427-442.

摘要:The development of artificial intelligence-generated panoramic video (AIGPV) provides a potential solution for the diverse demands of users in immersive communication scenarios of 6G. However, ensuring usersquality of experience (QoE) under resource-constrained conditions remains a significant challenge. In this paper, we introduce a cross-modal semantic communication transmission scheme for mobile-AIGPV. This scheme generates low-resolution panoramic videos on the edge server and transmits them via cross-modal semantic communication. Furthermore, to better ensure usersQoE, we propose a panoramic video super-resolution transmission framework based on deep joint source-channel coding (JSCC), named PVSR-JSCC. This framework leverages neural networks (NNs) and attention mechanisms to achieve semantic extraction and adaptive variable-length coding, and performs feature cyclic enhancement based on the motion and context, thereby achieving the panoramic video super-resolution task. Additionally, we design a cross-modal swin transformer block (CMSTB) to enhance the deep JSCC performance. The CMSTB integrates self-attention and cross-attention mechanisms, enabling deep JSCC to capture the intrinsic semantic correlation between text and video. Simulation results demonstrate that, compared to the semantic communication scheme directly transmitting high-resolution videos, our proposed PVSR-JSCC not only reduces bandwidth consumption by 36.7% but also lowers computational complexity of the semantic model by 42.8%. Moreover, it effectively prevents the cliff effectcaused by the decrease of signal-to-noise ratio (SNR) in traditional communication systems.

编者译:人工智能生成全景视频(AIGPV)的发展为6G沉浸式通信场景中用户的多样化需求提供了一种潜在的解决方案。然而,在资源受限的条件下确保用户体验质量仍然是一个重大挑战。本文提出了一种面向移动AIGPV的跨模态语义通信传输方案。该方案在边缘服务器端生成低分辨率全景视频,并通过跨模态语义通信进行传输。此外,为了更好地保障用户的体验质量,本文提出了一种基于深度联合信源信道编码(JSCC)的全景视频超分辨率传输框架,命名为PVSR-JSCC。该框架利用神经网络和注意力机制实现语义提取和自适应变长编码,并基于运动和上下文信息进行特征循环增强,从而实现全景视频超分辨率任务。此外,本文还设计了一种跨模态Swin Transformer模块(CMSTB)以增强深度JSCC的性能。CMSTB集成了自注意力和交叉注意力机制,使深度JSCC能够捕捉文本与视频之间的内在语义关联。仿真结果表明,与直接传输高分辨率视频的语义通信方案相比,本文提出的PVSR-JSCC不仅将带宽消耗降低了36.7%,还将语义模型的计算复杂度降低了42.8%。此外,该框架还有效避免了传统通信系统中因信噪比下降而导致的“悬崖效应”。

题目:智能体技术演进:场景分析、关键技术与发展趋势

作者:姜春宇、韩晓璐、王超伦

来源:大数据, 2026, 12(02): 129-138.

摘要:当前,基于大模型的智能体技术正经历爆发式演进,其开发、协作与全生命周期管理已成为产业核心议题。结合行业实践,提炼了典型应用场景,深度解析了智能体开发和通信涉及的关键技术,提出了一套完整的智能体研发及运营能力框架,最后展望了智能体发展趋势。

题目:D3-Guard: An Adaptive Decision Fusion Framework for Cloud-Native Threat DetectionD3-Guard:面向云原生威胁检测的自适应决策融合框架)

作者:Z. Lin, W. Zhang, H. Liu, H. Lu and Z. Tian

来源:Transactions on Cloud Computing(云计算汇刊), vol. 14, no. 1, pp. 163-176.

摘要:Traditional threat detection systems fail in dynamic cloud-native environments, primarily due to their inability to resolve the inherent trade-off between high-precision detection of known attacks and high-recall discovery of unknown threats. We propose D3-Guard, a novel framework whose core innovation lies in a dynamic decision fusion engine grounded in Bayesian decision-theoretic principles. The engine computes a similarity score from incoming requests to serve as a real-time contextual signal for the Bayesian framework. It then uses this signal directly as a dynamic weight to adaptively integrate the outputs of two complementary expert models: a high-precision LSTM-Attention for known patterns and a high-recall Isolation Forest for unknown threats. This synergy, reinforced by an adaptive update layer to mitigate concept drift, achieves F1-scores of 99.39% and 96.97% on the CSIC 2010 and ATRDF 2023 datasets, respectively. Performance tests in a production-like environment further validate its practical viability, demonstrating that this high accuracy is achieved with a justifiable overhead. An ablation study highlights the pivotal role of our fusion engine: disabling it results in a sharp decline in F1-score on the ATRDF 2023 dataset, from 96.97% to 11.47%, demonstrating its critical contribution to robust, dual-model collaboration.

编者译:传统的威胁检测系统在动态云原生环境中往往失效,主要原因是传统威胁检测系统无法解决在高精度检测已知攻击与高召回率发现未知威胁之间固有的权衡问题。为此,本文提出了一个新框架——D3-Guard,其核心创新在于一个基于贝叶斯决策理论原理的动态决策融合引擎。该引擎根据传入请求计算相似度得分,以此作为贝叶斯框架的实时上下文信号。随后,引擎将该信号直接作为动态权重,自适应地整合两个互补专家模型的输出:用于检测已知模式的高精度LSTM-Attention模型和用于发现未知威胁的高召回率孤立森林(Isolation Forest)模型。这种协同作用通过一个自适应更新层得到了加强,以缓解概念漂移。最终,我们在Web攻击数据集CSIC 2010和云原生威胁数据集ATRDF 2023数据集上进行了测试,分别达到了99.39%96.97%F1分数(即精确率与召回率的调和平均数,用于综合衡量模型的准确性)。在生产类环境中进行的性能测试进一步验证了实际可行性,表明该高精度是在开销合理的情况下实现的。消融研究凸显了融合引擎的关键作用:禁用融合引擎会导致ATRDF 2023数据集上的F1分数从96.97%骤降至11.47%

题目:数据产品的统一标识编码方法研究

作者:吴俊、谢文静、熊贇

来源:大数据, 2026, 12(02): 54-63.

摘要:数字资源的高效管理与互联互通是实现数据赋能的基石。传统以元数据管理为核心的资源组织方式已难以适应跨部门、跨层级、跨业务的复杂协同需求,限制了数字资源的深度利用。数据产品是数据市场流通的一大类标的物,统一标识作为数据产品的基础,其研究与实践对于促进数据流通共享至关重要。在系统梳理标识编码方法研究进展的基础上,针对当前数据分析需求复杂化、数据多源异构化,以及数据智能体模式带来的多任务协同语义互操作等关键挑战,提出数据产品的统一标识编码方法。该方法通过引入机器可理解的高维语义特征,使数据产品成为智能体识别与操作数据的统一接口,为推动数字资源体系的标准化、智能化和协同化发展提供方法参考与标准化路径。

题目:算法双重角色下的智能社会网络暴力传播:趋势、动因及治理路径

作者:陈烨、许浩、程卿玄

来源:信息资源管理学报, 2026, 16(1): 10-22.

摘要:智能社会加剧网络暴力传播风险,使传统治理失灵。算法作为核心技术,既是网络暴力助推者,又蕴含遏制者潜能。本研究从这一双重角色切入,通过文献调研和逻辑思辨,梳理网络暴力智能化与心理动态化的传播趋势,剖析算法作为助推者通过伪造、操纵、催化加剧暴力和作为遏制者通过抑制、净化、疏导修复生态的作用机理,进而提出涵盖政府、平台、算法设计者与用户多元协同主体的治理路径,为智能社会网络暴力治理提供理论新意与实践指引。

题目:海洋数据资源开发利用制度的国际发展与中国因应

作者:梅傲、张佳宜

来源:信息资源管理学报, 2026, 16(1): 4-9.

摘要:海洋数据资源的开发利用是数字经济发展的重要组成部分。在《联合国海洋法公约》框架下,世界各国展开深入合作,共同推动国际海洋数据资源的开发利用;中国海洋数据治理迎来全新的战略机遇和挑战,以“海洋命运共同体”理念为指引深化国家间的海洋合作。通过梳理海洋数据开发利用的现状发现,开发和利用两个阶段存在不足,基于海洋强国建设目标进一步阐释因应之策,为我国海洋数据开发利用与国际接轨提出可行性建议。

题目:北极航道环境数字化服务及应用研究

作者:邱玉宝、崔恒、金泽楷、李晓婷、余淑文

来源:数据与计算发展前沿, 2026, 8(2): 82-97.

摘要:气候变暖致使北极海冰持续减少,为全球交通和国际性贸易提供了新通道,北极航行已从探索阶段进入了发展期。在北冰洋少冰季、融冰或结冰期,航道环境信息的及时获取是安全航行的关键。论文旨在基于空天数据、人工智能预报技术和综合性通航指数,发展北极航道环境信息获取、服务及数字化应用能力,构建应对北极航行安全和北极环境治理的航道环境数字化服务系统。论文围绕当前空天数据的可获取性,遴选形成了影响北极航道的环境关键变量;以传统的可通航性指数为基础,引入降水、气温、水汽、海表温度、浪高等环境因子,构建了综合性通航评估模型;研制了基于空天数据的航道环境信息服务系统,在北极航行应急响应、年度计划和中长期规划等方面提供分层次的支撑服务;系统在我国北极探索性航行和北极极端环境探险性航行服务支撑中取得了实际效果。该系统综合北极航道环境关键变量、多源空间数据、海冰预报技术、通航性评估模型,构建了航行分层服务策略,为北极航道环境信息服务、北极航行安全及环境治理提供了重要的数字化工具。

题目:深度学习模型训练过程检查点访问性能优化方法

作者:滕云、张广艳、孙大为、田海东、常锐

来源:大数据, 2026, 12(02): 75-84.

摘要:随着大模型应用越来越广泛、规模逐渐增大,目前大模型训练面临出错概率高、检查点访问性能差等问题。总结了已有检查点访问性能优化方法的优缺点,提出了一种新的检查点访问性能优化方法。观察检查点数据模式可知,相近检查点的模型权重数据变化较小,适合增量压缩。基于多台互联训练节点实现了增量压缩,并基于真实的深度学习模型训练时产生的检查点数据进行了实验测试。结果表明,在训练周期内,增量压缩对大多数检查点具有较好的压缩效果。此外,提出在增量压缩中使用动态间隔来平衡压缩率与存储开销,并对动量数据特征进行分析。文章对已有方法的分析及对检查点访问性能的优化为大模型训练加速提供了指导。


附件: