学术视点----中国科学院网信工作网

学术视点

日期：2026-05-09

| 来源：【字号：大中小】

题目：An Efficient Hybrid Cache Replacement Policy for Cloud Block Storage（云块存储的高效混合缓存替换策略）

作者：Y. Zhou, F. Wang and D. Feng.

来源：IEEE Transactions on Cloud Computing（云计算汇刊）, vol. 14, no. 1, pp. 32-44.

摘要：.With the popularity of cloud services, Cloud Block Storage (CBS) systems have been widely deployed by cloud providers. Cloud cache plays a vital role in maintaining high and stable performance in CBS systems. Traditionally, most of the research work used heuristic cache algorithms. However, we observe that in a typical CBS system, these algorithms parameters cannot be adjusted flexibly, and the performance is poor when encountering complex cloud workloads. Recent advances in machine learning open up new and attractive approaches for solving classic problems in computing systems. However, the existing methods are either simple to implement, unable to reflect the differences and characteristics of existing heuristic algorithms, or too complex to make full use of some insight from classical heuristic algorithms. To solve these problems, we propose a lightweight learning-based hybrid cache replacement policy, called LHC which can intelligently switch different cache policies so as to effectively recognize different workloads or even different phases within the same workload by using Q-Learning in CBS systems. We have evaluated LHC by using I/O traces collected from Alibaba Cloud, one of the largest cloud providers in the world, and several open-source traces. Experimental results show that LHC not only improves hit rate by up to 81.4% with an average of 36.5%, but also reduces request latency and data traffic to the backend storage by up to 18.7% and 16.4% with an average of 12.6% and 11.2%, compared with the several cache methods.

编者译：云块存储（CBS）高度依赖缓存来保障系统性能。传统启发式缓存算法参数固化，难以应对复杂的云工作负载。尽管机器学习为该问题提供了新思路，但现有方法要么过于简单而忽略传统算法优势，要么过于复杂而难以利用其内在经验。为此，本文提出了一种基于轻量级学习的混合缓存替换策略——LHC。该策略在CBS系统中引入Q-Learning，能够智能切换不同的缓存策略，从而有效识别不同的工作负载，甚至是同一工作负载内的不同阶段。本文利用阿里云采集的I/O轨迹以及多种开源轨迹对LHC进行了评估。实验结果表明，与多种现有缓存方法相比，LHC不仅将缓存命中率最高提升了81.4%（平均提升36.5%），还使请求延迟和后端存储数据流量最多降低了18.7%和16.4%（平均降低12.6%和11.2%）。

题目：基于社交媒体大数据的灾害事件态势感知

作者：龚万渊、王慧颖、江信禧、周绮凤

来源：大数据, 2026, 12(02): 85-96.

摘要：灾害事件态势的准确感知取决于及时、有效地获取承载事件信息的相关数据以及对数据的深入理解和分析。社交媒体大数据蕴含了丰富的事件信息，但其海量、非结构化、时空敏感等特点为动态复杂的灾害事件态势感知带来巨大的挑战。从社交媒体大数据的角度出发，首先，通过构建灾害事件的因果知识图谱，有效整合社交媒体大数据中的异构信息，解决其非结构化和时空敏感问题；其次，利用大型语言模型及微调技术，提升对灾害事件演变过程的推理能力，并通过微调后的生成式预训练模型，更准确地识别具有针对性和实用性的灾害事件的因果子事件，有效应对数据海量和信息冗余带来的挑战；最后，设计了一个灾害事件态势感知系统，通过用户与系统的交互，辅助相关人员快速、全面地理解和分析灾害事件情况。实验结果表明，该系统在灾害事件相关文本分类任务中，平均F1分数达到0.891，显著优于基线模型。在因果关系生成方面，微调后的生成式预训练模型能够更准确地识别具有针对性和实用性的灾害事件的因果子事件，有效提升了灾害事件态势感知的准确性和效率。

题目：Adaptive Adjustment Strategy for Optimal Reception Area Selection for Trans-Air-Sea Optical Communications（面向跨空海光通信最优接收区选择的自适应调整机制）

作者：J. Wu, W. Zhang and C. Yu

来源：Intelligent and Converged Networks（智能与融合网络）, vol. 7, no. 1, pp. 1-19.

摘要：With the increasing demand for ocean communication, trans-air-sea wireless optical communication (WOC) has attracted growing attention. Due to spatial variations in signal attenuation, low-power regions are more susceptible to signal loss and channel instability, limiting system performance. To address this problem, an adaptive adjustment strategy for selecting the optimal reception area is proposed, which aims to maximize the received power. The strategy is based on the photon transmission model, and a local photon distribution based optimal reception area adjustment (LPD-ORAA) algorithm is designed by combining the properties of photon distribution. The LPD-ORAA consists of two parts, adaptive grid division and GE-based local optimization. By combining these two components, the optimal reception area can be effectively determined. Simulation results show that the average normalized received power (NRP) of the optimal reception area obtained by LPD-ORAA is 1.35 dB higher than that of the traditional alignment under various seawater conditions. Compared with the baseline algorithm, LPD-ORAA achieves higher NRP and lower channel impulse response. Finally, we verify the effectiveness of the LPD-ORAA algorithm in a pool environment. Experimental results show that the optimal reception area determined by LPD-ORAA is more suitable for trans-air-sea WOC than the traditional alignment.

编者译：随着海洋通信需求的不断增加，跨空海无线光通信引起了越来越广泛的关注。由于信号衰减在空间上存在差异性，低功率区域更容易发生信号损耗与信道不稳定，从而限制了通信性能。为了解决这一问题，本文提出了一种用于选择最优接收区域的自适应调整策略，旨在实现接收功率的最大化。该策略基于光子传输模型，并结合光子分布的特性，设计了一种基于局部光子分布的最优接收区域调整（LPD-ORAA）算法。LPD-ORAA算法由两部分组成：自适应网格划分和基于GE的局部优化。通过结合这两个部分，能够有效地确定最优接收区域。仿真表明，在不同海水条件下，LPD-ORAA算法获取的最优接收区平均归一化接收功率较传统对准提升1.35 dB，且相比基线算法实现了更高的NRP与更低的信道冲激响应。此外，水池实验验证了该算法的有效性。实验表明，由LPD-ORAA确定的最优接收区域比传统对准方式更适合于跨空海无线光通信。

题目：基于小样本数据的晶体合成工艺智能推荐研究

作者：朱冬、杨小渝、唐述杰、朱锋锋、孔潇、郭艳峰、李兵、秦志鹏

来源：数据与计算发展前沿, 2026, 8(1): 219-231.

摘要：晶体合成是制备新材料的关键环节，但工艺条件复杂多变，实验数据稀缺，工艺确定困难。如何基于有限的“结构-工艺”数据实现晶体合成工艺的智能生成与可行性评估，是当前亟待解决的问题。本文基于晶体结构理解增强模型CrysBert，构建了适用于小样本的结构-工艺可行性判别模型；基于晶体结构生成模型CrysGPT，构建了晶体合成工艺生成模型；通过CrysBert和CrysGPT的协同，实现晶体工艺的自动生成与筛选。基于162条小样本数据训练，工艺判别模型准确率达到0.90，明显优于传统方法；工艺生成模型推荐的候选工艺，经判别模型评价，可行工艺比例达到60.7%，与领域专家推荐工艺的成功率（62.3%）接近。本研究验证了通过CrysBert和CrysGPT的协同，可为晶体合成工艺的智能设计提供新途径。

题目：生成式人工智能环境下用户信息搜寻与认知路径研究

作者：牛庆萱、蔡亚芳、陈忆金

来源：图书情报知识, 2026, 43(1): 25-38.

摘要：探究生成式人工智能环境下用户在信息搜寻过程中的搜索行为、认知路径与认知转换三个方面的特征表现，并将其与传统搜索引擎用户进行比较，为生成式人工智能背景下搜索即学习特征研究、搜索工具改进提供参考。通过用户实验法，将实验被试分为传统搜索引擎组和生成式人工智能组，使用录屏与出声思维法收集数据，基于非参数检验分析方法进行数据分析。生成式人工智能组与传统搜索引擎组在搜索行为、认知路径和认知转换三个方面的表现存在显著差异。生成式人工智能加深了用户的搜索深度并增加了搜索宽度，但并未促使用户产生更复杂的学习。将生成式人工智能搜索工具纳入搜索即学习的研究范围，深入分析用户在生成式人工智能与传统搜索引擎下搜索行为和认知过程的差异，拓展了搜索即学习的研究情境和领域，有助于生成式人工智能的设计者帮助用户更好地使用自然语言进行信息搜索和学习。

题目：高质量数据集产品的形态和生产流程研究

作者：杨琳、朱扬勇

来源：大数据, 2026, 12(02): 64-74.

摘要：高质量数据集决定了人工智能模型的训练效果。高质量数据集缺乏统一标准形态和质量可控的流程化生产方法，导致其供给不足、流通不畅，已成为制约人工智能发展应用的因素之一。本文从数据产品的角度，提出高质量数据集产品的五元组形态，以全链路技术能力为支撑，设计高质量数据集产品的生产流程，提出面向产品需求的全生产流程质量管控方法，为高质量数据集产品的大规模生产、流通提供理论基础和可行方案。

题目：基于深度卷积和自注意力机制的端到端地震波降噪方法

作者：赵博涛、亢祖衡、贺亚运、彭俊清、张旭龙、瞿晓阳、谭毅培、陈雨乐、肖春光、王健宗

来源：大数据, 2026, 12(02): 111-128.

摘要：地震波信号的降噪对于地震监测和地震学研究至关重要。提出了一种基于深度学习的端到端地震波降噪方法。该方法融合了卷积神经网络与多头自注意力机制，采用残差连接的编码器-解码器架构，一方面能够处理复杂背景和细节丰富的信号，另一方面多头自注意力机制能捕捉长距离依赖关系。通过一致性相关性损失与频域均方误差损失的联合约束，在时域和频域上均实现了优异的降噪效果。在公开数据集STEAD上的测试表明，该方法在峰值信噪比（PSNR）和信号相关性（CC）两个关键指标上均优于传统及现有的深度学习方法，皮尔逊相关性为0.918，峰值信噪比为36.79，达到先进水平。此外，在京津冀地震预警台网所记录地震波形数据上进一步验证，结果表明该方法在抑制噪声的同时，能够较好地保留地震信号（CC达0.70，PSNR为35.26）。

题目：科研人员提示素养的生成机理及提升策略研究——基于建构主义学习理论

作者：温芳芳, 赵悦名, 王祎萌

来源：图书情报知识, 2026, 43(1): 39-50.

摘要：本文梳理了AIGC介入科研新范式下科研人员提示素养生成的过程，构建了提示素养生成机理理论模型，提出提升科研人员提示素养的对策与建议。科研人员提示素养的建构由AIGC介入科研情境、协作互动、先前知识、学习倾向、能力建构共五个维度组成，五个维度之间相互支撑和驱动。建议从促进交流、固本培元、提升认知、培养兴趣、量体裁衣等方面提升科研人员的提示素养。引入建构主义学习理论，聚焦科研人员提示素养构建新的理论分析框架，揭示AIGC介入科研情境下科研人员提示素养的生成机理，探讨科研人员提示素养提升策略，为提示素养教育提供新视角。

附件：