美NIST研究人员使用某些蒙版标记数据训练神经网络模型----中国科学院网信工作网

创新与应用案例

美NIST研究人员使用某些蒙版标记数据训练神经网络模型

日期：2020-10-15

| 来源：【字号：大中小】

美国国家标准与技术研究院（NIST）研究人员发现，使用某些蒙版（A和C）标记数据有助于训练神经网络模型，以检测密集的低质量绘图中的小型几何对象。该项目的目的是恢复期刊文章中丢失的数据，但是这种对象检测还具有其他应用领域，例如图像分析、自动驾驶汽车、监视和机器检查。

为了自动从科学论文中捕获重要数据，美国NIST的计算机科学家开发了一种方法，可以在图像数据中包含的密集，低质量绘图中准确检测小的几何对象，例如三角形。NIST模型采用旨在检测模式的神经网络方法，在现代生活中具有许多可能的应用。

NIST的神经网络模型在一组定义的测试图像中捕获了97％的对象，并将对象的中心定位在手动选择位置的几个像素内。

NIST计算机科学家Adele Peskin解释说：“该项目的目的是恢复期刊文章中丢失的数据。” “但是，小型密集物体检测的研究还有许多其他应用价值。物体检测广泛用于图像分析、自动驾驶汽车、机器检查等领域，对于这些物体而言，特别难以定位和分离小而密的物体。”

研究人员从NIST的热力学研究中心（TRC）的金属特性数据库中获取了可追溯到1900年代初的期刊文章的数据。通常，结果仅以图形格式显示，有时是手工绘制，而由于扫描或影印而退化。研究人员希望提取数据点的位置，以恢复原始数据，以进行进一步的分析。到目前为止，这些数据都是手动提取的。

图像为数据点提供了各种不同的标记，主要是圆形、三角形和正方形，具有不同的大小和清晰度。这种几何标记通常用于标记科学图中的数据。在训练神经网络之前，使用图形编辑软件从文本的子集中手动删除了可能会错误地显示为数据点的文本、数字和其他符号。

由于多种原因，准确检测和定位数据标记是一个挑战。标记的清晰度和确切形状不一致：它们可能是开放的或充满的，有时是模糊的或失真的。例如，某些圆形看起来是非常规范圆形，而其他圆形则没有足够的像素来完全定义其形状。另外，许多图像包含非常密集的重叠圆、正方形和三角形的补丁。

研究人员试图创建一种网络模型，以至少与手动检测一样准确地识别出绘图点-在绘图的实际位置的5像素以内，每边大小为数千像素。

如一篇新的期刊论文所述，NIST研究人员采用了最初由德国研究人员开发的用于分析生物医学图像的网络架构，称为U-Net。首先，缩小图像尺寸以减少空间信息，然后添加要素和上下文信息层，以建立精确的高分辨率结果。

为了帮助训练网络对标记形状进行分类并确定其中心，研究人员尝试了四种使用蒙版标记训练数据的方法，即为每个几何对象使用不同大小的中心标记和轮廓。

研究人员发现，向蒙版添加更多信息（例如，更粗的轮廓）可以提高对物体形状进行分类的准确性，但可以降低在图中确定其位置的准确性。最后，研究人员结合了几种模型的最佳方面，以获得最佳分类和最小的位置误差。事实证明，更改掩码是提高网络性能的最佳方法，它比其他方法（如网络末端的小更改）更有效。

网络的最佳性能-定位对象中心的准确度达到97％-仅对于图像点的子集是可能的，在这些图像中，绘图点最初由非常清晰的圆形，三角形和正方形表示。对于TRC而言，其性能足够好，可以使用神经网络从较新的期刊论文中从图中恢复数据。

尽管NIST研究人员目前没有后续研究计划，但神经网络模型“绝对”可以应用于其他图像分析问题，研究人员Peskin说。

来源：美国国家标准与技术研究院

下一篇>