什么是计算机视觉?
计算机视觉被认为是机器学习和人工智能发展的重要领域之一。简而言之,计算机视觉是人工智能研究领域,致力于赋予计算机看世界和视觉解释世界的能力。
更进一步的说,计算机视觉是一门研究如何使机器“看”的科学,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
计算机视觉的应用非常广泛,从自动驾驶汽车和无人机到医疗诊断技术和面部识别软件,计算机视觉的应用是巨大的和革命性的。
图像标注
图像标注是计算机视觉的一个子集,是计算机视觉的重要任务之一。图像标注就是将标签附加到图像上的过程。这可以是整个图像的一个标签,也可以是图像中每一组像素的多个标签。这些标签是由人工智能工程师预先确定的,并被选中为计算机视觉模型提供图像中所显示的信息。
一个简单的例子就是为人类标注者提供动物的图像,并让他们用正确的动物名称为每个图像进行标记。当然,标记的方法依赖于项目所使用的图像标注类型。这些带标签的图像有时被称为真实数据,然后将被输入计算机视觉算法。通过训练,最后该模型将能够从未注释的图像中区分不同种类的动物。虽然上面的例子非常简单,但进一步深入到计算机视觉更复杂的领域(如自动驾驶汽车),则就会需要更复杂的图像标注。
由于计算机视觉研究的是模仿或超越人类视觉能力的机器开发,训练这样的模型需要大量的带标注的图像。
你用来训练、验证和测试你的计算机视觉算法的图像将对你的人工智能项目的成功产生重大影响。数据集中的每张图像都必须经过深思熟虑和准确的标记,以训练人工智能系统像人类一样识别物体。图像标注的质量越高,机器学习模型的性能就可能越好。
如果没有图像标注,那些令人惊叹的计算机视觉技术都不可能实现。根据项目的不同,每个图像上的标签数量可能会有所不同。一些项目将只需要一个标签来表示整个图像的内容(图像分类)。其他项目可能需要在单个图像中标记多个对象,每个对象带有不同的标签。这些标签通常由计算机视觉科学家或机器学习工程师预先确定。
如何进行图像标注?
要创建带标签的图像,需要三件事:
1)、图片
2)、有人给图片加注释
3)、一个给图片做标注的平台
大多数图像标注项目都是从寻找和培训注释人员来执行标注任务开始的。人工智能是一个非常专业的领域,但人工智能训练数据标注并不总是必需的。虽然你需要机器学习方面的高等教育才能创造一辆自动驾驶汽车,但你不需要硕士学位就可以在图像中画汽车周围的方框(边界框注释)。因此,大多数标注者不需要机器学习方面的学位。
但是,这些标注人员应该对每个标注项目的规范和指导方针进行全面的培训,因为每个公司都有不同的需求。一旦标注人员接受了如何标注数据的培训,他们就可以在专门用于标注图像的平台上标注成百上千的图像。这个平台是一个软件,它应该具有执行特定类型标注所需的所有工具。
常用图像标注类型
1)、 2D和3D包围框
使用2D边框,标注者必须在他们想要在图像中注释的对象周围绘制一个框。有时这些目标对象将是相同的,即“请在图中的每辆自行车周围画框。”
其他时候,可能会有多个目标对象,“请在图中每辆车、行人和自行车周围画框。”在这种情况下,在画出框后,标注者将不得不从标签列表中选择属性给框中的对象。
3D包围盒也被称为长方体,除了它们还可以显示被标注的目标对象的大致深度之外,它们几乎与2D包围盒一样。与2D边界框标注类似,标注器在目标对象周围绘制框,确保在对象的边缘放置锚点。有时目标对象的一部分可能被阻挡。在这种情况下,标注器会估计目标对象阻塞边缘的位置。
2)、图像分类
边界框处理在一个图像中标注多个对象,而图像分类是将整个图像与一个标签关联的过程。一个简单的图像分类的例子是标记动物的类型。注释者会得到动物的图片,并要求他们根据动物种类对每张图片进行分类。
把这些带注释的图像数据输入计算机视觉模型,可以让模型了解每种动物特有的视觉特征。理论上,该模型将能够将新的未注释的动物图像归类到适当的物种类别中。
3)、线条和样条