本文全面概述了使用基于深度学习的物体检测方法通过无人机进行航空影像。人工智能南非机器人公司利用深度学习轻松实现无人机图像目标检测还介绍了无人机的实际使用情况,以监测非洲住房项目的建设进度。
人工智能南非机器人公司利用深度学习轻松实现无人机图像目标检测你是否知道无人驾驶飞机,到2023年,相关功能将成为500亿美元的行业?从今天开始,无人机在农业,建筑,公共安全和安全等领域得到了应用,并且也被其他人迅速采用。借助基于深度学习的计算机视觉技术为这些无人机提供动力,行业专家预测在以前难以想象的应用中将会有前所未有的用途。我们通过深度学习探索这些应用中的一些以及无人机监控自动化中的挑战。最后,使用Nanonets机器学习框架提出了一个案例研究,用于自动化非洲建筑项目的远程检查。
NanoNets,Drone API
人工智能南非机器人公司利用深度学习轻松实现无人机图像目标检测创建自定义深度学习模型,检测无人机捕获的图像中的各种对象,并使用最少的数据和...nanonets.
第1部分:航拍图像 - 简要背景
人们一直着迷于从高层建筑的观看塔,高堡垒,捕捉到最高的山峰,观看世界。为了捕捉掠影并与世界分享,人们竭尽全力反抗地心引力,寻求梯子,高楼,风筝,气球,飞机和火箭的帮助。
今天,即使对于大众来说,也可以使用可以飞行2公里的无人机。这些无人机拥有高分辨率相机,能够获取可用于各种分析的高质量图像。
第2节:无人机及其工业应用
随着无人机更容易使用,我们看到摄影师和业余爱好者的兴趣和活动,他们正在使用它来制作创意项目,例如捕捉南非的不平等或让纽约的壮丽景色让伍迪艾伦感到自豪。尽管所有这些看起来都非常整齐,但这个价值500亿美元的无人机行业的肉在于它的工业应用。
我们在这里探索一些:
能源:检查太阳能农场
例行检查和维护对太阳能农场来说是一项艰巨的任务。传统的人工检查方法只能支持三个月一次的检查频率。由于恶劣的环境,太阳能电池板可能有缺陷; 破碎的太阳能板单元降低了功率输出效率。
农业:早期植物病害检测
伦敦帝国理工学院的研究人员正在使用无人机安装多光谱相机,该相机将使用特殊滤光片来捕获选定电磁频谱区域的反射光。压力植物通常会展示一种“光谱特征”,将其与健康植物区分开来。
公共安全:鲨鱼检测
对大量土地/水的高架视图进行分析可以产生大量关于安全和公共安全的信息。其中一个例子就是在澳大利亚海岸外发现鲨鱼。位于澳大利亚的Westpac集团开发了一种深度学习型物体检测系统,用于检测水中的鲨鱼。
土木工程(常规桥梁检查,电力线监视和交通测量),石油和天然气(石油和天然气平台的在岸和海上检查,钻井平台),公共安全(机动车辆事故)等航空图像还有各种其他应用,核事故,结构性火灾,船舶碰撞,飞机和火车碰撞)和安全(交通监视,边境监视,沿海监视,控制敌对示威和暴动)。
第3部分:获取和处理工业级无人机图像
为了全面捕捉地形和景观,获取航拍图像的过程可以总结为两个步骤。
光照测量:在无人机飞行期间,需要定期拍摄几张图像以确保图像重叠。这是至关重要的,以便可以在图像中存在的物体之间进行测量。广义上说,这个过程被称为摄影测量。对于用于数据分析和制图的图像,图像拼接需要相关的元数据。这些元数据由无人机上的微型计算机自动插入。
图像拼接:数据采集完成后,第二步是将各个航拍图像合并为一张有用的地图,通常使用专门的摄影测量方法快速将图像拼接在一起。这种专门的摄影测量形式称为结构自动运动(SfM)。SfM软件通过比较,匹配和测量每个图像内物体之间的角度,从不同的角度拼接同一场景的图像。在此步骤中,图像可能会进行地理参考,以便将位置信息附加到每个图像。
图像拼接后,生成的地图可用于上述应用程序的各种分析。
第4节:人工智能遇到无人机
高分辨率的航空影像在全球范围内越来越多地可用,并且包含大量关于可能与维护,土地开发,疾病控制,缺陷定位,监视等相关的感兴趣的特征的信息。不幸的是,这些数据是高度非结构化的并且因此即使通过大量的人工分析,也难以从规模上提取有意义的见解。
例如,城市土地利用的分类通常基于由受过训练的专业人员进行的调查。因此,这项任务是劳动密集型的,不经常的,缓慢的和昂贵的。因此,这些数据主要在发达国家和大城市有资源和愿景来收集和管理。
自动化航空影像分析的另一个动机源于预测感兴趣区域变化的紧迫性。例如,人群统计和人群行为经常在诸如音乐会,足球比赛,抗议等大型公共集会期间进行。传统上,人们在分析从CCTV摄像机直接流向指挥中心的图像的分析之后。正如您可能想象的那样,这种方法存在几个问题,例如人为延迟或检测事件时的错误以及通过标准静态闭路电视摄像机缺乏足够的视野。
以下是使用航空影像时遇到的一些常见问题。
自动化航拍图像的挑战和限制
自动分析无人机图像时需要克服几个挑战。以下列举了其中的一些解决方案:
对象的平面和小视图:当前的计算机视觉算法和数据集是在实验室设置下使用以对象近距离水平拍摄的以人体为中心的照片进行设计和评估的。对于垂直拍摄的无人机影像,感兴趣的物体相对较小,并且具有较少的特征,大部分呈现平坦和矩形。例如。从无人飞行器取得的建筑物图像仅显示屋顶,而建筑物的地面图像具有诸如门,窗和墙壁等特征。
标记数据困难:跟上上述要点,即使我们可以获取大量图像,仍然需要标记这些图像。这是一项手动任务,需要精确和准确的“垃圾进入垃圾”。手工贴标签没有什么神奇的解决办法。在Nanonets,我们根据需要提供注释员,可以为您标注数据。
大图像尺寸:无人机图像尺寸很大,在大多数情况下超过3000像素×3000像素的分辨率。这在处理这种图像时增加了计算复杂度。为了避免这种情况,我们将预处理方法应用于航空影像,以便为我们的模型训练阶段做好准备。这涉及以不同分辨率,角度和姿势裁剪图像,以使我们的训练不受这些变化的影响。
对象重叠:分割图像的一个问题是同一个对象可能出现在两个单独的图像中。这会导致对象计数的双重检测和错误。而且,在检测过程中,某些彼此非常接近的物体也可能具有重叠的边界框。克服这个问题的方法之一是通过滑动窗口上取样来寻找小而密集的物体。
第5节:Nanonets案例研究:自动远程检查非洲的建筑项目
Pragmatic Master是一家南非机器人作为服务机构,与Nanonets合作进行自动化远程监控非洲住房建设项目的进展。这些项目通常容易因错误报告而延误和偷盗,这可能通过频繁飞行无人机来映射和记录来解决。
我们的目标是探测以下基础设施,以捕捉房屋各个阶段的施工进度:
基础(开始)
墙板(进行中)
屋顶(部分完整)
围裙(收尾)
间歇泉(准备搬入)。
实用大师选择Nanonets作为深度学习提供商,因为它易于使用的Web平台和即插即用API。
使用Nanonets API的端到端流程非常简单,只需四步即可完成。1.上传图像:从无人机获取的图像可以直接上传到我们的上传着陆页。对于目前的案例研究,我们总共获得了低海拔1442个建筑工地的图像。上传图片的例子如下。
2.图像标记:标记图像可能是任何监督机器学习管道中最困难和最耗时的步骤,但是在Nanonets中,我们已经为您覆盖了这一点。我们拥有多年与航空影像合作的内部专家。他们将以高精度和准确性对您的图像进行注释,以帮助更好地进行模型训练。对于语用大师用例,我们在所有图像中标记了下列对象及其总数。
屋顶:2299
间歇泉:6556
墙板:1043
围裙:8730
3. 模型训练:在 Nanonets,我们采用转移学习的原则,同时对图像进行训练。这涉及到重新训练预先训练过的模型,该模型已经用大量航拍图像预先训练过。这有助于模型轻松识别图像上的微小图案,例如边缘,线条和轮廓,并专注于更具体的宏观模式,如房屋,树木,人类,汽车等。转移学习还可以提升培训时间该模型不需要进行大量迭代的训练以提供良好的性能。我们专有的深度学习软件巧妙地选择最佳模型,并为您的用例优化超参数。这涉及使用高级搜索算法搜索多个模型并通过超空间参数。由于分辨率低,最难检测的物体是最小的物体。我们的模型训练策略经过优化,可检测非常小的物体,例如面积只有几个像素的喷泉和围裙。
以下是我们获得的每班平均精度
:屋顶:95.1%
喷泉:88%
墙板:92%
围裙:81%
注意:添加更多图像可能会导致平均平均精度的提高。我们的API还支持在同一图像中检测多个对象,例如一个图像中的屋顶和围裙。
4. 测试和集成:一旦模型经过培训,您可以将Nanonet的API直接集成到您的系统中,或者我们还提供一个码头图像以及您可以使用的训练模型和推理代码。Docker镜像可以轻松扩展并提供容错推理系统。
最后一步,使用与每个图像关联的GIS数据将图像拼接起来以创建整个景观的视图。
Pragmatic Master是一家南非机器人公司,作为一家服务公司,提供摄像头安装的无人机以获取建筑,农业和采矿地点的图像。对这些图像进行分析,以跟踪进展情况,确定挑战,消除低效率并提供场地的整体鸟瞰图。
留言与评论(共有 0 条评论) |