只需10行Python代码，就能实现目标检测！--粉丝服务平台-粉丝头条-fensifuwu.com

日期： 2023-02-28 19:46:31 来源：CDA数据分析师收集编辑：

来源丨大数据文摘

编译丨邢畅、宁静

计算机视觉是人工智能的一个重要领域，是关于计算机和软件系统的科学，可以对图像和场景进行识别、理解。计算机视觉还包括图像识别、目标检测、图像生成、图像超分辨率重建等多个领域。由于存在大量的实际需求，目标检测可能是计算机视觉中最有意义的领域。

目标检测是指计算机和软件系统对图像或场景中的目标进行定位和识别的任务。目标检测已广泛应用于人脸检测、车辆检测、人流量统计、网络图像、安防系统和无人驾驶等多个领域。

在应用或系统中使用目标检测方法，以及基于这些方法构建新的应用都不是简单的任务。早期目标检测的实现基于经典算法，比如流行的计算机视觉库OpenCV中支持的算法。然而，这些经典算法在不同的条件下无法获得稳定的性能。

2012年深度学习的突破性进展和迅速普及，使得R-CNN、Fast-RCNN、Faster-RCNN、RetinaNet以及快速、高度准确的SSD、YOLO等目标检测算法应运而生。这些基于深度学习、机器学习的算法，需要一定的数学以及深度学习框架基础。有数百万的专业计算机程序员和软件开发人员想要集成和创建基于目标检测算法的新产品。同时由于理解和实际使用较为复杂，一直无法实现。如何开发出高效的目标检测代码呢？ImageAI就应运而生了。

ImageAI让代码变得简洁

ImageAI是一个python库，只需要几行代码，就可以让程序员和软件开发人员轻松地将最先进的计算机视觉技术集成到他们现有的或新的应用中，ImageAI已经在Github上开源。

Github地址：

https://github.com/OlafenwaMoses/ImageAI

ImageAI目前支持使用在ImageNet-1000数据集上训练的4种不同机器学习算法进行图像预测和训练。ImageAI还支持使用在COCO数据集上训练的RetinaNet，YOLOv3和TinyYOLOv3进行对象检测，视频检测和对象跟踪。最后，ImageAI允许训练自定义模型，以执行新目标的检测和识别。

ImageAI库有依赖其他Python库，所以在使用ImageAI开发之前还需要导入其他的包。

准备工作

使用ImageAI实现目标检测，只需进行以下4步：

在你的电脑上安装Python
安装ImageAI，配置依赖环境
下载目标检测模块文件
运行样例代码（只需10行）

下面一步步详细展开：

1）从Python官网下载并安装Python3

链接地址：

https://python.org

2）用pip命令安装以下依赖包：

i. Tensorflow

pip install tensorflow

ii. Numpy

pip install numpy

iii. SciPy

pip install scipy

iv. OpenCV

pip install opencv-python

v. Pillow

pip install pillow

vi. Matplotlib

pip install matplotlib

vii. H5py

pip install h5py

viii. Keras

pip install keras

ix. ImageAI

pip3 install imageai --upgrade

注意：第一次安装ImageAI库，需要下载对应版本的.whl文件，文摘菌的电脑是Python3的环境，所以下载了imageai-2.0.2-py3-none-any.whl 文件，然后转移到相应的文件夹下，执行如下命令即可安装：

pip install imageai-2.0.2-py3-none-any.whl

.whl文件链接地址：

https://github.com/OlafenwaMoses/ImageAI/releases/download/2.0.2/imageai-2.0.2-py3-none-any.whl

3）下载用于目标检测的RetinaNet模型文件

链接地址：

https://github.com/OlafenwaMoses/ImageAI/releases/download/1.0/resnet50_coco_best_v2.0.1.h5

开启10行代码的目标检测

到这里你已经安装好了所有的依赖项，可以开始编写你的第一个目标检测的代码了。

创建一个Python文件并命名（如FirstDetection.py），然后将下面的代码写入该文件。将RetinaNet模型文件和要检测的图像复制到包含Python文件的文件夹中。

FirstDetection.py：

from imageai.Detection import ObjectDetectionimport os

execution_path = os.getcwd()

detector = ObjectDetection()detector.setModelTypeAsRetinaNet()detector.setModelPath( os.path.join(execution_path , "resnet50_coco_best_v2.0.1.h5"))detector.loadModel()detections = detector.detectObjectsFromImage(input_image=os.path.join(execution_path , "image.jpg"), output_image_path=os.path.join(execution_path , "imagenew.jpg"))

for eachObject in detections:   print(eachObject["name"] , " : " , eachObject["percentage_probability"] )

然后运行代码，等待结果输出。结果显示后，就可以在FirstDetection.py所在的文件夹下找到保存下来的新图像。下面有两个新图像的示例。

目标检测前：

图片来源：alzheimers.co.uk

图片来源：Wikicommons

目标检测后：

在Spyder编译器中运行结果如下所示：

输出的目标检测精度结果：

person : 57.20391869544983

person : 52.57977843284607

person : 70.81094980239868

person : 76.99859142303467

person : 79.40077781677246

bicycle : 81.0384213924408

person : 83.66722464561462

person : 89.41188454627991

truck : 60.61040759086609

person : 69.65749859809875

bus : 97.92424440383911

truck : 83.94358158111572

car : 72.50492572784424

在Spyder编译器中运行结果如下所示：

输出的目标检测精度结果：

person : 62.45866417884827

person : 58.67737531661987

person : 69.44932341575623

person : 71.84218168258667

person : 59.53381657600403

person : 54.65759038925171

motorcycle : 65.84504842758179

bus : 99.40318465232849

car : 72.41445779800415

person : 58.32530856132507

person : 54.449981451034546

person : 80.11815547943115

person : 74.30745959281921

person : 77.78302431106567

person : 71.15439772605896

bicycle : 69.92427110671997

person : 66.17957353591919

bicycle : 90.50283432006836

motorcycle : 94.09030675888062

短短10行代码就出了目标检测的结果，这也太快了吧！本着对真理探索的热情，在弄懂里面的原理后，文摘菌将在下文对每行代码进行解读。

知其然知其所以然：代码解读

下面来解释一下这10行代码的工作原理：

from imageai.Detection import ObjectDetectionimport osexecution_path = os.getcwd()

在以上3行代码中，在第一行导入了ImageAI的目标检测类；在第二行导入了Python的os类；在第三行中定义了一个变量，保存Python文件、RetinaNet模型文件以及图像所在文件夹的路径。

detector = ObjectDetection()detector.setModelTypeAsRetinaNet()detector.setModelPath( os.path.join(execution_path , "resnet50_coco_best_v2.0.1.h5"))detector.loadModel()detections = detector.detectObjectsFromImage(input_image=os.path.join(execution_path , "image.jpg"), output_image_path=os.path.join(execution_path , "imagenew.jpg"))

在以上5行代码中，我们在第一行中定义了一个目标检测类的实例；在第二行中将实例的模型类型设定为RetinaNet；在第三行中将模型路径设置为RetinaNet模型的路径；在第四行中将模型加载到目标检测类的实例中；在第五行中调用检测函数，并将文件输入输出路径作为参数传入。

for eachObject in detections:   print(eachObject["name"] , " : " , eachObject["percentage_probability"] )

在以上两行代码中，第一行用来对detector.detectObjectsFromImage 函数返回的所有结果进行迭代，第二行用来输出图片中检测到的每个目标的名字及其概率。

自定义目标检测

除此外，ImageAI也支持强大的自定义目标检测。其中之一是能够提取图像中检测到的每个物体。只需要将参数

extract_detected_objects=True

传入

detectObjectsFromImage

函数中，如下所示，目标检测类将为图像对象创建一个文件夹，提取每个图像，将每个子图像保存到创建的新文件夹中，并返回一个包含每个图像路径的数组。

detections, extracted_images = detector.detectObjectsFromImage(input_image=os.path.join(execution_path , "image.jpg"), output_image_path=os.path.join(execution_path , "imagenew.jpg"), extract_detected_objects=True)

将其应用到第一张图片上，得到如下结果：

所有行人都被很好地提取了出来，为了节约空间这里只显示了一部分。

ImageAI的其他功能

ImageAI提供了许多功能，可用于目标检测任务的自定义和部署。其支持的功能包括：

调整最小概率：默认情况下，概率小于50%的物体不会显示。对于需要高精度的情况，可以增加此值；对于需要检测所有可能对象的情况，可以减少此值。
自定义目标检测：通过提供的CustomObject类，可以使检测类检测一个或几个特定目标。
检测速度：通过将检测速度设置为“fast”、“faster”或“fastest”，可以减少检测图像所需的时间。
输入类型：可指定并解析图像的文件路径，以Numpy数组或图像文件流作为输入
输出类型：可指定detectObjectsFromImage函数以文件或Numpy数组的形式返回图像

你可以在上文给出的官方GitHub链接中找到如何使用上述功能以及ImageAI中包含的其他计算机视觉功能的详细信息和文档。

服务粉丝

只需10行Python代码，就能实现目标检测！

ImageAI让代码变得简洁

准备工作

开启10行代码的目标检测

知其然知其所以然：代码解读

自定义目标检测

ImageAI的其他功能

推荐阅读

文章推荐

相关阅读

第一章开始学Excel VBA

一个用于创建超漂亮代码图像的工具 - showcode

详细剖析模板匹配

笃行实干向未来

等待重磅会议召开

学会 IDEA 这 30 个神技，撸码效率直接起飞

张丽俊：卓越的管理者，往往把人才放在第一位

真正厉害的人，都在延迟满足 | 赠书荐书

刘刚教授团队：基于深度图像的多姿态肉牛体尺自动测量方法（《智慧农业（中英文）》2022年第4期）

依米：真正的目标，会跟灯塔似的不断纠正你的行为

聚合标签

热门文章

百元茅台没人买，千元茅台有人追。十年前，有人花百元买了一万股茅台，后出手追中石油，如今，茅台一飞冲天，中石油深套十年。炒股，不要见异思迁，价值投资是首选。#股票#

谁说定期存款提前支取不划算？存中原银行“惠农宝”放心随便取

张小龙:交了8千万税无北京户籍孩子连私立也不让上

万字详解：ROE连续十年超过20的明星公司全面分析（附：详细名单）

“复活”半年后　京东拍拍二手杀入公益事业

离职时没有做满一个月，公司还需要帮纳当月社保吗？

最新文章

只需10行Python代码，就能实现目标检测！

35城2022居民收入盘点：谁增幅最大？谁跑输大盘？

【新课推荐】清华硕士带你学《空间地理数据分析与可视化》

ChatGPT火爆，最全prompt工程指南登GitHub热榜，标星4.7k！

数字化转型“局内人”必备实战手册来了！

湖北随县吴山镇召开校园安全工作会议