跳转至

一、设置 OpenCV

使用 Python 精通 OpenCV 4 将为您提供有关构建涉及开源计算机视觉库OpenCV)和 Python 的项目的知识。 将介绍这两种技术(第一种是编程语言,第二种是计算机视觉和机器学习库)。 另外,您还将了解为什么将 OpenCV 和 Python 结合使用具有构建各种计算机应用的潜力。 最后,将介绍与本书内容有关的主要概念。

在本章中,将逐步指导您安装开始使用 Python 和 OpenCV 进行编程所需的一切。 第一章很长,但是不用担心,因为它被分为容易理解的部分,从一般的术语和概念开始,假定读者是新手。 在本章的最后,您将能够构建第一个涉及 Python 和 OpenCV 的项目。

本章将涵盖以下主题:

  • OpenCV 库的理论介绍
  • 安装 Python OpenCV 和其他包
  • 运行示例,文档,帮助和更新
  • Python 和 OpenCV 项目结构
  • 第一个 Python 和 OpenCV 项目

技术要求

本章及后续各章重点讨论与计算机视觉,机器学习和深度学习技术(以及其他技术)相关的 Python(一种编程语言)和 OpenCV(一个计算机视觉库)概念。 因此,应该在计算机上安装 PythonOpenCV。 此外,还应该安装一些与科学计算和数据科学有关的 Python 包(例如 NumPyMatplotlib

此外,建议您安装集成开发环境IDE)包,因为它有助于计算机程序员进行软件开发。 从这个意义上讲,建议使用 Python 特定的 IDE。 实际上是 Python IDE 是 PyCharm,可以从这里下载。

最后,为了促进 GitHub 活动(例如,克隆存储库),您应该安装 Git 客户端。 从这个意义上讲,GitHub 提供了包括最常见的存储库操作的桌面客户端。 有关 Git 命令的介绍,请查看这里,其中总结了常用的 Git 命令行说明。 此外,还包括在操作系统上安装 Git 客户端的说明。

可从这里访问本书的 GitHub 存储库,其中包含从本书第一章到最后一章所需的所有支持项目文件。

最后,应该注意的是,使用 Python 精通 OpenCV 的 GitHub 存储库的 README 文件包括以下内容,出于完整性考虑,此文件也附在此处:

  • 代码测试规范
  • 硬件规格
  • 相关书籍和产品

代码测试规范

使用 Python 精通 OpenCV 4 需要一些已安装的包,您可以在这里查看:

  • 第 1 章,“设置 OpenCV”:opencv-contrib-python
  • 第 2 章,“OpenCV 中的图像基础”:opencv-contrib-pythonmatplotlib
  • 第 3 章,“处理文件和图像”:opencv-contrib-pythonmatplotlib
  • 第 4 章,“在 OpenCV 中构建基本形状”:opencv-contrib-pythonmatplotlib
  • 第 5 章,“图像处理技术”:opencv-contrib-pythonmatplotlib
  • 第 6 章,“直方图的构建”:opencv-contrib-pythonmatplotlib
  • 第 7 章,“阈值处理技术”:opencv-contrib-pythonmatplotlibscikit-imagescipy
  • 第 8 章,“轮廓检测,过滤和绘制”:opencv-contrib-pythonmatplotlib
  • 第 9 章,“增强现实”:opencv-contrib-pythonmatplotlib
  • 第 10 章,“使用 OpenCV 的机器学习”:opencv-contrib-pythonmatplotlib
  • 第 11 章,“人脸检测,跟踪和识别”:opencv-contrib-pythonmatplotlibdlibface-recognitioncvlibrequestsprogressbarkerastensorflow
  • 第 12 章,“深度学习简介”:opencv-contrib-pythonmatplotlibtensorflowkeras
  • 第 13 章,“使用 Python 和 OpenCV 的移动和 Web 计算机视觉”:opencv-contrib-pythonmatplotlibflasktensorflowkerasrequestspillow

确保已安装包的版本号等于或大于此处指定的版本,以确保代码示例正确运行。

如果要安装本书经过测试的确切版本,请从pip安装时包括该版本,如下所示。

运行以下命令以安装主要模块和贡献模块:

  • 安装opencv-contrib-python
pip install opencv-contrib-python==4.0.0.21

应该注意的是,OpenCV 需要numpy。 安装opencv-contrib-python==4.0.0.21时已安装numpy-1.16.1

运行以下命令以安装 Matplotlib 库:

  • 安装matplotlib
pip install matplotlib==3.0.2

应当注意,matplotlib需要kiwisolverpyparsingsixcyclerpython-dateutil

安装matplotlib==3.0.2时,已经安装了cycler-0.10.0kiwisolver-1.0.1pyparsing-2.3.1python-dateutil-2.8.0six-1.12.0

运行以下命令以安装库,该库包含用于图像处理的算法的集合:

  • 安装scikit-image
pip install scikit-image==0.14.2

应当注意,scikit-image需要cloudpickledecoratornetworkxnumpytoolzdaskpillowPyWaveletssix

安装scikit-image==0.14.2时,已安装PyWavelets-1.0.1cloudpickle-0.8.0dask-1.1.1decorator-4.3.2networkx-2.2numpy-1.16.1pillow-5.4.1six-1.12.0toolz-0.9.0

如果需要 SciPy,可以使用以下命令进行安装:

  • 安装scipy
pip install scipy==1.2.1 

应当注意,scipy需要numpy

安装scipy==1.2.1时已安装numpy-1.16.1

运行以下命令以安装dlib库:

  • 安装dlib
pip install dlib==19.8.1

要安装面部识别库,请运行以下命令:

  • 安装face-recognition
pip install face-recognition==1.2.3

应当注意,face-recognition需要dlibClicknumpyface-recognition-modelspillow

安装face-recognition==1.2.3时,已经安装了dlib-19.8.1Click-7.0face-recognition-models-0.3.0pillow-5.4.1

运行以下命令以安装开源计算机视觉库:

  • 安装cvlib
pip install cvlib==0.1.8

要安装请求库,请运行以下命令:

  • 安装requests
pip install requests==2.21.0

应当注意,requests需要urllib3chardetcertifiidna

安装requests==2.21.0时,已经安装了urllib3-1.24.1chardet-3.0.4certifi-2018.11.29idna-2.8

运行以下命令以安装文本进度栏库:

  • 安装progressbar
pip install progressbar==2.5 

运行以下命令以安装 Keras 库以进行深度学习:

  • 安装keras
pip install keras==2.2.4

应当注意,keras需要numpysixh5pykeras-applicationsscipykeras-preprocessingpyyaml

安装keras==2.2.4时,已经安装了h5py-2.9.0keras-applications-1.0.7keras-preprocessing-1.0.9numpy-1.16.1 pyyaml-3.13scipy-1.2.1 six-1.12.0

运行以下命令以安装 TensorFlow 库:

  • 安装tensorflow
pip install tensorflow==1.12.0 

应该注意的是 TensorFlow 需要termcolornumpywheelgastsixsetuptoolsprotobufmarkdowngrpciowerkzeugtensorboardabsl-pyh5pykeras-applicationskeras-preprocessingastor

termcolor-1.1.0numpy-1.16.1wheel-0.33.1gast-0.2.2six-1.12.0, setuptools-40.8.0protobuf-3.6.1markdown-3.0.1grpcio-1.18.0werkzeug-0.14.1tensorboard-1.12.2absl-py-0.7.0h5py-2.9.0keras-applications-1.0.7keras-preprocessing-1.0.9astor-0.7.1已在安装tensorflow==1.12.0时安装。

运行以下命令以安装 Flask 库:

  • 安装flask
pip install flask==1.0.2

应当注意,flask需要WerkzeugclickitsdangerousMarkupSafe Jinja2

安装flask==1.0.2时,已经安装了Jinja2-2.10MarkupSafe-1.1.1Werkzeug-0.14.1click-7.0itsdangerous-1.1.0

硬件规格

硬件规格如下:

  • 32 位或 64 位架构
  • 2+ GHz CPU
  • 4 GB 内存
  • 至少 10 GB 的可用硬盘空间

了解 Python

Python 是具有动态类型系统和自动内存管理的一种解释型高级通用编程语言。 Python 编程语言的官方主页是这里。 在过去的十年中,Python 的普及率稳步上升。 这是因为 Python 是当今一些最令人兴奋和最具挑战性的技术中非常重要的编程语言。 人工智能AI),机器学习,神经网络,深度学习,物联网IoT)和机器人技术(以及其他)依靠 Python。

这是 Python 的一些优点:

  • Python 被认为是科学计算的理想语言,主要有以下四个原因:
    • 这很容易理解。
    • 它具有(通过包)科学计算的支持。
    • 它消除了其他编程语言所具有的许多复杂性。
    • 它具有简单且一致的语法。
  • Python 可以促进快速原型设计,因为它有助于轻松编写和执行代码。 的确,与其他编程语言相比,Python 可以用最少五分之一的代码来实现相同的逻辑。
  • Python 有许多预建的库(NumPy,SciPy,scikit-learn)可满足您 AI 项目的各种需求。 Python 受益于丰富的科学计算库生态系统。
  • 它是一个独立的平台,使开发人员可以节省在不同平台上进行测试的时间。
  • Python 提供了一些工具,例如 Jupyter 笔记本,可用于以轻松舒适的方式共享脚本。 这在科学计算中是完美的,因为它可以激发交互式计算环境中的协作。

介绍 OpenCV

OpenCV 是具有实时功能的 C++ 编程库。 由于它是用优化的 C/C++ 编写的,因此该库可以从多核处理中受益。 下一节将对 OpenCV 库进行理论上的介绍。

与 OpenCV 库有关,以下是其受欢迎的一些原因:

  • 开源计算机视觉库
  • OpenCV(BSD 许可证)是免费的
  • 特定的图像处理库
  • 它拥有 2500 多种优化算法,包括最新的计算机视觉算法
  • 机器学习和深度学习支持
  • 该库针对性能进行了优化
  • 有大量的开发人员使用和支持 OpenCV
  • 它具有 C++,Python,Java 和 MATLAB 接口
  • 该库支持 Windows,Linux,Android 和 macOS
  • 快速定期更新(现在每六个月发布一次正式发布)

使读者具有上下文

为了使读者具有上下文关系,有必要建立和设置与本书主题相关的主要概念的基础。 最近几年,人们对 AI 和机器学习产生了浓厚的兴趣,特别是在深度学习领域。 这些术语可以互换使用,并且经常相互混淆。 为了完整和清楚起见,下面将简要描述这些术语。

人工智能是指使机器(计算机或机器人系统)能够以与人类相同的方式处理信息的一组技术。

术语“AI”通常用作机器技术的保护伞,以提供涵盖多种方法和算法的智能。 机器学习是对计算机进行编程以从历史数据中学习以对新数据进行预测的过程。 机器学习是 AI 的子学科,是指机器根据学习到的相互关系使用的统计技术。 根据收集或收集的数据,计算机可以独立学习算法。 这些算法和方法包括支持向量机,决策树,随机森林,逻辑回归,贝叶斯网络和神经网络。

神经网络是用于机器学习的计算机模型,该模型基于生物大脑的结构和功能。 人工神经元处理多个输入信号,然后,当输入信号的总和超过某个阈值时,将向其他相邻神经元发送信号。 深度学习是机器学习的子集,它对大量非结构化数据(例如人类语音,文本和图像)进行操作。 深度学习模型是一种人工神经网络,其中包括对数据进行的多层数学计算,其中一层的结果作为输入输入到下一层,以对输入数据进行分类和/或进行预测。

因此,这些概念在层次结构上是相互依存的,AI 是最广义的术语,而深度学习是最具体的术语。 下图可以看到这种结构:

计算机视觉人工智能的一个跨学科领域,旨在使具有计算能力的计算机和其他设备从数字图像和视频中获得高层次的理解,包括获取,处理的功能 ,并分析数字图像。 这就是为什么计算机视觉在某种程度上是人工智能的另一个子领域的原因,该领域严重依赖于机器学习和深度学习算法来构建计算机视觉应用。 此外,计算机视觉由多种技术共同作用-计算机图形学图像处理信号处理传感器技术数学甚至是物理

因此,可以完成前面的图来介绍计算机视觉学科:

OpenCV 库的理论介绍

OpenCV 是一个具有实时计算机视觉功能的编程库,它对于学术和商业用途都是免费的(BSD 许可证)。 在本节中,将介绍有关 OpenCV 库的信息,包括其主要模块以及与该库有关的其他有用信息。

OpenCV 模块

OpenCV(从版本 2 开始)分为几个模块,每个模块通常可以理解为专用于一组计算机视觉问题。 在下图中可以看到这种划分,其中显示了主要模块:

OpenCV 模块在此处简短描述:

  • core:核心功能。 核心功能是一个定义基本数据结构的模块,也是库中所有其他模块使用的基本功能。
  • imgproc:图像处理。 图像处理模块,包括图像过滤,几何图像转换,色彩空间转换和直方图。
  • imgcodecs:图像编解码器。 图像文件读写。
  • videoio:视频 I/O。 视频捕获和视频编解码器的接口。
  • highgui:高级 GUI。 UI 功能的接口。 它提供了一个界面,可以轻松地执行以下操作:
    • 创建和操作可显示图像的窗口
    • 将跟踪栏添加到窗口,键盘命令并处理鼠标事件
  • video:视频分析。 一个视频分析模块,包括背景扣除,运动估计和对象跟踪算法。
  • calib3d:相机校准和 3D 重建。 相机校准和 3D 重建涵盖基本的多视图几何算法,立体对应算法,对象姿态估计,单相机和立体相机校准以及 3D 重建。
  • features2d:2D 特征框架。 该模块包括特征检测器,描述符和描述符匹配器。
  • objdetect:对象检测。 检测对象和预定义类的实例(例如,面部,眼睛,人和汽车)。
  • dnn深度神经网络DNN)模块。 该模块包含以下内容:
    • 用于创建新层的 API
    • 一组有用的层
    • 从层构建和修改神经网络的 API
    • 从不同的深度学习框架加载序列化网络模型的功能
  • ml:机器学习。 机器学习库MLL)是可用于分类,回归和聚类目的的一组类和方法。
  • flann:在多维空间中进行聚类和搜索。 用于近似最近邻的快速库FLANN)是非常适合于快速最近邻搜索的算法集合。
  • photo:计算摄影。 该模块提供了一些用于计算摄影的功能。
  • stitching:图像拼接。 该模块实现了执行自动全景图像拼接的拼接管线。
  • shape:形状距离和匹配。 形状距离和匹配模块,可用于形状匹配,检索或比较。
  • superres:超分辨率。 此模块包含一组可用于增强分辨率的类和方法。
  • videostab:视频稳定。 此模块包含一组用于视频稳定的类和方法。
  • viz:3D 可视化器。 此模块用于显示小部件,这些小部件提供了几种与场景和小部件进行交互的方法。

OpenCV 用户

无论您是专业的软件开发人员还是新手程序员,OpenCV 库都将对图像处理和计算机视觉领域的研究生,研究人员和计算机程序员很感兴趣。 该库已在科学家和学者中广受欢迎,因为该库提供了许多最新的计算机视觉算法。

此外,它通常用作计算机视觉和机器学习的教学工具。 应该考虑到 OpenCV 足够强大以支持实际应用。 因此,OpenCV 可以用于非商业和商业产品。 例如,它被 Google,Microsoft,Intel,IBM,Sony 和 Honda 等公司使用。 MIT,CMU 或 Stanford 等一流大学的研究所为库提供支持。 OpenCV 已被世界各地采用。 它的下载量超过 1400 万,社区中的人口超过 47,000。

OpenCV 应用

OpenCV 正在广泛的应用中使用:

  • 2D 和 3D 特征工具包
  • 街景图像拼接
  • 自我估计
  • 面部识别系统
  • 手势识别
  • 人机交互
  • 移动机器人
  • 运动理解
  • 对象识别
  • 自动化检查和监视
  • 分割与识别
  • 立体视觉 – 两台摄像机的深度感知
  • 医学图像分析
  • 运动结构
  • 运动追踪
  • 增强现实
  • 视频/图像搜索和检索
  • 机器人和无人驾驶汽车的导航和控制
  • 驾驶员嗜睡和注意力分散检测

为什么在您的研究工作中引用 OpenCV

如果您在研究中使用 OpenCV,建议您引用 OpenCV 库。 这样,其他研究人员可以更好地理解您提出的算法并重现您的结果,从而获得更好的信誉。 此外,OpenCV 将增加反响,从而产生更好的计算机视觉库。 以下代码显示了引用 OpenCV 的 BibTex 条目:

@article{opencv_library,
 author = {Bradski, G.},
 citeulike-article-id = {2236121},
 journal = {Dr. Dobb's Journal of Software Tools},
 keywords = {bibtex-import},
 posted-at = {2008-01-15 19:21:54},
 priority = {4},
 title = {{The OpenCV Library}},
 year = {2000}
}

安装 OpenCV,Python 和其他包

OpenCV,Python 和 AI 相关的包可以安装在大多数操作系统上。 我们将看到如何通过不同的方法来安装这些包。

在选择最适合您需要的安装选项之前,请确保检查出不同的安装选项。

另外,由于这些文档的普及,在本章的最后对 Jupyter 笔记本进行了介绍,可以运行 Jupyter 笔记本进行数据分析。

全局安装 Python,OpenCV 和其他包

在本节中,您将看到如何全局安装 Python,OpenCV 和任何其他包。 给出了针对 Linux 和 Windows 操作系统的特定说明。

安装 Python

我们将看到如何在 Linux 和 Windows 操作系统上全局安装 Python。

在 Linux 上安装 Python

在 Debian 衍生产品(例如 Ubuntu)上,使用 APT 安装 Python。 之后,建议升级 pip 版本。 PIPPyPA 推荐的安装 Python 包的工具:

$ sudo apt-get install python3.7 $ sudo pip install --upgrade pip

要验证 Python 是否已正确安装,请打开命令提示符或 shell 并运行以下命令:

$ python3 --version
 Python 3.7.0

在 Windows 上安装 Python

转到这里。 Python Windows 的默认安装程序是 32 位。 启动安装程序。 选择自定义安装:

在下一个屏幕上,应检查所有可选功能:

最后,在下一个屏幕上,确保选中将 Python 添加到环境变量和预编译标准库。 (可选)您可以自定义安装位置,例如C:\Python37

按下“安装”按钮,几分钟后,安装就准备就绪。 在安装程序的最后一页,您还应该按禁用路径长度限制:

要检查 Python 是否已正确安装,请按住Shift键,然后在桌面上的鼠标右键单击。 在此处选择“打开命令窗口”。 或者,在 Windows 10 上,使用左下方的搜索框搜索cmd。 现在,在命令窗口中写入python,然后按Enter键。 您应该会看到以下内容:

您还应该升级点子:


 $ python -m pip install --upgrade pip

安装 OpenCV

现在,我们将在 Linux 和 Windows 操作系统上安装 OpenCV。 首先,我们将了解如何在 Linux 上安装 OpenCV,然后如何在 Windows 上安装 OpenCV。

在 Linux 上安装 OpenCV

确保已安装 NumPy。 要安装 NumPy,请输入以下内容:

$ pip3 install numpy

然后安装 OpenCV:

$ pip3 install opencv-contrib-python

此外,我们可以安装 Matplotlib,这是一个生成高质量图形的 Python 图形库:

$ pip3 install matplotlib

在 Windows 上安装 OpenCV

确保已安装 NumPy。 要安装 NumPy,请输入以下内容:

 $ pip install numpy

然后安装 OpenCV:

$ pip install opencv-contrib-python

此外,我们可以安装 Matplotlib:

$ pip install matplotlib

测试安装

一种测试安装的方法是执行 OpenCV Python 脚本。 为此,在特定的文件夹中应该有两个文件logo.pngtest_opencv_installation.py

打开一个 cmd 并转到这两个文件所在的路径。 接下来,我们可以通过键入以下内容来检查安装:

python test_opencv_installation.py

您应该同时看到 OpenCV RGB 徽标和 OpenCV 灰度徽标:

在这种情况下,安装成功。

使用 Virtualenv 安装 Python,OpenCV 和其他包

virtualenv是一种非常流行的工具,可为 Python 库创建隔离的 Python 环境。 virtualenv允许多个具有不同(有时是相互冲突)要求的 Python 项目。 从技术上讲,virtualenv通过在目录下安装一些文件来工作(例如env/)。

另外,virtualenv修改PATH环境变量以在其前面添加自定义二进制目录(例如env/bin/)。 此外,Python 或 Python3 二进制文件的精确副本位于此目录中。 激活此虚拟环境后,您可以使用 PIP 在虚拟环境中安装包。 PyPA 也推荐virtualenv。 因此,我们将看到如何使用虚拟环境安装 OpenCV 或任何其他包。

通常,pipvirtualenv是仅需要全局安装的两个包。 这是因为,一旦安装了两个包,就可以在虚拟环境中完成所有工作。 实际上,virtualenv实际上就是您所需要的,因为此包提供了pip的副本,该副本被复制到您创建的每个新环境中。

现在,我们将看到如何安装,激活,使用和停用虚拟环境。 现在为 Linux 和 Windows 操作系统提供了特定的命令。 我们不会为每个操作系统添加一个特定的部分,因为每个过程都非常相似。 让我们开始安装virtualenv

$ pip install virtualenv

在此目录(env)中,创建了一些文件和文件夹,其中包含运行 python 应用所需的全部内容。 例如,新的 python 可执行文件将位于/env/scripts/python.exe。 下一步是创建一个新的虚拟环境。 首先,将目录更改为项目目录的根目录。 第二步是使用virtualenv命令行工具创建环境:

$ virtualenv env

在这里,env是您要在其中创建虚拟环境的目录的名称。 通常的惯例是在env中调用要创建虚拟环境的目录,并将其放入项目目录中。 这样,如果将代码保留在~/code/myproject/,则环境将在~/code/myproject/env/

下一步是使用命令行工具激活刚刚创建的env环境,以执行activate脚本,该脚本位于以下位置:

  • ~/code/myprojectname/env/bin/activate(Linux)
  • ~/code/myprojectname/env/Scripts/activate(Windows)

例如,在 Windows 下,您应该键入以下内容:

$ ~/code/myprojectname/env/Scripts/activate
 (env) $

现在,您只能为此激活的环境安装所需的包。 例如,如果要安装使用 Python 编写的 Django(这是一个免费的开放源 Web 框架),则应输入以下内容:

(env)$ pip install Django

请记住,此包仅会为myprojectname项目安装。

您还可以通过执行以下操作来停用环境:

$ deactivate $

您应该看到已经返回到正常提示,表明您不再处于任何virtualenv中。 最后,如果要删除环境,只需键入以下内容:

$ rmvirtualenv test

使用 Python IDE 和 Virtualenv 创建虚拟环境

在下一节中,我们将使用 PyCharm(一个 Python IDE)创建虚拟环境。 但是在此之前,我们将讨论 IDE。 IDE 是一种软件应用,可帮助计算机程序员进行软件开发。 IDE 提供了一个程序,可以完成所有开发。 与 Python IDE 结合,可以找到两种方法:

  • 具有 Python 支持的常规编辑器和 IDE
  • 特定于 Python 的编辑器和 IDE

在第一类(通用 IDE)中,应突出一些示例:

  • Eclipse + PyDev
  • Visual Studio + 适用于 Visual Studio 的 Python 工具
  • Atom + Python 扩展

在第二类中,这是一些特定于 Python 的 IDE:

  • PyCharm:Python 最好的全功能,专用 IDE 之一。 PyCharm 可在 Windows,MacOS 和 Linux 平台上快速轻松地安装。 它实际上是 Python IDE 环境。
  • Spyder:Anaconda 包管理器发行版附带的 Spyder 是一种开源 Python IDE,非常适合数据科学工作流程。
  • Thonny:Thonny 旨在成为初学者的 IDE。 它适用于所有主要平台(Windows,macOS,Linux),并在网站上提供了安装说明。

在这种情况下,我们将安装 PyCharm(实际上是 Python IDE 环境)社区版。 之后,我们将看到如何使用此 IDE 创建虚拟环境。 可以从这里下载 PyCharm。 PyCharm 可以安装在 Windows,MacOS 和 Linux 上:

安装 PyCharm 之后,我们就可以使用它了。 使用 PyCharm,我们可以以非常简单直观的方式创建虚拟环境。

通过 PyCharm,可以使用virtualenv工具创建特定于项目的隔离虚拟环境。 此外,virtualenv工具与 PyCharm 捆绑在一起,因此用户不需要安装它。

打开 Pycharm 后,您可以单击“创建新项目”。 如果要创建新环境,则应单击Project Interpreter: New Virtualenv环境。 然后单击使用 Virtualenv 的新环境。 在下一个屏幕截图中可以看到:

您应注意,虚拟环境的名称(默认为 PyCharm)为venv,位于项目文件夹下。 在这种情况下,项目名为test-env-pycharm,虚拟环境venv位于test-env-pycharm/venv。 此外,您可以看到venv名称可以根据您的喜好进行更改。

当您单击创建按钮时,PyCharm 会加载项目并创建虚拟环境。 您应该会看到以下内容:

创建项目后,只需单击几下就可以安装包。 单击文件,然后单击设置...(Ctrl + Alt + S)。 将出现一个新窗口,显示如下内容:

现在,单击Project:,然后选择Project Interpreter。 在此屏幕的右侧,显示已安装的包以及所选的项目解释器。 您可以在此屏幕顶部进行更改。 选择适当的解释器(以及项目的环境)后,您可以安装新的包。 为此,您可以在左上角的输入框中搜索。 在下一个屏幕截图中,您可以看到一个搜索numpy包的示例:

您可以通过单击“安装包”来安装包(默认为最新版本)。 您还可以指定一个具体版本,如上一个屏幕截图所示:

安装该包之后,我们可以看到我们现在在虚拟环境中已经安装了三个包。 此外,在环境之间进行更改非常容易。 您应该转到运行/调试配置,然后单击 Python 解释器以在环境之间进行切换。 下一个屏幕截图中可以看到此功能:

最后,您可能已经注意到,在第一步中,使用 PyCharm 创建虚拟环境时,可以使用virtualenv以外的其他选项。 PyCharm 使您能够使用 Virtualenv,Pipenv 和 Conda 创建虚拟环境:

先前我们介绍了 Virtualenv,以及如何使用此工具为 Python 库创建隔离的 Python 环境。

Pyenv 用于隔离 Python 版本。 例如,您可能想针对 Python 2.6、2.7、3.3、3.4 和 3.5 测试代码,因此您将需要一种在它们之间切换的方法。

Conda 是在 Windows,MacOS 和 Linux 上运行的开源包管理和环境管理系统(提供虚拟环境功能)。 Conda 包含在 Anaconda 和 Miniconda 的所有版本中。

由于读者可能会对与 Anaconda/Miniconda 和 Conda 的合作感兴趣,因此在下一节中将进行快速介绍,但是不必运行本书中包含的代码示例。

Anaconda/Miniconda 发行版和 Conda 包以及环境管理系统

Conda 是一个开源的包管理和环境管理系统(提供虚拟环境功能),可在许多操作系统(例如 Windows,macOS 和 Linux)上运行。 Conda 安装,运行和更新包及其依赖项。 Conda 可以创建,保存,加载和在环境之间切换。

由于 Conda 包含在 Anaconda 和 Miniconda 的所有版本中,因此您应该已经安装了 Anaconda 或 Miniconda。

Anaconda 是可下载,免费,开源的高性能 Python 和 R 发行版。 Anaconda 随附 Conda,Conda 构建,Python 和 100 多个开源科学包及其依赖项。 使用conda install命令,您可以轻松地从 Anaconda 存储库安装用于数据科学的流行开源包。 Miniconda 是 Anaconda 的小型版本,仅包含 Conda,Python,它们依赖的包以及少量其他有用的包。

安装 Anaconda 或 Miniconda 很容易。 为了简单起见,我们将重点放在 Anaconda 上。 要安装 Anaconda,请检查操作系统的 Acadonda 安装程序。 Anaconda 5.2 可以在 Windows,MacOS 和 Linux 上的 Python 3.6 和 Python 2.7 版本中安装:

完成安装后,为了测试安装,请在终端或 Anaconda 提示符中运行以下命令:

$ conda list

为了成功安装,将显示已安装包的列表。 如前所述,Anaconda(和 Miniconda)附带了 Conda,它是一个简单的包管理器,类似于 Linux 上的apt-get。 这样,我们可以使用以下命令在终端中安装新包:

$ conda install packagename

在这里,packagename是我们要安装的包的实际名称。 可以使用以下命令更新现有包:

$ conda update packagename

我们还可以使用以下命令搜索包:

$ anaconda search –t conda packagename

这将显示单个用户可以使用的包的完整列表。 然后可以如下安装来自名为username的用户的名为packagename的包:

$ conda install -c username packagename

此外,Conda 可用于创建和管理虚拟环境。 例如,创建test环境并安装 NumPy 1.7 版就像输入下一个命令一样简单:

$ conda create --name test numpy=1.7

与使用virtualenv的方式类似,可以激活和停用环境。 要在 MacOS 和 Linux 上执行此操作,只需运行以下命令:

$ source activate test
 $ python
 ...
 $ source deactivate

在 Windows 上,运行以下命令:

$ activate test
 $ python
 ...
 $ deactivate

有关使用 Conda 的最重要信息的单页摘要,请参见 Conda 备忘单 PDF(1 MB)

最后,应该指出的是,我们可以在 PyCharm IDE 下使用 Conda,就像virtualenv一样创建和管理虚拟环境,因为 PyCharm 可以同时使用这两种工具。

科学计算,数据科学,机器学习,深度学习和计算机视觉的包

到目前为止,我们已经了解了如何从头开始安装 Python,OpenCV 和其他一些包(numpymatplotlib),或使用 Anaconda 发行版,其中包括许多流行的数据科学包。 这样,有关科学计算,数据科学,机器学习和计算机视觉的主要包的一些知识是关键点,因为它们提供了强大的计算工具。 在本书中,将使用许多 Python 包。 并非本节中所有引用的包都将提供,但是为了完整起见,提供了一个完整的列表,以显示 Python 在与本书内容相关的主题中的潜力:

  • NumPy 支持大型多维数组。 NumPy 是计算机视觉中的关键库,因为图像可以表示为多维数组。 将图像表示为 NumPy 数组具有许多优点。
  • OpenCV 是一个开源计算机视觉库。
  • Scikit-Imnage 是图像处理算法的集合。 scikit-image 操纵的图像只是 NumPy 数组。
  • Python 图像库PIL是一种图像处理库,它提供了强大的图像处理和图形功能。
  • Pillow 是 Alex Clark 及其贡献者友好的 PIL 叉子。 PIL 为您的 Python 解释器添加了图像处理功能。
  • SimpleCV 是计算机视觉的框架,提供了用于处理图像处理的关键功能。
  • Mahotas 是 Python 中用于图像处理和计算机视觉的一组功能。 它最初是为生物图像信息学设计的。 但是,它在其他领域也很有用。 它完全基于 numpy 数组作为其数据类型。
  • Ilastik 是一种用于交互式图像分割,分类和分析的用户友好型简单工具。
  • Scikit-learn)是一种机器学习库,具有各种分类,回归和聚类算法。
  • SciPy 是一个用于科学和技术计算的库。
  • NLTK 是一组用于处理人类语言数据的库和程序。
  • spaCy 是一个用于在 Python 中进行高级自然语言处理的开源软件库。
  • LibROSA 是一个用于音乐和音频处理的库。
  • Pandas 是一个库(基于 NumPy 构建),提供了高级数据计算工具和易于使用的数据结构。
  • Matplotlib 是一个绘图库,可产生多种格式的具有出版物质量的图形。
  • Seaborn 是基于 Matplotlib 构建的图形库。
  • Orange 是面向新手和专家的开源机器学习和数据可视化工具包。
  • PyBrain是一种机器学习库,提供了易于使用的最新机器学习算法。
  • Milk 是一种机器学习工具包,专注于带有多个分类器的监督分类。
  • TensorFlow 是一个开源机器学习和深度学习库。
  • PyTorch 是一个开放源代码的机器学习和深度学习库。
  • Theano 是一个用于快速数学表达式,求值和计算的库,已编译为可在 CPU 和 CPU 上运行。 GPU 架构(深度学习的关键点)。
  • Keras 是一个高级深度学习库,可以在 TensorFlow,CNTK,Theano 或 Microsoft 认知工具包之上运行。
  • Django 是基于 Python 的免费和开源 Web 框架,鼓励快速开发和简洁实用的设计。
  • Flask 是一个基于 Werkzeug 和 Jinja 2 用 Python 编写的微型 Web 框架。

所有这些包都可以根据其主要目的进行组织:

  • 处理图像:NumPy,OpenCV,Scikit-image,PIL 枕头,SimpleCV,Mahotas,ilastik
  • 处理文本:NLTK,spaCy,NumPy,scikit-learn,PyTorch
  • 处理音频:LibROSA
  • 解决机器学习问题:Pandas,Scikit-learn,Orange,PyBrain,牛奶
  • 清楚地查看数据:Matplotlib,Seaborn,scikit-learn,Orange
  • 深度学习:TensorFlow,Pytorch,Theano,Keras
  • 科学计算:SciPy
  • 集成 Web 应用:Django,Flask

可以在这个页面上找到用于 AI 和机器学习的其他 Python 库和包。

Jupyter 笔记本

Jupyter 笔记本是一个开源 Web 应用,允许您通过 Web 浏览器编辑和运行文档。 这些文档称为笔记本文档(或笔记本),包含代码(支持 40 多种编程语言,包括 Python)和富文本元素(段落,方程式,图形)。 Jupyter 笔记本可以在本地计算机上执行,也可以安装在远程服务器上。 您可以从笔记本开始,在线尝试它们,也可以安装 Jupyter 笔记本。

在线尝试 Jupiter 笔记本

首先,转到这里。 您将看到如下内容:

要在线尝试使用 Python 的 Jupyter,请单击 Python 选项,或将此 URL 粘贴到 Web 浏览器中:https://mybinder.org/v2/gh/ipython/ipython-in-depth/master?filepath=binder/Index.ipynb。 页面加载后,即可开始编码/加载笔记本。

安装 Jupyter 笔记本

要安装 Jupyter,您可以按照这个页面上的主要步骤进行操作。 Jupyter 笔记本的安装也可以使用 Anaconda 或使用 Python 的包管理器 PIP 完成。

使用 Anaconda 安装 Jupyter

强烈建议您使用 Anaconda 发行版安装 Python 和 Jupyter,该发行版包括 Python,Jupyter 笔记本和其他用于科学计算和数据科学的常用包。 要使用 Anaconda 安装 Jupyter,请下载 Anaconda 并进行安装。 这样,您已经安装了 Jupyter 笔记本。 要运行笔记本,请在命令提示符(Windows)或终端(macOS/Linux)中运行以下命令:

$ jupyter notebook

使用 PIP 安装 Jupyter

您还可以通过运行以下命令,使用 Python 的包管理器 PIP 安装 Jupyter:

$ python -m pip install --upgrade pip
$ python -m pip install jupyter

此时,您可以通过运行以下命令来启动笔记本服务器:

$ jupyter notebook

上一个命令将向您显示与笔记本服务器有关的一些关键信息,包括 Web 应用的 URL(默认为http://localhost:8888)。 然后它将打开您的默认 Web 浏览器到该 URL。 要启动特定的笔记本,应使用以下命令:

$ jupyter notebook notebook.ipynb

这是笔记本的快速介绍。 在下一章中,我们将创建一些笔记本,因此您将有机会使用它们,并充分了解此有用的工具。

OpenCV 和 Python 项目结构

项目结构是组织文件夹中所有文件的方式,以使项目最好地实现目标。 我们将从一个.py脚本(sampleproject.py)开始,该脚本应与其他文件一起使用,以完成有关此脚本的信息-依赖关系,许可证,如何安装或如何对其进行测试。 构建此基本项目的常用方法如下:

sampleproject/
│
├── .gitignore
├── sampleproject.py
├── LICENSE
├── README.rst
├── requirements.txt
├── setup.py
└── tests.py

sampleproject.py-如果您的项目只是一个 Python 源文件,则将其放入目录中并为其命名与您的项目相关的名称。

README.rst.md扩展名)用于注册项目的主要属性,至少应包括以下内容:

  • 您的项目做什么
  • 如何安装
  • 用法示例
  • 如何建立开发环境
  • 如何发布 ISSUE
  • 变更记录
  • 许可证和作者信息

可以从以下 GitHub 存储库下载可以使用的模板。 有关更多信息,请参见这里

LICENSE.md文档包含适用的许可证。 除了源代码本身之外,这可以说是存储库中最重要的部分。 完整的许可证文本和版权声明应存在于此文件中。 如果您要分发代码,最好有一个。 通常, GNU 通用公共许可证GPLMIT 许可证在开源项目中使用。 如果您不确定应将哪个许可证应用于您的项目,可以访问这里

应将requirements.txt PIP 要求文件放在存储库的根目录中,用于指定项目所需的依赖关系。 可以使用以下方法生成requirements.txt文件:

$ pip freeze > requirements.txt

要安装这些要求,可以使用以下命令:

$ pip install -r requirements.txt

setup.py文件使您可以创建可以重新分发的包。 该脚本旨在将包安装在最终用户的系统上,而不是像pip install -r < requirements.txt那样准备开发环境。 这是一个关键文件,因为它定义了包的信息(例如版本,包要求和项目描述)。

tests.py脚本包含测试。

.gitignore文件告诉 Git 忽略什么类型的文件,例如 IDE 混乱或本地配置文件。 您可以在这个页面上找到 Python 项目的示例.gitignore文件。

我们的第一个 Python 和 OpenCV 项目

基于上一节中显示的最小项目结构,我们将创建我们的第一个 Python 和 OpenCV 项目。 该项目具有以下结构:

helloopencv/
│
├── images/
│
├── .gitignore
├── helloopencv.py
├── LICENSE
├── README.rst
├── requirements.txt
├── setup.py
└── helloopencvtests.py

README.rst.rst扩展名)遵循基本结构,如上一节所示。 Python 和 ReStructuredTextRST)紧密相连-RST 是 docutils 和狮身人面像的格式(实际上是用于记录 python 代码的标准)。 RST 既用于通过文档字符串来记录对象,又用于编写其他文档。 如果您访问 Python 的官方文档,则可以查看每个页面的 RST 源。 对README.rst使用 RST 使其与整个文档设置直接兼容。 实际上,README.rst通常是项目文档的封面。

有一些 RST 编辑器可用来帮助您编写README.rst。 您也可以使用一些在线编辑器。 例如,在线 Sphinx 编辑器是一个不错的选择

.gitignore文件指定 Git 应该忽略的故意未跟踪的文件.gitignore告诉git Git 应该忽略哪些文件(或模式)。 通常用于避免从您的工作目录中提交对其他协作者无用的临时文件,例如 IDE 创建的编译产品和临时文件。 打开这个页面以查看可以包含在 Python 项目中的.gitignore文件。

setup.py(有关详细说明,请参见上一节),它是 Python 文件,通常随库或程序一起提供,也使用 Python 编写。 其目的是正确安装软件。 可以在这个页面上看到此文件的非常完整的示例,其中包含许多注释,可帮助您了解如何适配它来满足您的需求。 此文件由 Python 包装规范PyPa提出。 一个关键点是与的选项相关,正如我们可以在上述setup.py文件中看到的那样。

如果您的项目很简单,则可以在此处手动指定包目录。 或者,您可以使用find_packages()。 另外,如果您只想分发一个 Python 文件,请改为使用py_modules参数,如下所示,这将期望存在一个名为my_module.py的文件 py_modules=["my_module"]

因此,在我们的情况下,使用py_modules =["helloopencv"]

此外,setup.py允许您轻松安装 Python 包。 通常,编写以下内容就足够了:

$ python setup.py install

因此,如果要安装此简单包,可以在helloopencv文件夹中编写上一个命令python setup.py install。 例如,在 Windows 中,运行以下命令:

C:\...\helloopencv>python setup.py install

您应该会看到以下内容:

 running install
 ...
 ...
 Installed c:\python37\lib\site-packages\helloopencv-0.1-py3.7.egg
 Processing dependencies for helloopencv==0.1
 ...
 ...
 Finished processing dependencies for helloopencv==0.1

完成后,helloopencv已安装在我们的系统中(与其他任何 Python 包一样)。 您还可以在helloopencv文件夹内使用pip install安装helloopencv。 例如,在 Windows 中,运行以下命令:

C:\...\helloopencv>pip install .

您应该会看到以下内容:

 Processing c:\...\helloopencv
 ...
 ...
 Successfully installed helloopencv-0.1

这表示helloopencv已成功安装。 要使用此包,我们可以编写一个 Python 文件并导入helloopencv包。 另外,我们可以通过直接从 Python 解释器导入来快速使用此包。 按照第二种方法,您可以打开命令提示符,导入包并使用它。 首先,打开命令提示符,然后键入python以运行解释器:

C:\...\helloopencv>python
Python 3.7.0 (v3.7.0:1bf9cc5093, Jun 27 2018, 04:06:47) [MSC v.1914 32 bit (Intel)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>>

加载解释器后,我们可以导入包:

>>> import helloopencv
helloopencv.py is being imported into another module
>>> 

helloopencv.py is being imported into another module输出是来自helloopencv包(特别是来自helloopencv.py文件)的消息,指示已导入此文件。 因此,此消息表明模块已成功导入。 导入后,我们就可以使用它。 例如,我们可以调用show_message方法:

>>> helloopencv.show_message()
'this function returns a message'
>>>

我们可以看到,调用此方法的结果是一条消息显示在屏幕上。 此方法是一种简单的方法,它知道所有内容均已正确安装,因为它涉及到安装,导入和使用包中的函数。 此外,我们可以调用helloopencv包中包含的更有用的方法。 例如,您可以调用load_image方法从磁盘加载图像,然后,可以使用show_image方法显示它:

>>> image = helloopencv.load_image("C:/.img/logo.png")
>>> helloopencv.show_image(image)

此处,load_image函数的参数是计算机图像的路径。 在这种情况下,将加载logo.png图像。 调用show_image方法后,应显示图像。 要关闭窗口,必须按下一个键。 然后,您应该能够再次在解释器中编写。 要查看helloopencv包中可用的所有方法,可以使用喜欢的编辑器或 IDE 打开helloopencv.py文件并进行查看。 在此 Python 文件中,您可以看到一些符合我们第一个 Python 项目的方法:

  • show_message():此函数打印this function returns a message消息。
  • load_image():此函数从其路径加载图像。
  • show_image():加载图像后,此函数会显示图像。
  • convert_to_grayscale():此函数在加载图像后将其转换为灰度。
  • write_image_to_disk():此函数将图像保存在磁盘上。

所有这些方法都执行简单且基本的操作。 它们中的大多数都使用 OpenCV 库,该库在此文件(import cv2)的开头导入。 不必担心此文件中包含的 Python 代码,因为仅执行基本操作和对 OpenCV 库的调用。

您无需安装包即可执行helloopencv.py脚本。 要执行此文件,应在打开命令提示符后运行python helloopencv.py命令:

 C:\...\helloopencv>python helloopencv.py
 helloopencv.py is being run directly

执行完该文件后,将显示helloopencv.py is being run directly消息,这意味着该文件将直接执行,而不是从其他模块或包(或 Python 解释器)导入。 您还可以看到已加载并显示图像。 您可以按任意键继续执行。 再次显示徽标的灰度版本,应再次按下任何键以结束执行。 将灰度图像保存到磁盘后,执行结束。

最后,helloopencvtests.py文件可用于单元测试。 测试应用已成为任何合格开发人员的标准技能。 Python 社区支持测试,Python 标准库具有良好的内置工具来支持测试

在 Python 生态系统中,有很多测试工具。 [用于测试的两个最常见的包是nose](https://pypi.org/project/nose/)和[pytest](https://pypi.org/project/pytest/)。 在第一个 Python 项目中,我们将使用pytest`进行单元测试。

要执行测试,请在打开命令提示符后运行py.test -s -v helloopencvtests.py命令:

C:\...\helloopencv>py.test -s -v helloopencvtests.py
============================= test session starts =============================
 platform win32 -- Python 3.7.0, pytest-3.8.0, py-1.6.0, pluggy-0.7.1 -- c:\python37\python.exe
 cachedir: .pytest_cache
 collected 4 items
 helloopencvtests.py::test_show_message testing show_message
 PASSED
 helloopencvtests.py::test_load_image testing load_image
 PASSED
 helloopencvtests.py::test_write_image_to_disk testing
 write_image_to_disk
 PASSED
 helloopencvtests.py::test_convert_to_grayscale testing    test_convert_to_grayscale
 PASSED
========================== 4 passed in 0.57 seconds      ===========================

执行测试后,您可以看到执行了四个测试。 PASSED消息表示测试已成功执行。 这是 Python 单元测试的快速介绍。 不过,完整的pytest文档可在这个页面中找到。

总结

在第一章中,我们介绍了设置 OpenCV 和 Python 以构建您的计算机视觉项目的主要步骤。 在本章开始时,我们快速浏览了本书的主要概念-人工智能,机器学习,神经网络和深度学习。 然后,我们探索了 OpenCV 库,包括该库的历史及其主要模块。 由于 OpenCV 和其他包可以在许多操作系统中以不同的方式安装,因此我们介绍了主要方法。

具体来说,我们看到了如何在全局或虚拟环境中安装 Python,OpenCV 和其他包。 在安装包时,我们介绍了 Anaconda/Miniconda 和 Conda,因为我们还可以创建和管理虚拟环境。 此外,Anaconda/Miniconda 附带了许多开源科学包,包括 SciPy 和 NumPy。

我们探索了用于科学计算,数据科学,机器学习和计算机视觉的主要包,因为它们提供了强大的计算工具。 然后,我们讨论了 Python 特定的 IDE,包括 PyCharm(实际上是 Python IDE 环境)。 PyCharm(和其他 IDE)可以帮助我们以非常直观的方式创建虚拟环境。 我们还研究了 Jupyter 笔记本,因为它可能是本书读者的一个很好的工具。 在下一章中,将创建更多的 Jupyter 笔记本,以使您更好地了解此有用的工具。 最后,我们探索了 OpenCV 和 Python 项目结构,涵盖了应包含的主要文件。 然后,我们构建了第一个 Python 和 OpenCV 示例项目,在其中我们看到了构建,运行和测试该项目的命令。

在下一章中,您将开始熟悉 OpenCV 库,从而开始编写第一个脚本。 您将看到开始对计算机视觉项目进行编码的一些基本概念(例如,了解主要图像概念,OpenCV 中的坐标系以及 OpenCV 中的访问和操纵像素)。

问题

  1. 什么是虚拟环境?
  2. PIP,Virtualenv,Pipenv,Anaconda 和 Conda 之间有什么联系?
  3. 什么是 Jupyter 笔记本?
  4. 在 Python 中使用计算机视觉的主要包是什么?
  5. pip install -r requirements.txt有什么作用?
  6. 什么是 IDE?为什么在开发项目时使用 IDE?
  7. OpenCV 以什么协议发布?

进一步阅读

以下参考资料将帮助您更深入地了解本章中介绍的概念:

查看这些参考资料(主要是书籍),以获取有关概念的更多信息,这些概念将在本书的后续章节中介绍。 保持此清单方便; 这将非常有帮助:


我们一直在努力

apachecn/AiLearning

【布客】中文翻译组