网友回复
我将带你从零开始,一步步完成“图像标注”和“图像识别(目标检测)”,并且包含可以直接运行的代码示例。
整个流程分为 四大步:
环境安装:准备好软件。
数据标注:制作你自己的数据集。
模型训练:让 YOLO 学会识别你的目标。
识别与测试:用训练好的模型进行预测。
第一步:环境安装与准备
你需要 Python 环境和几个库。我们用最简单的方式安装。
安装 Python:确保你的电脑上安装了 Python 3.8 或更高版本。
安装 YOLOv8 和 OpenCV:打开你的终端(Windows 用户是 CMD 或 PowerShell),输入一行命令即可:
pip install ultralytics opencv-python
安装标注工具 (LabelImg):这是一个简单好用的本地标注软件。
pip install labelImg
环境就搭好了,非常简单!
第二步:数据标注(核心步骤)
假设我们要训练一个模型来识别图片里的 猫 (cat) 和 狗 (dog)。
收集图片:
创建一个主文件夹,比如 My-Dataset。
在里面再创建一个 images 文件夹,把你找到的所有猫和狗的图片都放进去。图片越多、场景越丰富越好。
开始标注:
在终端输入 labelImg 命令,启动标注工具。
① 打开目录:点击 "Open Dir",选择刚才创建的 images 文件夹。
② 切换格式:点击左侧菜单的 "PascalVOC" 按钮,把它切换成 "YOLO" 格式。这是最关键的一步!
③ 开始画框:
点击 "Create RectBox" (或按快捷键 W)。
用鼠标在图片中的猫或狗身上画一个刚刚好框住目标的矩形框。
画完后,会弹出一个对话框让你输入标签名,比如输入 cat,然后点 OK。
继续为图片中所有的猫和狗画框。
④ 保存:点击 "Save" (或按快捷键 Ctrl+S)。你会发现,在你的 images 文件夹旁边,自动生成了一个 labels 文件夹,里面有一个和图片同名的 .txt 文件。这个就是 YOLO 的标签文件。
⑤ 重复:处理完一张图片后,点击 "Next Image",继续标注下一张,直到所有图片都标完。
标注完成后,你的目录结构应该是这样的:
My-Dataset/ ├── images/ │ ├── 001.jpg │ ├── 002.jpg │ └── ... └── labels/ ├── 001.txt ├── 002.txt └── ...
.txt 文件的内容是类似 0 0.5 0.5 0.2 0.3 这样的数字,你不需要手动修改它,这是 LabelImg 自动生成的。
第三步:模型训练
数据准备好了,现在开始训练。
整理数据集结构:YOLO 需要 train(训练集)和 val(验证集)...
点击查看剩余70%