制作目标检测模型
此教程介绍了如何制作目标检测模型。
介绍
目标检测 是常见的图像识别任务,它可以将图片中的多个目标的位置和尺寸识别出来。
data:image/s3,"s3://crabby-images/24781/247819a5fc24b309d3749c5aa7c5d202e9c9f044" alt="../_images/yolo_showcase.png"
前提条件
注册帐号,并登录。参考:账号管理
准备图片
图片是用来训练模型的,图片越多,模型的准确度就越高。
通常每个类别需要1000张图片,可以达到比较好的效果。
图片尽量覆盖所有可能的环境。
新建项目
data:image/s3,"s3://crabby-images/cf24f/cf24f865ec560a18afbb8c7d468dd0c1ce33f1e2" alt="../_images/project_create_step1.png"
data:image/s3,"s3://crabby-images/0774d/0774d20665e59aba0aec24355382f1aff07adb33" alt="../_images/project_create_step2_od.png"
data:image/s3,"s3://crabby-images/e575d/e575d5f45529dadab4eb9b8a87a49e9295275613" alt="../_images/project_create_step3.png"
在项目列表页面,点击Create New按钮。
选择对应的项目类型。
输入项目名字,点击Create按钮。
上传图片
data:image/s3,"s3://crabby-images/7ccc7/7ccc7aac2c500ff216f6e2fb9a6e19863c17c636" alt="../_images/dataset_upload_od.png"
在Image栏中,点击选取文件,选择要上传的图片。注:Yolo Labels不选择。
点击Upload,等待上传完毕。
创建标签
data:image/s3,"s3://crabby-images/4d727/4d727cc7d2e028ffa5e02d06160d3c524e79b9d8" alt="../_images/label_create.png"
点击左侧侧边栏中的Labels。
在new_label框中,输入目标的名字,比如cat。然后点击ADD。
如果有多个标签,添加多个名字。
data:image/s3,"s3://crabby-images/925f9/925f9040706a3d26307be537e0acdc6b7eb61710" alt="../_images/label_list.png"
标注
点击左侧侧边栏中的Annotation。
点击要标注的标签名字。
data:image/s3,"s3://crabby-images/da1ea/da1eaa2845c0eea2a646c98fe9e21dafc42e25ee" alt="../_images/anno_cat_select.png"
然后在画面中拖拽一个框,把目标覆盖住。
data:image/s3,"s3://crabby-images/44115/441153c98470528ce90ea130499d14751e77e583" alt="../_images/box_cat.png"
使用同样的步骤,标注所有的对象。
data:image/s3,"s3://crabby-images/b85bb/b85bbb227f8fc127ae61b1bf06cbb2b375ce74f9" alt="../_images/anno_dog_select.png"
data:image/s3,"s3://crabby-images/a24df/a24df005dee7bd3a8dbfda70f59e5df75ddd53e9" alt="../_images/box_dog.png"
点击save保存,会自动跳转到下一张。
data:image/s3,"s3://crabby-images/f4b28/f4b28bc19691d335fde7bcc0abf5e646424902c2" alt="../_images/anno_save.png"
将所有的图片按照上面的步骤标注完。这是最耗费时间的步骤,也是最关键的步骤。
提示
键盘快捷键可以大大加快标注的速度,参考:标注管理(目标检测)
训练
点击左侧侧边栏中的Train。
点击Submit,然后等待服务器训练。训练开始和完成时会自动刷新页面。
data:image/s3,"s3://crabby-images/b623a/b623a17469e6df47bf81d1f73aa65f100b07549e" alt="../_images/train_server_od.png"
参数和结果,参考:训练管理
下载模型
data:image/s3,"s3://crabby-images/30860/30860076a40557be10d14cff48fcab66828a50e5" alt="media/download_model.png"
下载后的文件可用于上传到SingTown AI Vision Module。参考:SingTown AI Vision Module