Release 版本: v1.0
发布日期: 2024-09-30
主要功能:
此版本是 Video2Tag 的第一个稳定版本,包含以下主要功能:
- 视频处理: 支持批量处理视频,将视频分辨率格式化和抽帧,方便数据集制作和分析。
- 数据集合并: 支持将多个 VOC 数据集合并为一个统一的数据集,提高数据集的整合效率。
- 数据增强: 提供数据集的自动增强功能,通过图像增强和转换,提升模型训练效果。
环境设置和依赖:
- 适用于 Python 3.9 版本。
- 使用
conda
来创建虚拟环境并管理依赖,具体安装说明请参见 README。 - 依赖项通过
pip
安装,具体依赖见requirements.txt
文件。
打包与发布:
- 使用
Nuitka
打包成独立可执行文件,无需安装 Python 环境即可运行。 - 打包命令和详细步骤可以在 README 中找到。
已知问题:
- 尚未支持非 VOC 格式、非video2tag输出的数据集转换,未来版本将考虑加入。
未来计划:
- 增加数据集转化,类似转为给YOLO格式、COCO格式等。
- 提供更多的数据集增强策略。
- 增加对于非VOC特定格式的支持。