diff --git "a/docs_cn/Windows\347\216\257\345\242\203\345\270\270\350\247\201\351\227\256\351\242\230.md" "b/0_tutorials/docs_cn/Windows\347\216\257\345\242\203\345\270\270\350\247\201\351\227\256\351\242\230.md" similarity index 100% rename from "docs_cn/Windows\347\216\257\345\242\203\345\270\270\350\247\201\351\227\256\351\242\230.md" rename to "0_tutorials/docs_cn/Windows\347\216\257\345\242\203\345\270\270\350\247\201\351\227\256\351\242\230.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/0_introduction.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/0_introduction.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/0_introduction.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/0_introduction.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/10_IO.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/10_IO.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/10_IO.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/10_IO.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/1_basic.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/1_basic.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/1_basic.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/1_basic.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/2_ndarray.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/2_ndarray.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/2_ndarray.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/2_ndarray.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/3_index.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/3_index.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/3_index.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/3_index.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/4_ broadcast.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/4_ broadcast.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/4_ broadcast.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/4_ broadcast.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/5_math.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/5_math.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/5_math.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/5_math.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/6_arithmetic.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/6_arithmetic.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/6_arithmetic.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/6_arithmetic.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/7_statistic.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/7_statistic.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/7_statistic.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/7_statistic.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/8_sortCondition.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/8_sortCondition.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/8_sortCondition.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/8_sortCondition.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/9_matrix.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/9_matrix.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/9_matrix.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/9_matrix.md" diff --git "a/docs_cn/\345\274\225\346\223\216\351\205\215\347\275\256.md" "b/0_tutorials/docs_cn/\345\274\225\346\223\216\351\205\215\347\275\256.md" similarity index 100% rename from "docs_cn/\345\274\225\346\223\216\351\205\215\347\275\256.md" rename to "0_tutorials/docs_cn/\345\274\225\346\223\216\351\205\215\347\275\256.md" diff --git "a/docs_cn/\346\200\247\350\203\275\344\274\230\345\214\226\345\270\270\350\247\201\351\227\256\351\242\230.md" "b/0_tutorials/docs_cn/\346\200\247\350\203\275\344\274\230\345\214\226\345\270\270\350\247\201\351\227\256\351\242\230.md" similarity index 100% rename from "docs_cn/\346\200\247\350\203\275\344\274\230\345\214\226\345\270\270\350\247\201\351\227\256\351\242\230.md" rename to "0_tutorials/docs_cn/\346\200\247\350\203\275\344\274\230\345\214\226\345\270\270\350\247\201\351\227\256\351\242\230.md" diff --git "a/docs_cn/\346\250\241\345\236\213\345\212\240\350\275\275\346\226\271\345\274\217.md" "b/0_tutorials/docs_cn/\346\250\241\345\236\213\345\212\240\350\275\275\346\226\271\345\274\217.md" similarity index 100% rename from "docs_cn/\346\250\241\345\236\213\345\212\240\350\275\275\346\226\271\345\274\217.md" rename to "0_tutorials/docs_cn/\346\250\241\345\236\213\345\212\240\350\275\275\346\226\271\345\274\217.md" diff --git a/docs_en/FAQ for windows.md b/0_tutorials/docs_en/FAQ for windows.md similarity index 100% rename from docs_en/FAQ for windows.md rename to 0_tutorials/docs_en/FAQ for windows.md diff --git a/docs_en/How to config engine.md b/0_tutorials/docs_en/How to config engine.md similarity index 100% rename from docs_en/How to config engine.md rename to 0_tutorials/docs_en/How to config engine.md diff --git a/docs_en/How to load model.md b/0_tutorials/docs_en/How to load model.md similarity index 100% rename from docs_en/How to load model.md rename to 0_tutorials/docs_en/How to load model.md diff --git a/docs_en/Performance tuning.md b/0_tutorials/docs_en/Performance tuning.md similarity index 100% rename from docs_en/Performance tuning.md rename to 0_tutorials/docs_en/Performance tuning.md diff --git a/docs_en/ndarray_guide_en/0_introduction.md b/0_tutorials/docs_en/ndarray_guide_en/0_introduction.md similarity index 100% rename from docs_en/ndarray_guide_en/0_introduction.md rename to 0_tutorials/docs_en/ndarray_guide_en/0_introduction.md diff --git a/docs_en/ndarray_guide_en/10_IO.md b/0_tutorials/docs_en/ndarray_guide_en/10_IO.md similarity index 100% rename from docs_en/ndarray_guide_en/10_IO.md rename to 0_tutorials/docs_en/ndarray_guide_en/10_IO.md diff --git a/docs_en/ndarray_guide_en/1_basic.md b/0_tutorials/docs_en/ndarray_guide_en/1_basic.md similarity index 100% rename from docs_en/ndarray_guide_en/1_basic.md rename to 0_tutorials/docs_en/ndarray_guide_en/1_basic.md diff --git a/docs_en/ndarray_guide_en/2_ndarray.md b/0_tutorials/docs_en/ndarray_guide_en/2_ndarray.md similarity index 100% rename from docs_en/ndarray_guide_en/2_ndarray.md rename to 0_tutorials/docs_en/ndarray_guide_en/2_ndarray.md diff --git a/docs_en/ndarray_guide_en/3_index.md b/0_tutorials/docs_en/ndarray_guide_en/3_index.md similarity index 100% rename from docs_en/ndarray_guide_en/3_index.md rename to 0_tutorials/docs_en/ndarray_guide_en/3_index.md diff --git a/docs_en/ndarray_guide_en/4_ broadcast.md b/0_tutorials/docs_en/ndarray_guide_en/4_ broadcast.md similarity index 100% rename from docs_en/ndarray_guide_en/4_ broadcast.md rename to 0_tutorials/docs_en/ndarray_guide_en/4_ broadcast.md diff --git a/docs_en/ndarray_guide_en/5_math.md b/0_tutorials/docs_en/ndarray_guide_en/5_math.md similarity index 100% rename from docs_en/ndarray_guide_en/5_math.md rename to 0_tutorials/docs_en/ndarray_guide_en/5_math.md diff --git a/docs_en/ndarray_guide_en/6_arithmetic.md b/0_tutorials/docs_en/ndarray_guide_en/6_arithmetic.md similarity index 100% rename from docs_en/ndarray_guide_en/6_arithmetic.md rename to 0_tutorials/docs_en/ndarray_guide_en/6_arithmetic.md diff --git a/docs_en/ndarray_guide_en/7_statistic.md b/0_tutorials/docs_en/ndarray_guide_en/7_statistic.md similarity index 100% rename from docs_en/ndarray_guide_en/7_statistic.md rename to 0_tutorials/docs_en/ndarray_guide_en/7_statistic.md diff --git a/docs_en/ndarray_guide_en/8_sortCondition.md b/0_tutorials/docs_en/ndarray_guide_en/8_sortCondition.md similarity index 100% rename from docs_en/ndarray_guide_en/8_sortCondition.md rename to 0_tutorials/docs_en/ndarray_guide_en/8_sortCondition.md diff --git a/docs_en/ndarray_guide_en/9_matrix.md b/0_tutorials/docs_en/ndarray_guide_en/9_matrix.md similarity index 100% rename from docs_en/ndarray_guide_en/9_matrix.md rename to 0_tutorials/docs_en/ndarray_guide_en/9_matrix.md diff --git a/1_image_sdks/README_CN.md b/1_image_sdks/README_CN.md new file mode 100644 index 00000000..efc5e658 --- /dev/null +++ b/1_image_sdks/README_CN.md @@ -0,0 +1,438 @@ + + + +#### 项目清单: + +- 1. 1_image_sdks - [图像识别 SDK] +```text + 1). 工具箱系列:图像处理工具箱(静态图像) + 2). 目标检测 + 3). 图像分割 + 4). GAN + 5). 其它类别:OCR等 + ... +``` + +
+
+
+ OCR工具箱 1:OCR方向检测与旋转 - ocr_sdks/ocr_direction_det_sdk + OCR图像预处理。 + |
+
+
+
+ ![]() |
+
+
+
+ OCR工具箱 2:OCR文字识别 - ocr_sdks/ocr_v3_sdk + 1. V3 文本检测:+ - 中文文本检测 + - 英文文本检测 + - 多语言文本检测 + 2. V3 文本识别: + - 中文简体 + - 中文繁体 + - 英文 + - 韩语 + - 日语 + - 阿拉伯 + - 梵文 + - 泰米尔语 + - 泰卢固语 + - 卡纳达文 + - 斯拉夫 + |
+
+
+
+ ![]() |
+
+
+
+ OCR工具箱 3:OCR文字识别 - ocr_sdks/ocr_v4_sdk + 原生支持旋转倾斜文本文字识别。 + |
+
+
+
+ ![]() |
+
+
+
+ OCR工具箱 4:版面分析 - ocr_sdks/ocr_layout_sdk + 可以用于配合文字识别,表格识别的流水线处理使用。+ 1. 中文版面分析 + 2. 英文版面分析 + 3. 中英文文档 - 表格区域检测 + |
+
+
+
+ ![]() |
+
+
+
+ OCR工具箱 5: 表格识别 - ocr_sdks/ocr_table_sdk + 中英文表格识别。 + |
+
+
+
+ ![]() |
+
+
+
+ OCR工具箱 6: led文字识别 - ocr_sdks/ocr_led_sdk + led表盘文字识别。 + |
+
+
+
+ ![]() |
+
+
+
+ 人脸工具箱 1:人脸检测(含5个人脸关键点) - face_sdks/face_detection_sdk + 人脸检测(含5个人脸关键点)提供了两个模型的实现。 + |
+
+
+
+ ![]() |
+
+
+
+ 人脸工具箱 2:人脸对齐- face_sdks/face_alignment_sdk + 根据人脸关键点对齐人脸。 + |
+
+
+
+ ![]() |
+
+
+
+ 人脸工具箱 3:人脸特征提取与比对- face_sdks/face_feature_sdk + 人脸识别完整的pipeline:人脸检测(含人脸关键点) --> 人脸对齐 --> 人脸特征提取 --> 人脸比对 + |
+
+
+
+ ![]() |
+
+
+
+ 人脸工具箱 4:人脸分辨率提升- face_sdks/face_sr_sdk + 包含两个功能:+ 1.单张人脸图片超分辨。 + 2.自动检测人脸,然后对齐人脸后提升分辨率。 + |
+
+
+
+ ![]() |
+
+
+
+ 人脸工具箱 5:图片人脸修复- face_sdks/face_restoration_sdk + - 自动检测人脸及关键地,然后抠图,然后根据人脸关键点转正对齐。+ - 对所有转正对齐的人脸提升分辨率。 + - 使用分割模型提取人脸,逆向变换后贴回原图。 + |
+
+
+
+ ![]() |
+
+
+
+ 人脸工具箱 6:口罩检测 - face_sdks/mask_sdk + 口罩检测,给出检测框。 + |
+
+
+
+ ![]() |
+
+
+
+ 动物分类识别 - classification/animal_sdk + 动物识别sdk,支持7978种动物的分类识别。 + |
+
+
+
+ ![]() |
+
+
+
+ 菜品分类识别 - classification/dish_sdk + 菜品识别sdk,支持8416种菜品的分类识别。 + |
+
+
+
+ ![]() |
+
+
+
+ 烟火检测 - fire_smoke_sdk + 烟火检测,给出检测框和置信度。 + |
+
+
+
+ ![]() |
+
+
+
+ 行人检测 - pedestrian_sdk + 行人检测,给出检测框和置信度。 + |
+
+
+
+ ![]() |
+
+
+
+ 反光衣检测 - reflective_vest_sdk + 实现施工区域或者危险区域人员穿戴检测。 + |
+
+
+
+ ![]() |
+
+
+
+ 智慧工地检测 - smart_construction_sdk + 支持检测的类别:人体,安全帽。 + |
+
+
+
+ ![]() |
+
+
+
+ 车辆检测 - vehicle_sdk + 车辆检测,给出检测框和置信度。 + |
+
+
+
+ ![]() |
+
+
+
+ 图片特征提取(512维)SDK - feature_extraction_sdk + 提取图片512维特征值,并支持图片1:1特征比对,给出置信度。 + |
+
+
+
+ ![]() |
+
+
+
+ 图像&文本的跨模态相似性比对检索 SDK【支持40种语言】 - image_text_40_sdk + -图像&文本特征向量提取+ -相似度计算 + -softmax计算置信度 + |
+
+
+
+ ![]() |
+
+
+
+ 图像矫正 - image_alignment_sdk + -自动检测边缘,透视变换转正+ |
+
+
+
+ ![]() |
+
+
+
+ 文本图像超分辨 - image_text_sr_sdk + -可以用于提升电影字幕清晰度。+ |
+
+
+
+ ![]() |
+
+
+
+ 图像超分辨(4倍)- super_resolution_sdk + -提升图片4倍分辨率。+ |
+
+
+
+ ![]() |
+
+
+
+ 黑白图片上色 - image_colorization_sdk + -应用到黑白图像中,从而实现黑白照片的上色。+ |
+
+
+
+ ![]() |
+
+
+
+ 一键抠图工具箱 - 1. 通用一键抠图 + - seg_unet_sdk+ -包括三个模型:满足不同精度,速度的要求。 + |
+
+
+
+ ![]() |
+
+
+
+ 一键抠图工具箱 - 2. 动漫一键抠图 + - seg_unet_sdk+ 无需手动绘制边界,大大提高了抠图的效率和精准度。应用场景如: + - 广告设计 + - 影视后期制作 + - 动漫创作等 + |
+
+
+
+ ![]() |
+
+
+
+ 一键抠图工具箱 - 3. 衣服一键抠图 + - seg_unet_sdk+ 衣服一键抠图应用场景可以在很多方面发挥作用,以下是一些简要介绍: + - 电子商务 + - 社交媒体 + - 广告设计 + - 时尚设计 + - 虚拟试衣 + |
+
+
+
+ ![]() |
+
+
+
+ 一键抠图工具箱 - 4. 人体一键抠图 + - seg_unet_sdk+ -人体一键抠图可以将人体从背景中抠出,形成一个透明背景的人体图像。 + |
+
+
+
+ ![]() |
+
+
+
+ fastText - kits/fasttext_sdk + fastText是一个快速文本分类算法。 + |
+
+
+
+ ![]() |
+
+
+
+ 解析npy/npz文件 - kits/npy_npz_sdk + java读取python numpy保存的npz、npy文件。。 + |
+
+
+
+ ![]() |
+
+
+
+ Sentencepiece分词 - kits/sentencepiece_sdk + Sentencepiece分词的Java实现。 + |
+
+
+
+ ![]() |
+
+
+
+ jieba分词 - lexical_analysis/jieba_sdk + jieba分词java版本的简化实现。 + |
+
+
+
+ ![]() |
+
+
+
+ 词法分析SDK [中文] - lexical_analysis/lac_sdk + 词法分析模型能整体性地完成中文分词、词性标注、专名识别任务。 + |
+
+
+
+ ![]() |
+
+
+
+ 202种语言互相翻译 - translation/trans_nllb_sdk + 支持202种语言互相翻译,支持 CPU / GPU。 + |
+
+
+
+ ![]() |
+
+
+
+ 中英互相翻译 - translation/translation_sdk + 可以进行英语和中文之间的翻译,支持 CPU / GPU。 + |
+
+
+
+ ![]() |
+
+
+
+ 代码特征向量提取工具箱 - embedding/* + 3个SDK:+ 1.code2vec_sdk + 2.codet5p_110m_sdk + 3.mpnet_base_v2_sdk + 自然语言与代码特征提取工具箱提供3个SDK,以满足不同精度与速度的需要。。 + |
+
+
+
+ ![]() |
+
+
+
+
+
+ 文本特征提取向量工具箱【中文】 - embedding/* + 文本语义特征提取工具箱提供4个 SDK:+ 1.m3e_cn_sdk + 2.text2vec_base_chinese_sdk + 3.text2vec_base_chinese_sentence_sdk + 4.text2vec_base_chinese_paraphrase_sdk + |
+
+
+
+ ![]() |
+
+
+
+
+
+ 文本特征提取向量工具箱【中文】 - embedding/* + 文本语义特征向量提取工具箱【多语言】提供 3 个 SDK:+ 1.sentence_encoder_15_sdk(支持 15 种语言) + 2.sentence_encoder_100_sdk(支持100种语言) + 3.text2vec_base_multilingual_sdk(支持50+种语言) + |
+
+
+
+ ![]() |
+
+
+
+
+ 语音识别(ASR)【短语音】 - asr_whisper_sdk + 中文语音识别。 + |
+
+
+
+ ![]() |
+
+
+
+ 语音识别(ASR)【长语音】 - asr_whisper_long_sdk + 中文语音识别。 + |
+
+
+
+ ![]() |
+
+
+
+ 语音处理包Librosa- librosa_sdk + python语音处理库librosa的java实现。 + |
+
+
+
+ ![]() |
+
+
+
+ TTS 文本转为语音 - tts_sdk + TTS 文本转为语音。 + |
+
+
+
+ ![]() |
+
+
+
+ 摄像头口罩检测 - camera_facemask_sdk + 读取本地摄像头,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。 + |
+
+
+
+ ![]() |
+
+
+
+ MP4检测口罩 - mp4_facemask_sdk + 读取本地MP4文件,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。 + |
+
+
+
+ ![]() |
+
+
+
+ rtsp取流检测口罩 - rtsp_facemask_sdk + 通过rtsp取流,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。 + |
+
+
+
+ ![]() |
+
+
+
+ flink-情感倾向分析【英文】SDK - flink_sentiment_analysis_sdk + 情感倾向分析(Sentiment Classification) + 针对带有主观描述的文本,可自动判断该文本的情感极性类别并给出相应的置信度。 + |
+
+
+
+ ![]() |
+
+
+
+ kafka-情感倾向分析【英文】SDK - kafka_sentiment_analysis_sdk + 情感倾向分析(Sentiment Classification) + 针对带有主观描述的文本,可自动判断该文本的情感极性类别并给出相应的置信度。 + |
+
+
+
+ ![]() |
+
+
+
+ AI 训练平台 - training + AI训练平台提供分类模型训练能力。+ 并以REST API形式为上层应用提供接口。 + |
+
+
+
+ ![]() |
+
+
+
+ 代码语义搜索 - code_search + 用于软件开发过程中的,代码搜代码,语义搜代码。s + 1. 代码语义搜索【无向量引擎版】 + - simple_code_search + 主要特性 + - 支持100万以内的数据量 + - 随时对数据进行插入、删除、搜索、更新等操作 + 2. 代码语义搜索【向量引擎版】 - code_search + 主要特性 + - 底层使用特征向量相似度搜索 + - 单台服务器十亿级数据的毫秒级搜索 + - 近实时搜索,支持分布式部署 + - 随时对数据进行插入、删除、搜索、更新等操作 + |
+
+
+
+ ![]() |
+
+
+
+ 202种语言互相翻译 Web 应用 - text_translation + - 支持202种语言互相翻译。+ - 支持 CPU / GPU + |
+
+
+
+ ![]() |
+
+
+
+ 一键抠图 Web 应用 - image_seg + 当前版本包含了下面功能:+ - 1. 通用一键抠图 + - 2. 人体一键抠图 + - 3. 动漫一键抠图 + |
+
+
+
+ ![]() |
+
+
+
+ 图片一键高清- image_gan + 当前版本包含了下面功能:+ - 图片一键高清: 提升图片4倍分辨率。 + - 头像一键高清 + - 人脸一键修复 + |
+
+
+
+ ![]() |
+
+
+
+ 图像&文本的跨模态相似性比对检索【支持40种语言】 + - 1. 图像&文本的跨模态相似性比对检索 + 【无向量引擎版】 + - simple_image_text_search + - 支持100万以内的数据量 + - 随时对数据进行插入、删除、搜索、更新等操作 + - 2. 图像&文本的跨模态相似性比对检索 + 【向量引擎版】 + - image_text_search + - 以图搜图:上传图片搜索 + - 以文搜图:输入文本搜索 + - 数据管理:提供图像压缩包(zip格式)上传 + |
+
+
+
+ ![]() |
+
+
+
+ 文本向量搜索 - text_search + - 包含两个项目,满足不同场景的需要+ - 1. 文本向量搜索【无向量引擎版】 + - simple_text_search + - 2. 文本向量搜索【向量引擎版】 + - text_search + - 语义搜索,通过句向量相似性, 检索语料库中与query最匹配的文本 + - 文本聚类,文本转为定长向量, 通过聚类模型可无监督聚集相似文本 + - 文本分类,表示成句向量, 直接用简单分类器即训练文本分类器 + - RAG 用于大模型搜索增强生成 + |
+
+
+
+ ![]() |
+
+
+
+ 人像搜索 - face_search + - 包含两个项目,满足不同场景的需要+ - 1. 人像搜索【精简版】 + - simple_face_search + - 2. 人像搜索【完整版】 + - face_search + - 搜索管理:提供通用图像搜索, 人像搜索,图像信息查看 + - 存储管理:提供图像压缩包(zip格式)上传, 人像特征提取,通用特征提取 + - 用户管理:提供用户的相关配置, 新增用户后,默认密码为123456 + - 角色管理:对权限与菜单进行分配, 可根据部门设置角色的数据权限 + - 菜单管理:已实现菜单动态路由, 后端可配置化,支持多级菜单 + - 部门管理:可配置系统组织架构, 树形表格展示 + - 岗位管理:配置各个部门的职位 + - 字典管理:可维护常用一些固定的数据, 如:状态,性别等 + - 系统日志:记录用户操作日志与异常日志, 方便开发人员定位排错 + - SQL监控:采用druid 监控数据库访问性能, 默认用户名admin,密码123456 + - 定时任务:整合Quartz做定时任务, 加入任务日志,任务运行情况一目了然 + - 服务监控:监控服务器的负载情况 + |
+
+
+
+ ![]() |
+
+
+
+ 语音识别Web 应用 - asr + - 本例子提供了英文语音识别,中文语音识别。 + |
+
+
+
+ ![]() |
+
+
+
+ 1. Canny 边缘检测 + - canny_sdk+ - Canny 边缘检测预处理器可很好识别出 图像内各对象的边缘轮廓,常用于生成线稿。 + - 对应ControlNet模型: control_canny + |
+
+
+
+ ![]() |
+
+
+
+ 2. MLSD 线条检测 + - mlsd_sdk+ - MLSD 线条检测用于生成房间、 直线条的建筑场景效果比较好。 + - 对应ControlNet模型: control_mlsd + |
+
+
+
+ ![]() |
+
+
+
+ 3. Scribble 涂鸦 + - scribble_hed_sdk+ - scribble_pidinet_sdk + - 图片自动生成类似涂鸦效果的草图线条。 + - 对应ControlNet模型: control_mlsd + |
+
+
+
+ ![]() |
+
+
+
+ 4. SoftEdge 边缘检测 + - softedge_hed_sdk+ - HED - HedScribbleExample + - HED Safe - HedScribbleExample + - softedge_pidinet_sdk + - PidiNet - PidiNetGPUExample + - PidiNet Safe - PidiNetGPUExample + - SoftEdge 边缘检测可保留更多柔和的边缘细节, 类似手绘效果。 + - 对应ControlNet模型: control_softedge。 + |
+
+
+
+ ![]() |
+
+
+
+ 5. OpenPose 姿态检测 + - pose_sdk+ - OpenPose 姿态检测可生成图像中角色动作 姿态的骨架图(含脸部特征以及手部骨架检测) ,这个骨架图可用于控制生成角色的姿态动作。 + - 对应ControlNet模型: control_openpose。 + |
+
+
+
+ ![]() |
+
+
+
+ 6. Segmentation 语义分割 + - seg_upernet_sdk+ - 语义分割可多通道应用, 原理是用颜色把不同类型的对象分割开, 让AI能正确识别对象类型和需求生成的区界。 + - 对应ControlNet模型: control_seg。 + |
+
+
+
+ ![]() |
+
+
+
+ 7. Depth 深度检测 + - depth_estimation_midas_sdk+ - Midas - MidasDepthEstimationExample + - depth_estimation_dpt_sdks + - DPT - DptDepthEstimationExample + - 通过提取原始图片中的深度信息, 生成具有原图同样深度结构的深度图, 越白的越靠前,越黑的越靠后。 + - 对应ControlNet模型: control_depth。 + |
+
+
+
+ ![]() |
+
+
+
+ 8. Normal Map 法线贴图 + - normal_bae_sdk+ - NormalBaeExample + - 根据图片生成法线贴图,适合CG或游戏美术师。 法线贴图能根据原始素材生成 一张记录凹凸信息的法线贴图, 便于AI给图片内容进行更好的光影处理, 它比深度模型对于细节的保留更加的精确。 法线贴图在游戏制作领域用的较多, 常用于贴在低模上模拟高模的复杂光影效果。 + - 对应ControlNet模型: control_normal。 + |
+
+
+
+ ![]() |
+
+
+
+ 9. Lineart 生成线稿 + - lineart_sdk+ - lineart_coarse_sdk + - Lineart 边缘检测预处理器可很好识别出 图像内各对象的边缘轮廓,用于生成线稿。 + - 对应ControlNet模型: control_lineart。 + |
+
+
+
+ ![]() |
+
+
+
+ 10. Lineart Anime 生成线稿 + - lineart_anime_sdk+ - LineArtAnimeExample + - Lineart Anime 边缘检测预处理器 可很好识别出卡通图像内 各对象的边缘轮廓,用于生成线稿。 + - 对应ControlNet模型: control_lineart_anime。 + |
+
+
+
+ ![]() |
+
+
+
+ 11. Content Shuffle + - content_shuffle_sdk+ - ContentShuffleExample + - Content Shuffle 图片内容变换位置, 打乱次序,配合模型 control_v11e_sd15_shuffle 使用。 + - 对应ControlNet模型: control_shuffle。 + |
+
+
+
+ ![]() |
+
+
+
+ 1. 文生图:输入提示词(仅支持英文), + |
+
+
+
+ ![]() |
+
+
+
+ 2. 图生图:根据图片及提示词 + |
+
+
+
+ ![]() |
+
+
+
+ 3. Lora 文生图 + - lora_sdk+ |
+
+
+
+ ![]() |
+
+
+
+ 4. Controlnet 图像生成-4.1. Canny 边缘检测 + - controlnet_canny_sdk+ - Canny 边缘检测预处理器可 很好识别出图像内各对象 的边缘轮廓,常用于生成线稿。 + |
+
+
+
+ ![]() |
+
+
+
+ 4. Controlnet 图像生成-4.2. MLSD 线条检测 + - controlnet_mlsd_sdk+ - MLSD 线条检测用于生成房间、 直线条的建筑场景效果比较好。 + |
+
+
+
+ ![]() |
+
+
+
+ 4. Controlnet 图像生成-4.3. Scribble 涂鸦 + - controlnet_scribble_sdk+ - 图片自动生成类似涂鸦效果的草图线条。 + |
+
+
+
+ ![]() |
+
+
+
+ 4. Controlnet 图像生成-4.4. SoftEdge 边缘检测 + - controlnet_softedge_sdk+ - SoftEdge 边缘检测可保留更多 柔和的边缘细节,类似手绘效果。 + |
+
+
+
+ ![]() |
+
+
+
+ 4. Controlnet 图像生成-4.5. OpenPose 姿态检测 + - controlnet_pose_sdk+ - OpenPose 姿态检测可生成图像 中角色动作姿态的骨架图 (含脸部特征以及手部骨架检测) ,这个骨架图可用于控制生成角色的姿态动作。 + |
+
+
+
+ ![]() |
+
+
+
+ 4. Controlnet 图像生成-4.6. Segmentation 语义分割 + - controlnet_seg_sdk+ - 语义分割可多通道应用, 原理是用颜色把不同类型的对象分割开, 让AI能正确识别对象类型和需求生成的区界。 + |
+
+
+
+ ![]() |
+
+
+
+ 4. Controlnet 图像生成-4.7. Depth 深度检测 + - controlnet_depth_sdk+ - 通过提取原始图片中的深度信息, 生成具有原图同样深度结构的深度图, 越白的越靠前,越黑的越靠后。 + |
+
+
+
+ ![]() |
+
+
+
+ 4. Controlnet 图像生成-4.8. Normal Map 法线贴图 + - controlnet_normal_sdk+ - 根据图片生成法线贴图, 适合CG或游戏美术师。 法线贴图能根据原始素材生成一张记录凹凸信息的法线贴图, 便于AI给图片内容进行更好的光影处理, 它比深度模型对于细节的保留更加的精确。 法线贴图在游戏制作领域用的较多, 常用于贴在低模上模拟高模的复杂光影效果。 + |
+
+
+
+ ![]() |
+
+
+
+ 4. Controlnet 图像生成-4.9. Lineart 生成线稿 + - controlnet_lineart_sdk+ - controlnet_lineart_coarse_sdk + - Lineart 边缘检测预处理器可很好识别出 图像内各对象的边缘轮廓,用于生成线稿。 + |
+
+
+
+ ![]() |
+
+
+
+ 4. Controlnet 图像生成-4.10. Lineart Anime 生成线稿 + - controlnet_lineart_anime_sdk+ - Lineart Anime 边缘检测预处理器可很好 识别出卡通图像内各对象的边缘轮廓, 用于生成线稿。 + |
+
+
+
+ ![]() |
+
+
+
+ 4. Controlnet 图像生成-4.11. Content Shuffle + - controlnet_shuffle_sdk+ - Content Shuffle 图片内容变换位置, 打乱次序,配合模型 control_v11e_sd15_shuffle 使用。 + |
+
+
+
+ ![]() |
+
+
+
+ 大模型离线桌面App - desktop_app_llm + - 支持中/英文 + - 模型支持chatglm3,llama3,alpaca3等+ - 支持4位,8位量化,16位半精度模型。 + - 支持windows及mac系统 + - 支持CPU,GPU + |
+
+
+
+ ![]() |
+
+
+
+ OCR文字识别桌面App - desktop_app_ocr + - 图片文字识别+ - 支持windows, linux, mac 一键安装 + |
+
+
+
+ ![]() |
+
+
+
+ 图像高清放大桌面App + - 批量图片分辨率放大 + - 支持 windows, macos, ubuntu + |
+
+
+
+ ![]() |
+
AI 训练平台 - training
- AI训练平台提供分类模型训练能力。并以REST API形式为上层应用提供接口。 + AI训练平台提供分类模型训练能力。代码语义搜索 - code_search
- 用于软件开发过程中的,代码搜代码,语义搜代码。 - 1. 代码语义搜索【无向量引擎版】 - simple_code_search图像&文本的跨模态相似性比对检索【支持40种语言】- image_text_search
+图像&文本的跨模态相似性比对检索【支持40种语言】
+ - image_text_search
语音识别Web 应用 - asr
- - 本例子提供了英文语音识别,中文语音识别。 + - 本例子提供了英文语音识别,1. Canny 边缘检测
- canny_sdk2. MLSD 线条检测
- mlsd_sdk3. Scribble 涂鸦
- scribble_hed_sdk5. OpenPose 姿态检测
- pose_sdk6. Segmentation 语义分割
- seg_upernet_sdk8. Normal Map 法线贴图
- normal_bae_sdk9. Lineart 生成线稿
- lineart_sdk10. Lineart Anime 生成线稿
- lineart_anime_sdk11. Content Shuffle
- content_shuffle_sdk1. 文生图:输入提示词(仅支持英文),生成图片(仅支持英文)
+1. 文生图:输入提示词(仅支持英文),
生成图片(仅支持英文)
2. 图生图:根据图片及提示词(仅支持英文)生成图片
+2. 图生图:根据图片及提示词
(仅支持英文)生成图片
4. Controlnet 图像生成-4.1. Canny 边缘检测
+4. Controlnet 图像生成
-4.1. Canny 边缘检测
4. Controlnet 图像生成-4.2. MLSD 线条检测
+4. Controlnet 图像生成
-4.2. MLSD 线条检测
4. Controlnet 图像生成-4.3. Scribble 涂鸦
+4. Controlnet 图像生成
-4.3. Scribble 涂鸦
4. Controlnet 图像生成-4.4. SoftEdge 边缘检测
+4. Controlnet 图像生成
-4.4. SoftEdge 边缘检测
4. Controlnet 图像生成-4.5. OpenPose 姿态检测
+4. Controlnet 图像生成
-4.5. OpenPose 姿态检测
4. Controlnet 图像生成-4.6. Segmentation 语义分割
+4. Controlnet 图像生成
-4.6. Segmentation 语义分割
4. Controlnet 图像生成-4.7. Depth 深度检测
+4. Controlnet 图像生成
-4.7. Depth 深度检测
4. Controlnet 图像生成-4.8. Normal Map 法线贴图
+4. Controlnet 图像生成
-4.8. Normal Map 法线贴图
4. Controlnet 图像生成-4.9. Lineart 生成线稿
+4. Controlnet 图像生成
-4.9. Lineart 生成线稿
4. Controlnet 图像生成-4.10. Lineart Anime 生成线稿
+4. Controlnet 图像生成
-4.10. Lineart Anime 生成线稿
4. Controlnet 图像生成-4.11. Content Shuffle
+4. Controlnet 图像生成
-4.11. Content Shuffle