diff --git "a/docs_cn/Windows\347\216\257\345\242\203\345\270\270\350\247\201\351\227\256\351\242\230.md" "b/0_tutorials/docs_cn/Windows\347\216\257\345\242\203\345\270\270\350\247\201\351\227\256\351\242\230.md" similarity index 100% rename from "docs_cn/Windows\347\216\257\345\242\203\345\270\270\350\247\201\351\227\256\351\242\230.md" rename to "0_tutorials/docs_cn/Windows\347\216\257\345\242\203\345\270\270\350\247\201\351\227\256\351\242\230.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/0_introduction.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/0_introduction.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/0_introduction.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/0_introduction.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/10_IO.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/10_IO.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/10_IO.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/10_IO.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/1_basic.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/1_basic.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/1_basic.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/1_basic.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/2_ndarray.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/2_ndarray.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/2_ndarray.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/2_ndarray.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/3_index.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/3_index.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/3_index.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/3_index.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/4_ broadcast.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/4_ broadcast.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/4_ broadcast.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/4_ broadcast.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/5_math.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/5_math.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/5_math.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/5_math.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/6_arithmetic.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/6_arithmetic.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/6_arithmetic.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/6_arithmetic.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/7_statistic.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/7_statistic.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/7_statistic.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/7_statistic.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/8_sortCondition.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/8_sortCondition.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/8_sortCondition.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/8_sortCondition.md" diff --git "a/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/9_matrix.md" "b/0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/9_matrix.md" similarity index 100% rename from "docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/9_matrix.md" rename to "0_tutorials/docs_cn/ndarray\344\270\255\346\226\207\346\225\231\347\250\213/9_matrix.md" diff --git "a/docs_cn/\345\274\225\346\223\216\351\205\215\347\275\256.md" "b/0_tutorials/docs_cn/\345\274\225\346\223\216\351\205\215\347\275\256.md" similarity index 100% rename from "docs_cn/\345\274\225\346\223\216\351\205\215\347\275\256.md" rename to "0_tutorials/docs_cn/\345\274\225\346\223\216\351\205\215\347\275\256.md" diff --git "a/docs_cn/\346\200\247\350\203\275\344\274\230\345\214\226\345\270\270\350\247\201\351\227\256\351\242\230.md" "b/0_tutorials/docs_cn/\346\200\247\350\203\275\344\274\230\345\214\226\345\270\270\350\247\201\351\227\256\351\242\230.md" similarity index 100% rename from "docs_cn/\346\200\247\350\203\275\344\274\230\345\214\226\345\270\270\350\247\201\351\227\256\351\242\230.md" rename to "0_tutorials/docs_cn/\346\200\247\350\203\275\344\274\230\345\214\226\345\270\270\350\247\201\351\227\256\351\242\230.md" diff --git "a/docs_cn/\346\250\241\345\236\213\345\212\240\350\275\275\346\226\271\345\274\217.md" "b/0_tutorials/docs_cn/\346\250\241\345\236\213\345\212\240\350\275\275\346\226\271\345\274\217.md" similarity index 100% rename from "docs_cn/\346\250\241\345\236\213\345\212\240\350\275\275\346\226\271\345\274\217.md" rename to "0_tutorials/docs_cn/\346\250\241\345\236\213\345\212\240\350\275\275\346\226\271\345\274\217.md" diff --git a/docs_en/FAQ for windows.md b/0_tutorials/docs_en/FAQ for windows.md similarity index 100% rename from docs_en/FAQ for windows.md rename to 0_tutorials/docs_en/FAQ for windows.md diff --git a/docs_en/How to config engine.md b/0_tutorials/docs_en/How to config engine.md similarity index 100% rename from docs_en/How to config engine.md rename to 0_tutorials/docs_en/How to config engine.md diff --git a/docs_en/How to load model.md b/0_tutorials/docs_en/How to load model.md similarity index 100% rename from docs_en/How to load model.md rename to 0_tutorials/docs_en/How to load model.md diff --git a/docs_en/Performance tuning.md b/0_tutorials/docs_en/Performance tuning.md similarity index 100% rename from docs_en/Performance tuning.md rename to 0_tutorials/docs_en/Performance tuning.md diff --git a/docs_en/ndarray_guide_en/0_introduction.md b/0_tutorials/docs_en/ndarray_guide_en/0_introduction.md similarity index 100% rename from docs_en/ndarray_guide_en/0_introduction.md rename to 0_tutorials/docs_en/ndarray_guide_en/0_introduction.md diff --git a/docs_en/ndarray_guide_en/10_IO.md b/0_tutorials/docs_en/ndarray_guide_en/10_IO.md similarity index 100% rename from docs_en/ndarray_guide_en/10_IO.md rename to 0_tutorials/docs_en/ndarray_guide_en/10_IO.md diff --git a/docs_en/ndarray_guide_en/1_basic.md b/0_tutorials/docs_en/ndarray_guide_en/1_basic.md similarity index 100% rename from docs_en/ndarray_guide_en/1_basic.md rename to 0_tutorials/docs_en/ndarray_guide_en/1_basic.md diff --git a/docs_en/ndarray_guide_en/2_ndarray.md b/0_tutorials/docs_en/ndarray_guide_en/2_ndarray.md similarity index 100% rename from docs_en/ndarray_guide_en/2_ndarray.md rename to 0_tutorials/docs_en/ndarray_guide_en/2_ndarray.md diff --git a/docs_en/ndarray_guide_en/3_index.md b/0_tutorials/docs_en/ndarray_guide_en/3_index.md similarity index 100% rename from docs_en/ndarray_guide_en/3_index.md rename to 0_tutorials/docs_en/ndarray_guide_en/3_index.md diff --git a/docs_en/ndarray_guide_en/4_ broadcast.md b/0_tutorials/docs_en/ndarray_guide_en/4_ broadcast.md similarity index 100% rename from docs_en/ndarray_guide_en/4_ broadcast.md rename to 0_tutorials/docs_en/ndarray_guide_en/4_ broadcast.md diff --git a/docs_en/ndarray_guide_en/5_math.md b/0_tutorials/docs_en/ndarray_guide_en/5_math.md similarity index 100% rename from docs_en/ndarray_guide_en/5_math.md rename to 0_tutorials/docs_en/ndarray_guide_en/5_math.md diff --git a/docs_en/ndarray_guide_en/6_arithmetic.md b/0_tutorials/docs_en/ndarray_guide_en/6_arithmetic.md similarity index 100% rename from docs_en/ndarray_guide_en/6_arithmetic.md rename to 0_tutorials/docs_en/ndarray_guide_en/6_arithmetic.md diff --git a/docs_en/ndarray_guide_en/7_statistic.md b/0_tutorials/docs_en/ndarray_guide_en/7_statistic.md similarity index 100% rename from docs_en/ndarray_guide_en/7_statistic.md rename to 0_tutorials/docs_en/ndarray_guide_en/7_statistic.md diff --git a/docs_en/ndarray_guide_en/8_sortCondition.md b/0_tutorials/docs_en/ndarray_guide_en/8_sortCondition.md similarity index 100% rename from docs_en/ndarray_guide_en/8_sortCondition.md rename to 0_tutorials/docs_en/ndarray_guide_en/8_sortCondition.md diff --git a/docs_en/ndarray_guide_en/9_matrix.md b/0_tutorials/docs_en/ndarray_guide_en/9_matrix.md similarity index 100% rename from docs_en/ndarray_guide_en/9_matrix.md rename to 0_tutorials/docs_en/ndarray_guide_en/9_matrix.md diff --git a/1_image_sdks/README_CN.md b/1_image_sdks/README_CN.md new file mode 100644 index 00000000..efc5e658 --- /dev/null +++ b/1_image_sdks/README_CN.md @@ -0,0 +1,438 @@ + + + +#### 项目清单: + +- 1. 1_image_sdks - [图像识别 SDK] +```text + 1). 工具箱系列:图像处理工具箱(静态图像) + 2). 目标检测 + 3). 图像分割 + 4). GAN + 5). 其它类别:OCR等 + ... +``` + +
+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+
+

OCR工具箱 1:OCR方向检测与旋转 - ocr_sdks/ocr_direction_det_sdk

+ OCR图像预处理。 +
+
+
+ +
+
+
+

OCR工具箱 2:OCR文字识别 - ocr_sdks/ocr_v3_sdk

+ 1. V3 文本检测:
+ - 中文文本检测
+ - 英文文本检测
+ - 多语言文本检测
+ 2. V3 文本识别:
+ - 中文简体
+ - 中文繁体
+ - 英文
+ - 韩语
+ - 日语
+ - 阿拉伯
+ - 梵文
+ - 泰米尔语
+ - 泰卢固语
+ - 卡纳达文
+ - 斯拉夫
+
+
+
+ +
+
+
+

OCR工具箱 3:OCR文字识别 - ocr_sdks/ocr_v4_sdk

+ 原生支持旋转倾斜文本文字识别。 +
+
+
+ +
+
+
+

OCR工具箱 4:版面分析 - ocr_sdks/ocr_layout_sdk

+ 可以用于配合文字识别,表格识别的流水线处理使用。
+ 1. 中文版面分析
+ 2. 英文版面分析
+ 3. 中英文文档 - 表格区域检测
+
+
+
+ +
+
+
+

OCR工具箱 5: 表格识别 - ocr_sdks/ocr_table_sdk

+ 中英文表格识别。 +
+
+
+ +
+
+
+

OCR工具箱 6: led文字识别 - ocr_sdks/ocr_led_sdk

+ led表盘文字识别。 +
+
+
+ +
+
+
+

人脸工具箱 1:人脸检测(含5个人脸关键点) - face_sdks/face_detection_sdk

+ 人脸检测(含5个人脸关键点)提供了两个模型的实现。 +
+
+
+ +
+
+
+

人脸工具箱 2:人脸对齐- face_sdks/face_alignment_sdk

+ 根据人脸关键点对齐人脸。 +
+
+
+ +
+
+
+

人脸工具箱 3:人脸特征提取与比对- face_sdks/face_feature_sdk

+ 人脸识别完整的pipeline:人脸检测(含人脸关键点) --> 人脸对齐 --> 人脸特征提取 --> 人脸比对 +
+
+
+ +
+
+
+

人脸工具箱 4:人脸分辨率提升- face_sdks/face_sr_sdk

+ 包含两个功能:
+ 1.单张人脸图片超分辨。
+ 2.自动检测人脸,然后对齐人脸后提升分辨率。 +
+
+
+ +
+
+
+

人脸工具箱 5:图片人脸修复- face_sdks/face_restoration_sdk

+ - 自动检测人脸及关键地,然后抠图,然后根据人脸关键点转正对齐。
+ - 对所有转正对齐的人脸提升分辨率。
+ - 使用分割模型提取人脸,逆向变换后贴回原图。 +
+
+
+ +
+
+
+

人脸工具箱 6:口罩检测 - face_sdks/mask_sdk

+ 口罩检测,给出检测框。 +
+
+
+ +
+
+
+

动物分类识别 - classification/animal_sdk

+ 动物识别sdk,支持7978种动物的分类识别。 +
+
+
+ +
+
+
+

菜品分类识别 - classification/dish_sdk

+ 菜品识别sdk,支持8416种菜品的分类识别。 +
+
+
+ +
+
+
+

烟火检测 - fire_smoke_sdk

+ 烟火检测,给出检测框和置信度。 +
+
+
+ +
+
+
+

行人检测 - pedestrian_sdk

+ 行人检测,给出检测框和置信度。 +
+
+
+ +
+
+
+

反光衣检测 - reflective_vest_sdk

+ 实现施工区域或者危险区域人员穿戴检测。 +
+
+
+ +
+
+
+

智慧工地检测 - smart_construction_sdk

+ 支持检测的类别:人体,安全帽。 +
+
+
+ +
+
+
+

车辆检测 - vehicle_sdk

+ 车辆检测,给出检测框和置信度。 +
+
+
+ +
+
+
+

图片特征提取(512维)SDK - feature_extraction_sdk

+ 提取图片512维特征值,并支持图片1:1特征比对,给出置信度。 +
+
+
+ +
+
+
+

图像&文本的跨模态相似性比对检索 SDK【支持40种语言】 - image_text_40_sdk

+ -图像&文本特征向量提取
+ -相似度计算
+ -softmax计算置信度 +
+
+
+ +
+
+
+

图像矫正 - image_alignment_sdk

+ -自动检测边缘,透视变换转正
+
+
+
+ +
+
+
+

文本图像超分辨 - image_text_sr_sdk

+ -可以用于提升电影字幕清晰度。
+
+
+
+ +
+
+
+

图像超分辨(4倍)- super_resolution_sdk

+ -提升图片4倍分辨率。
+
+
+
+ +
+
+
+

黑白图片上色 - image_colorization_sdk

+ -应用到黑白图像中,从而实现黑白照片的上色。
+
+
+
+ +
+
+
+

一键抠图工具箱 - 1. 通用一键抠图

+ - seg_unet_sdk
+ -包括三个模型:满足不同精度,速度的要求。
+
+
+
+ +
+
+
+

一键抠图工具箱 - 2. 动漫一键抠图

+ - seg_unet_sdk
+ 无需手动绘制边界,大大提高了抠图的效率和精准度。应用场景如:
+ - 广告设计
+ - 影视后期制作
+ - 动漫创作等
+
+
+
+ +
+
+
+

一键抠图工具箱 - 3. 衣服一键抠图

+ - seg_unet_sdk
+ 衣服一键抠图应用场景可以在很多方面发挥作用,以下是一些简要介绍:
+ - 电子商务
+ - 社交媒体
+ - 广告设计
+ - 时尚设计
+ - 虚拟试衣
+
+
+
+ +
+
+
+

一键抠图工具箱 - 4. 人体一键抠图

+ - seg_unet_sdk
+ -人体一键抠图可以将人体从背景中抠出,形成一个透明背景的人体图像。
+
+
+
+ +
+
+
+ + + diff --git a/2_nlp_sdks/README_CN.md b/2_nlp_sdks/README_CN.md new file mode 100644 index 00000000..a5fef45d --- /dev/null +++ b/2_nlp_sdks/README_CN.md @@ -0,0 +1,158 @@ + + +#### 项目清单: +- 2_nlp_sdks - [自然语言 SDK] +```text + 1). 工具箱系列:sentencepiece,fastText,npy/npz文件处理等。 + 2). 大模型 + 3). 词向量 + 4). 机器翻译 + ... +``` + +
+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+
+

fastText - kits/fasttext_sdk

+ fastText是一个快速文本分类算法。 +
+
+
+ +
+
+
+

解析npy/npz文件 - kits/npy_npz_sdk

+ java读取python numpy保存的npz、npy文件。。 +
+
+
+ +
+
+
+

Sentencepiece分词 - kits/sentencepiece_sdk

+ Sentencepiece分词的Java实现。 +
+
+
+ +
+
+
+

jieba分词 - lexical_analysis/jieba_sdk

+ jieba分词java版本的简化实现。 +
+
+
+ +
+
+
+

词法分析SDK [中文] - lexical_analysis/lac_sdk

+ 词法分析模型能整体性地完成中文分词、词性标注、专名识别任务。 +
+
+
+ +
+
+
+

202种语言互相翻译 - translation/trans_nllb_sdk

+ 支持202种语言互相翻译,支持 CPU / GPU。 +
+
+
+ +
+
+
+

中英互相翻译 - translation/translation_sdk

+ 可以进行英语和中文之间的翻译,支持 CPU / GPU。 +
+
+
+ +
+
+
+

代码特征向量提取工具箱 - embedding/*

+ 3个SDK:
+ 1.code2vec_sdk
+ 2.codet5p_110m_sdk
+ 3.mpnet_base_v2_sdk
+ 自然语言与代码特征提取工具箱提供3个SDK,以满足不同精度与速度的需要。。 +
+
+
+ +
+
+
+

文本特征提取向量工具箱【中文】 - embedding/*

+ 文本语义特征提取工具箱提供4个 SDK:
+ 1.m3e_cn_sdk
+ 2.text2vec_base_chinese_sdk
+ 3.text2vec_base_chinese_sentence_sdk
+ 4.text2vec_base_chinese_paraphrase_sdk +
+
+
+ +
+
+
+

文本特征提取向量工具箱【中文】 - embedding/*

+ 文本语义特征向量提取工具箱【多语言】提供 3 个 SDK:
+ 1.sentence_encoder_15_sdk(支持 15 种语言)
+ 2.sentence_encoder_100_sdk(支持100种语言)
+ 3.text2vec_base_multilingual_sdk(支持50+种语言) +
+
+
+ +
+
+
+ + diff --git a/3_audio_sdks/README_CN.md b/3_audio_sdks/README_CN.md new file mode 100644 index 00000000..f013d710 --- /dev/null +++ b/3_audio_sdks/README_CN.md @@ -0,0 +1,71 @@ + +#### 项目清单: +- 3_audio_sdks - [语音处理 SDK] +```text + 1). 工具箱系列:音素工具箱,librosa,java sound,javacv ffmpeg, fft, vad工具箱等。 + 2). 声音克隆 + 3). 语音合成 + 4). 声纹识别 + 5). 语音识别 + ... +``` + +
+ + + + + + + + + + + + + + + + + +
+
+

语音识别(ASR)【短语音】 - asr_whisper_sdk

+ 中文语音识别。 +
+
+
+ +
+
+
+

语音识别(ASR)【长语音】 - asr_whisper_long_sdk

+ 中文语音识别。 +
+
+
+ +
+
+
+

语音处理包Librosa- librosa_sdk

+ python语音处理库librosa的java实现。 +
+
+
+ +
+
+
+

TTS 文本转为语音 - tts_sdk

+ TTS 文本转为语音。 +
+
+
+ +
+
+
+ + + diff --git a/4_video_sdks/README_CN.md b/4_video_sdks/README_CN.md new file mode 100644 index 00000000..924f5e2e --- /dev/null +++ b/4_video_sdks/README_CN.md @@ -0,0 +1,54 @@ + +#### 项目清单: +- 4_video_sdks - [视频解析SDK] +```text + 1). 摄像头口罩检测 - camera_facemask_sdk + 2). MP4检测口罩 - mp4_facemask_sdk + 3). rtsp取流检测口罩 - rtsp_facemask_sdk +``` + +
+ + + + + + + + + + + + + +
+
+

摄像头口罩检测 - camera_facemask_sdk

+ 读取本地摄像头,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。 +
+
+
+ +
+
+
+

MP4检测口罩 - mp4_facemask_sdk

+ 读取本地MP4文件,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。 +
+
+
+ +
+
+
+

rtsp取流检测口罩 - rtsp_facemask_sdk

+ 通过rtsp取流,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。 +
+
+
+ +
+
+
+s + diff --git a/5_bigdata_sdks/README_CN.md b/5_bigdata_sdks/README_CN.md new file mode 100644 index 00000000..1713305a --- /dev/null +++ b/5_bigdata_sdks/README_CN.md @@ -0,0 +1,43 @@ + +#### 项目清单: +- 5_bigdata_sdks - [大数据SDK] + +```text + 1). flink-情感倾向分析【英文】- flink_sentence_encoder_sdk + 2). kafka-情感倾向分析【英文】- kafka_sentiment_analysis_sdk + ... +``` + +
+ + + + + + + + + +
+
+

flink-情感倾向分析【英文】SDK - flink_sentiment_analysis_sdk

+ 情感倾向分析(Sentiment Classification) + 针对带有主观描述的文本,可自动判断该文本的情感极性类别并给出相应的置信度。 +
+
+
+ +
+
+
+

kafka-情感倾向分析【英文】SDK - kafka_sentiment_analysis_sdk

+ 情感倾向分析(Sentiment Classification) + 针对带有主观描述的文本,可自动判断该文本的情感极性类别并给出相应的置信度。 +
+
+
+ +
+
+
+ diff --git a/6_web_app/README_CN.md b/6_web_app/README_CN.md new file mode 100644 index 00000000..1fad4d03 --- /dev/null +++ b/6_web_app/README_CN.md @@ -0,0 +1,189 @@ + + + +#### 项目清单: +- 6_web_app - [Web应用,前端VUE,后端Springboot] +```text + 1). 训练引擎 + ... +``` + +
+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+
+

AI 训练平台 - training

+ AI训练平台提供分类模型训练能力。
+ 并以REST API形式为上层应用提供接口。
+
+
+
+ +
+
+
+

代码语义搜索 - code_search

+ 用于软件开发过程中的,代码搜代码,语义搜代码。
s + 1. 代码语义搜索【无向量引擎版】
+ - simple_code_search
+ 主要特性
+ - 支持100万以内的数据量
+ - 随时对数据进行插入、删除、搜索、更新等操作
+ 2. 代码语义搜索【向量引擎版】 - code_search
+ 主要特性
+ - 底层使用特征向量相似度搜索
+ - 单台服务器十亿级数据的毫秒级搜索
+ - 近实时搜索,支持分布式部署
+ - 随时对数据进行插入、删除、搜索、更新等操作 +
+
+
+ +
+
+
+

202种语言互相翻译 Web 应用 - text_translation

+ - 支持202种语言互相翻译。
+ - 支持 CPU / GPU
+
+
+
+ +
+
+
+

一键抠图 Web 应用 - image_seg

+ 当前版本包含了下面功能:
+ - 1. 通用一键抠图
+ - 2. 人体一键抠图
+ - 3. 动漫一键抠图 +
+
+
+ +
+
+
+

图片一键高清- image_gan

+ 当前版本包含了下面功能:
+ - 图片一键高清: 提升图片4倍分辨率。
+ - 头像一键高清
+ - 人脸一键修复
+
+
+
+ +
+
+
+

图像&文本的跨模态相似性比对检索【支持40种语言】
+ - image_text_search

+ - 包含两个项目,满足不同场景的需要
+ - 1. 图像&文本的跨模态相似性比对检索
+ 【无向量引擎版】
+ - simple_image_text_search
+ - 支持100万以内的数据量
+ - 随时对数据进行插入、删除、搜索、更新等操作
+ - 2. 图像&文本的跨模态相似性比对检索
+ 【向量引擎版】
+ - image_text_search
+ - 以图搜图:上传图片搜索
+ - 以文搜图:输入文本搜索
+ - 数据管理:提供图像压缩包(zip格式)上传
+
+
+
+ +
+
+
+

文本向量搜索 - text_search

+ - 包含两个项目,满足不同场景的需要
+ - 1. 文本向量搜索【无向量引擎版】
+ - simple_text_search
+ - 2. 文本向量搜索【向量引擎版】
+ - text_search
+ - 语义搜索,通过句向量相似性,
检索语料库中与query最匹配的文本
+ - 文本聚类,文本转为定长向量,
通过聚类模型可无监督聚集相似文本
+ - 文本分类,表示成句向量,
直接用简单分类器即训练文本分类器
+ - RAG 用于大模型搜索增强生成 +
+
+
+ +
+
+
+

人像搜索 - face_search

+ - 包含两个项目,满足不同场景的需要
+ - 1. 人像搜索【精简版】
+ - simple_face_search
+ - 2. 人像搜索【完整版】
+ - face_search
+ - 搜索管理:提供通用图像搜索,
人像搜索,图像信息查看
+ - 存储管理:提供图像压缩包(zip格式)上传,
人像特征提取,通用特征提取
+ - 用户管理:提供用户的相关配置,
新增用户后,默认密码为123456
+ - 角色管理:对权限与菜单进行分配,
可根据部门设置角色的数据权限
+ - 菜单管理:已实现菜单动态路由,
后端可配置化,支持多级菜单
+ - 部门管理:可配置系统组织架构,
树形表格展示
+ - 岗位管理:配置各个部门的职位
+ - 字典管理:可维护常用一些固定的数据,
如:状态,性别等
+ - 系统日志:记录用户操作日志与异常日志,
方便开发人员定位排错
+ - SQL监控:采用druid 监控数据库访问性能,
默认用户名admin,密码123456
+ - 定时任务:整合Quartz做定时任务,
加入任务日志,任务运行情况一目了然
+ - 服务监控:监控服务器的负载情况 +
+
+
+ +
+
+
+

语音识别Web 应用 - asr

+ - 本例子提供了英文语音识别,
中文语音识别。 +
+
+
+ +
+
+
+ + + diff --git a/7_aigc/README_CN.md b/7_aigc/README_CN.md index 3acbdb4d..6eaaa370 100644 --- a/7_aigc/README_CN.md +++ b/7_aigc/README_CN.md @@ -1,168 +1,395 @@ -### 官网: -[官网链接](https://www.aias.top/) -### 下载模型,放置于各自项目的models目录 -- 链接: https://pan.baidu.com/s/1sQu1mVR6pPqyBL8nil89tg?pwd=g287 -#### 图像生成提示词参考 -- https://arthub.ai/ +#### 项目清单: +- 7_aigc - [图像生成] -#### 作品欣赏 -
- -
- -#### 测试环境和数据 -- 显卡CUDA:11.7版本 -- 参考测试数据:分辨率 512*512 25步 CPU(i5处理器) 5分钟。 3060显卡20秒。 - -#### 1. 文生图:输入提示词(仅支持英文),生成图片(仅支持英文) -- GPU版本 StableDiffusionGPU.java -- CPU版本 StableDiffusionCPU.java -#### 文生图测试 -- 提示词 prompt: a photo of an astronaut riding a horse on mars -- 生成图片效果: -
- -
- -### 2. 图生图:根据图片及提示词(仅支持英文)生成图片 -- CPU版本 Image2ImageCpu.java -- GPU版本 Image2ImageGpu.java - -### 3. Lora 文生图 -- CPU版本 LoraTxt2ImageCpu.java - -### 4. Controlnet 图像生成 -- 显卡CUDA:11.7版本 -- 参考测试数据:分辨率 512*512 25步 CPU(i5处理器) 5分钟。 3060显卡20秒。 - -#### 4.1. Canny 边缘检测 -- CPU版本 ControlNetCannyCpu.java -- GPU版本 ControlNetCannyGpu.java -- Canny 边缘检测预处理器可很好识别出图像内各对象的边缘轮廓,常用于生成线稿。 -- 对应ControlNet模型: control_canny - -
- -
- -#### 4.2. MLSD 线条检测 -- CPU版本 ControlNetMlsdCpu.java -- GPU版本 ControlNetMlsdGpu.java -- MLSD 线条检测用于生成房间、直线条的建筑场景效果比较好。 -- 对应ControlNet模型: control_mlsd - -
- -
- -#### 4.3. Scribble 涂鸦 -- CPU版本 ControlNetScribbleHedCpu.java,ControlNetScribblePidiNetCpu.java -- GPU版本 ControlNetScribbleHedGpu.java,ControlNetScribblePidiNetGpu.java -- 不用自己画,图片自动生成类似涂鸦效果的草图线条。 -- 对应ControlNet模型: control_scribble - -
- -
- -#### 4.4. SoftEdge 边缘检测 -- HED Safe -- PidiNet -- PidiNet Safe -- CPU版本 ControlNetSoftEdgeCpu -- GPU版本 ControlNetSoftEdgeGpu -- SoftEdge 边缘检测可保留更多柔和的边缘细节,类似手绘效果。 -- 对应ControlNet模型: control_softedge。 +```text + 1). 图像生成预处理工具箱 controlnet_sdks + 2). 图像生成SD工具箱 stable_diffusion_sdks + ... +``` +- 7.1 图像生成预处理工具箱 controlnet_sdks
- -
- -#### 4.5. OpenPose 姿态检测 -- CPU版本 ControlNetPoseCpu.java -- GPU版本 ControlNetPoseGpu.java -- OpenPose 姿态检测可生成图像中角色动作姿态的骨架图(含脸部特征以及手部骨架检测),这个骨架图可用于控制生成角色的姿态动作。 -- 对应ControlNet模型: control_openpose。 - + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+
+

1. Canny 边缘检测

+ - canny_sdk
+ - Canny 边缘检测预处理器可很好识别出
图像内各对象的边缘轮廓,常用于生成线稿。
+ - 对应ControlNet模型: control_canny
+
+
+
+ +
+
+
+

2. MLSD 线条检测

+ - mlsd_sdk
+ - MLSD 线条检测用于生成房间、
直线条的建筑场景效果比较好。
+ - 对应ControlNet模型: control_mlsd
+
+
+
+ +
+
+
+

3. Scribble 涂鸦

+ - scribble_hed_sdk
+ - scribble_pidinet_sdk
+ - 图片自动生成类似涂鸦效果的草图线条。
+ - 对应ControlNet模型: control_mlsd
+
+
+
+ +
+
+
+

4. SoftEdge 边缘检测

+ - softedge_hed_sdk
+ - HED - HedScribbleExample
+ - HED Safe - HedScribbleExample
+ - softedge_pidinet_sdk
+ - PidiNet - PidiNetGPUExample
+ - PidiNet Safe - PidiNetGPUExample
+ - SoftEdge 边缘检测可保留更多柔和的边缘细节,
类似手绘效果。
+ - 对应ControlNet模型: control_softedge。
+
+
+
+ +
+
+
+

5. OpenPose 姿态检测

+ - pose_sdk
+ - OpenPose 姿态检测可生成图像中角色动作
姿态的骨架图(含脸部特征以及手部骨架检测)
,这个骨架图可用于控制生成角色的姿态动作。
+ - 对应ControlNet模型: control_openpose。
+
+
+
+ +
+
+
+

6. Segmentation 语义分割

+ - seg_upernet_sdk
+ - 语义分割可多通道应用,
原理是用颜色把不同类型的对象分割开,
让AI能正确识别对象类型和需求生成的区界。
+ - 对应ControlNet模型: control_seg。 +
+
+
+ +
+
+
+

7. Depth 深度检测

+ - depth_estimation_midas_sdk
+ - Midas - MidasDepthEstimationExample
+ - depth_estimation_dpt_sdks
+ - DPT - DptDepthEstimationExample
+ - 通过提取原始图片中的深度信息,
生成具有原图同样深度结构的深度图,
越白的越靠前,越黑的越靠后。
+ - 对应ControlNet模型: control_depth。 +
+
+
+ +
+
+
+

8. Normal Map 法线贴图

+ - normal_bae_sdk
+ - NormalBaeExample
+ - 根据图片生成法线贴图,适合CG或游戏美术师。
法线贴图能根据原始素材生成
一张记录凹凸信息的法线贴图,
便于AI给图片内容进行更好的光影处理,
它比深度模型对于细节的保留更加的精确。
法线贴图在游戏制作领域用的较多,
常用于贴在低模上模拟高模的复杂光影效果。
+ - 对应ControlNet模型: control_normal。 +
+
+
+ +
+
+
+

9. Lineart 生成线稿

+ - lineart_sdk
+ - lineart_coarse_sdk
+ - Lineart 边缘检测预处理器可很好识别出
图像内各对象的边缘轮廓,用于生成线稿。 + - 对应ControlNet模型: control_lineart。 +
+
+
+ +
+
+
+

10. Lineart Anime 生成线稿

+ - lineart_anime_sdk
+ - LineArtAnimeExample
+ - Lineart Anime 边缘检测预处理器
可很好识别出卡通图像内
各对象的边缘轮廓,用于生成线稿。
+ - 对应ControlNet模型: control_lineart_anime。 +
+
+
+ +
+
+
+

11. Content Shuffle

+ - content_shuffle_sdk
+ - ContentShuffleExample
+ - Content Shuffle 图片内容变换位置,
打乱次序,配合模型
control_v11e_sd15_shuffle 使用。
+ - 对应ControlNet模型: control_shuffle。 +
+
+
+ +
+
+ + +- 7.2 图像生成SD工具箱 stable_diffusion_sdks
- -
- -#### 4.6. Segmentation 语义分割 -- CPU版本 ControlNetSegCpu.java -- GPU版本 ControlNetSegGpu.java -- 语义分割可多通道应用,原理是用颜色把不同类型的对象分割开,让AI能正确识别对象类型和需求生成的区界。 -- 对应ControlNet模型: control_seg。 - -
- -
- -#### 4.7. Depth 深度检测 -- Midas -- CPU版本 ControlNetDepthDptCpu.java -- GPU版本 ControlNetDepthDptGpu.java -- DPT -- CPU版本 ControlNetDepthMidasCpu.java -- GPU版本 ControlNetDepthMidasGpu.java -- 通过提取原始图片中的深度信息,生成具有原图同样深度结构的深度图,越白的越靠前,越黑的越靠后。 -- 对应ControlNet模型: control_depth。 - -
- -
- -#### 4.8. Normal Map 法线贴图 -- CPU版本 ControlNetNormalbaeCpu.java -- GPU版本 ControlNetNormalbaeGpu.java -- 根据图片生成法线贴图,适合CG或游戏美术师。法线贴图能根据原始素材生成一张记录凹凸信息的法线贴图,便于AI给图片内容进行更好的光影处理,它比深度模型对于细节的保留更加的精确。法线贴图在游戏制作领域用的较多,常用于贴在低模上模拟高模的复杂光影效果。 -- 对应ControlNet模型: control_normal。 - -
- -
- -#### 4.9. Lineart 生成线稿 -- CPU版本 ControlNetLineArtCpu.java -- GPU版本 ControlNetLineArtGpu.java -- Lineart 边缘检测预处理器可很好识别出图像内各对象的边缘轮廓,用于生成线稿。 -- 对应ControlNet模型: control_lineart。 - -
- -
- -#### 4.10. Lineart Anime 生成线稿 -- CPU版本 ControlNetLineArtAnimeCpu.java -- GPU版本 ControlNetLineArtAnimeGpu.java -- Lineart Anime 边缘检测预处理器可很好识别出卡通图像内各对象的边缘轮廓,用于生成线稿。 -- 对应ControlNet模型: control_lineart_anime。 - -
- -
- -#### 4.11. Content Shuffle -- CPU版本 ControlNetShuffleCpu.java -- GPU版本 ControlNetShuffleGpu.java -- Content Shuffle 图片内容变换位置,打乱次序,配合模型 control_v11e_sd15_shuffle 使用。 -- 对应ControlNet模型: control_shuffle。 - -
- -
- - + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+
+

1. 文生图:输入提示词(仅支持英文),
生成图片(仅支持英文)

+ - txt2image_sdk
+
+
+
+ +
+
+
+

2. 图生图:根据图片及提示词
(仅支持英文)生成图片

+ - image2image_sdk
+
+
+
+ +
+
+
+

3. Lora 文生图

+ - lora_sdk
+
+
+
+ +
+
+
+

4. Controlnet 图像生成-4.1. Canny 边缘检测

+ - controlnet_canny_sdk
+ - Canny 边缘检测预处理器可
很好识别出图像内各对象
的边缘轮廓,常用于生成线稿。
+
+
+
+ +
+
+
+

4. Controlnet 图像生成-4.2. MLSD 线条检测

+ - controlnet_mlsd_sdk
+ - MLSD 线条检测用于生成房间、
直线条的建筑场景效果比较好。
+
+
+
+ +
+
+
+

4. Controlnet 图像生成-4.3. Scribble 涂鸦

+ - controlnet_scribble_sdk
+ - 图片自动生成类似涂鸦效果的草图线条。
+
+
+
+ +
+
+
+

4. Controlnet 图像生成-4.4. SoftEdge 边缘检测

+ - controlnet_softedge_sdk
+ - SoftEdge 边缘检测可保留更多
柔和的边缘细节,类似手绘效果。
+
+
+
+ +
+
+
+

4. Controlnet 图像生成-4.5. OpenPose 姿态检测

+ - controlnet_pose_sdk
+ - OpenPose 姿态检测可生成图像
中角色动作姿态的骨架图
(含脸部特征以及手部骨架检测)
,这个骨架图可用于控制生成角色的姿态动作。 +
+
+
+ +
+
+
+

4. Controlnet 图像生成-4.6. Segmentation 语义分割

+ - controlnet_seg_sdk
+ - 语义分割可多通道应用,
原理是用颜色把不同类型的对象分割开,
让AI能正确识别对象类型和需求生成的区界。 +
+
+
+ +
+
+
+

4. Controlnet 图像生成-4.7. Depth 深度检测

+ - controlnet_depth_sdk
+ - 通过提取原始图片中的深度信息,
生成具有原图同样深度结构的深度图,
越白的越靠前,越黑的越靠后。 +
+
+
+ +
+
+
+

4. Controlnet 图像生成-4.8. Normal Map 法线贴图

+ - controlnet_normal_sdk
+ - 根据图片生成法线贴图,
适合CG或游戏美术师。
法线贴图能根据原始素材生成一张记录凹凸信息的法线贴图,
便于AI给图片内容进行更好的光影处理,
它比深度模型对于细节的保留更加的精确。
法线贴图在游戏制作领域用的较多,
常用于贴在低模上模拟高模的复杂光影效果。 +
+
+
+ +
+
+
+

4. Controlnet 图像生成-4.9. Lineart 生成线稿

+ - controlnet_lineart_sdk
+ - controlnet_lineart_coarse_sdk
+ - Lineart 边缘检测预处理器可很好识别出
图像内各对象的边缘轮廓,用于生成线稿。 +
+
+
+ +
+
+
+

4. Controlnet 图像生成-4.10. Lineart Anime 生成线稿

+ - controlnet_lineart_anime_sdk
+ - Lineart Anime
边缘检测预处理器可很好
识别出卡通图像内各对象的边缘轮廓,
用于生成线稿。 +
+
+
+ +
+
+
+

4. Controlnet 图像生成-4.11. Content Shuffle

+ - controlnet_shuffle_sdk
+ - Content Shuffle 图片内容变换位置,
打乱次序,配合模型
control_v11e_sd15_shuffle 使用。 +
+
+
+ +
+
+ -#### 帮助文档: -- https://aias.top/guides.html -- 1.性能优化常见问题: -- https://aias.top/AIAS/guides/performance.html -- 2.引擎配置(包括CPU,GPU在线自动加载,及本地配置): -- https://aias.top/AIAS/guides/engine_config.html -- 3.模型加载方式(在线自动加载,及本地配置): -- https://aias.top/AIAS/guides/load_model.html -- 4.Windows环境常见问题: -- https://aias.top/AIAS/guides/windows.html \ No newline at end of file diff --git a/8_desktop_app/README_CN.md b/8_desktop_app/README_CN.md new file mode 100644 index 00000000..d8d80c2b --- /dev/null +++ b/8_desktop_app/README_CN.md @@ -0,0 +1,62 @@ + + +#### 项目清单: +- 8_desktop_app - [桌面App] +```text + 1). 大模型离线桌面App + 2). OCR文字识别桌面App + 3). 图像高清放大桌面App + ... +``` +
+ + + + + + + + + + + + + +
+
+

大模型离线桌面App - desktop_app_llm

+ - 支持中/英文 + - 模型支持chatglm3,llama3,alpaca3等
+ - 支持4位,8位量化,16位半精度模型。
+ - 支持windows及mac系统
+ - 支持CPU,GPU
+
+
+
+ +
+
+
+

OCR文字识别桌面App - desktop_app_ocr

+ - 图片文字识别
+ - 支持windows, linux, mac 一键安装 +
+
+
+ +
+
+
+

图像高清放大桌面App
+ - desktop_app_upscale

+ - 单张图片分辨率放大
+ - 批量图片分辨率放大
+ - 支持 windows, macos, ubuntu
+
+
+
+ +
+
+
+ diff --git a/README.md b/README.md index 1b90e520..50040fe2 100644 --- a/README.md +++ b/README.md @@ -23,6 +23,18 @@

+ +#### 1. 官网: +- 网址:http://www.aias.top/ +- 帮助:https://aias.top/guides.html + +#### 2. 开源地址: + +- Gitee: https://gitee.com/mymagicpower/AIAS +- GitHub: https://github.com/mymagicpower/AIAS + +#### 3. 人工智能算法: +- https://zhuanlan.zhihu.com/p/693738275
@@ -821,7 +833,8 @@

AI 训练平台 - training

- AI训练平台提供分类模型训练能力。并以REST API形式为上层应用提供接口。 + AI训练平台提供分类模型训练能力。
+ 并以REST API形式为上层应用提供接口。
@@ -834,8 +847,9 @@

代码语义搜索 - code_search

- 用于软件开发过程中的,代码搜代码,语义搜代码。 - 1. 代码语义搜索【无向量引擎版】 - simple_code_search
+ 用于软件开发过程中的,代码搜代码,语义搜代码。
s + 1. 代码语义搜索【无向量引擎版】
+ - simple_code_search
主要特性
- 支持100万以内的数据量
- 随时对数据进行插入、删除、搜索、更新等操作
@@ -902,17 +916,20 @@
-

图像&文本的跨模态相似性比对检索【支持40种语言】- image_text_search

+

图像&文本的跨模态相似性比对检索【支持40种语言】
+ - image_text_search

- 包含两个项目,满足不同场景的需要
- - 1. 图像&文本的跨模态相似性比对检索【无向量引擎版】
+ - 1. 图像&文本的跨模态相似性比对检索
+ 【无向量引擎版】
- simple_image_text_search
- 支持100万以内的数据量
- 随时对数据进行插入、删除、搜索、更新等操作
- - 2. 图像&文本的跨模态相似性比对检索【向量引擎版】
+ - 2. 图像&文本的跨模态相似性比对检索
+ 【向量引擎版】
- image_text_search
- 以图搜图:上传图片搜索
- 以文搜图:输入文本搜索
- - 数据管理:提供图像压缩包(zip格式)上传,图片特征提取 + - 数据管理:提供图像压缩包(zip格式)上传
@@ -930,9 +947,9 @@ - simple_text_search
- 2. 文本向量搜索【向量引擎版】
- text_search
- - 语义搜索,通过句向量相似性,检索语料库中与query最匹配的文本
- - 文本聚类,文本转为定长向量,通过聚类模型可无监督聚集相似文本
- - 文本分类,表示成句向量,直接用简单分类器即训练文本分类器
+ - 语义搜索,通过句向量相似性,
检索语料库中与query最匹配的文本
+ - 文本聚类,文本转为定长向量,
通过聚类模型可无监督聚集相似文本
+ - 文本分类,表示成句向量,
直接用简单分类器即训练文本分类器
- RAG 用于大模型搜索增强生成
@@ -951,17 +968,17 @@ - simple_face_search
- 2. 人像搜索【完整版】
- face_search
- - 搜索管理:提供通用图像搜索,人像搜索,图像信息查看
- - 存储管理:提供图像压缩包(zip格式)上传,人像特征提取,通用特征提取
- - 用户管理:提供用户的相关配置,新增用户后,默认密码为123456
- - 角色管理:对权限与菜单进行分配,可根据部门设置角色的数据权限
- - 菜单管理:已实现菜单动态路由,后端可配置化,支持多级菜单
- - 部门管理:可配置系统组织架构,树形表格展示
+ - 搜索管理:提供通用图像搜索,
人像搜索,图像信息查看
+ - 存储管理:提供图像压缩包(zip格式)上传,
人像特征提取,通用特征提取
+ - 用户管理:提供用户的相关配置,
新增用户后,默认密码为123456
+ - 角色管理:对权限与菜单进行分配,
可根据部门设置角色的数据权限
+ - 菜单管理:已实现菜单动态路由,
后端可配置化,支持多级菜单
+ - 部门管理:可配置系统组织架构,
树形表格展示
- 岗位管理:配置各个部门的职位
- - 字典管理:可维护常用一些固定的数据,如:状态,性别等
- - 系统日志:记录用户操作日志与异常日志,方便开发人员定位排错
- - SQL监控:采用druid 监控数据库访问性能,默认用户名admin,密码123456
- - 定时任务:整合Quartz做定时任务,加入任务日志,任务运行情况一目了然
+ - 字典管理:可维护常用一些固定的数据,
如:状态,性别等
+ - 系统日志:记录用户操作日志与异常日志,
方便开发人员定位排错
+ - SQL监控:采用druid 监控数据库访问性能,
默认用户名admin,密码123456
+ - 定时任务:整合Quartz做定时任务,
加入任务日志,任务运行情况一目了然
- 服务监控:监控服务器的负载情况
@@ -975,7 +992,7 @@

语音识别Web 应用 - asr

- - 本例子提供了英文语音识别,中文语音识别。 + - 本例子提供了英文语音识别,
中文语音识别。
@@ -1002,7 +1019,7 @@

1. Canny 边缘检测

- canny_sdk
- - Canny 边缘检测预处理器可很好识别出图像内各对象的边缘轮廓,常用于生成线稿。
+ - Canny 边缘检测预处理器可很好识别出
图像内各对象的边缘轮廓,常用于生成线稿。
- 对应ControlNet模型: control_canny
@@ -1017,7 +1034,7 @@

2. MLSD 线条检测

- mlsd_sdk
- - MLSD 线条检测用于生成房间、直线条的建筑场景效果比较好。
+ - MLSD 线条检测用于生成房间、
直线条的建筑场景效果比较好。
- 对应ControlNet模型: control_mlsd
@@ -1033,7 +1050,7 @@

3. Scribble 涂鸦

- scribble_hed_sdk
- scribble_pidinet_sdk
- - 不用自己画,图片自动生成类似涂鸦效果的草图线条。
+ - 图片自动生成类似涂鸦效果的草图线条。
- 对应ControlNet模型: control_mlsd
@@ -1053,7 +1070,7 @@ - softedge_pidinet_sdk
- PidiNet - PidiNetGPUExample
- PidiNet Safe - PidiNetGPUExample
- - SoftEdge 边缘检测可保留更多柔和的边缘细节,类似手绘效果。
+ - SoftEdge 边缘检测可保留更多柔和的边缘细节,
类似手绘效果。
- 对应ControlNet模型: control_softedge。
@@ -1068,7 +1085,7 @@

5. OpenPose 姿态检测

- pose_sdk
- - OpenPose 姿态检测可生成图像中角色动作姿态的骨架图(含脸部特征以及手部骨架检测),这个骨架图可用于控制生成角色的姿态动作。
+ - OpenPose 姿态检测可生成图像中角色动作
姿态的骨架图(含脸部特征以及手部骨架检测)
,这个骨架图可用于控制生成角色的姿态动作。
- 对应ControlNet模型: control_openpose。
@@ -1083,7 +1100,7 @@

6. Segmentation 语义分割

- seg_upernet_sdk
- - 语义分割可多通道应用,原理是用颜色把不同类型的对象分割开,让AI能正确识别对象类型和需求生成的区界。
+ - 语义分割可多通道应用,
原理是用颜色把不同类型的对象分割开,
让AI能正确识别对象类型和需求生成的区界。
- 对应ControlNet模型: control_seg。
@@ -1101,7 +1118,7 @@ - Midas - MidasDepthEstimationExample
- depth_estimation_dpt_sdks
- DPT - DptDepthEstimationExample
- - 通过提取原始图片中的深度信息,生成具有原图同样深度结构的深度图,越白的越靠前,越黑的越靠后。
+ - 通过提取原始图片中的深度信息,
生成具有原图同样深度结构的深度图,
越白的越靠前,越黑的越靠后。
- 对应ControlNet模型: control_depth。 @@ -1117,7 +1134,7 @@

8. Normal Map 法线贴图

- normal_bae_sdk
- NormalBaeExample
- - 根据图片生成法线贴图,适合CG或游戏美术师。法线贴图能根据原始素材生成一张记录凹凸信息的法线贴图,便于AI给图片内容进行更好的光影处理,它比深度模型对于细节的保留更加的精确。法线贴图在游戏制作领域用的较多,常用于贴在低模上模拟高模的复杂光影效果。
+ - 根据图片生成法线贴图,适合CG或游戏美术师。
法线贴图能根据原始素材生成
一张记录凹凸信息的法线贴图,
便于AI给图片内容进行更好的光影处理,
它比深度模型对于细节的保留更加的精确。
法线贴图在游戏制作领域用的较多,
常用于贴在低模上模拟高模的复杂光影效果。
- 对应ControlNet模型: control_normal。 @@ -1133,7 +1150,7 @@

9. Lineart 生成线稿

- lineart_sdk
- lineart_coarse_sdk
- - Lineart 边缘检测预处理器可很好识别出图像内各对象的边缘轮廓,用于生成线稿。 + - Lineart 边缘检测预处理器可很好识别出
图像内各对象的边缘轮廓,用于生成线稿。
- 对应ControlNet模型: control_lineart。 @@ -1149,7 +1166,7 @@

10. Lineart Anime 生成线稿

- lineart_anime_sdk
- LineArtAnimeExample
- - Lineart Anime 边缘检测预处理器可很好识别出卡通图像内各对象的边缘轮廓,用于生成线稿。
+ - Lineart Anime 边缘检测预处理器
可很好识别出卡通图像内
各对象的边缘轮廓,用于生成线稿。
- 对应ControlNet模型: control_lineart_anime。 @@ -1165,7 +1182,7 @@

11. Content Shuffle

- content_shuffle_sdk
- ContentShuffleExample
- - Content Shuffle 图片内容变换位置,打乱次序,配合模型 control_v11e_sd15_shuffle 使用。
+ - Content Shuffle 图片内容变换位置,
打乱次序,配合模型
control_v11e_sd15_shuffle 使用。
- 对应ControlNet模型: control_shuffle。 @@ -1184,7 +1201,7 @@
-

1. 文生图:输入提示词(仅支持英文),生成图片(仅支持英文)

+

1. 文生图:输入提示词(仅支持英文),
生成图片(仅支持英文)

- txt2image_sdk
@@ -1197,7 +1214,7 @@
-

2. 图生图:根据图片及提示词(仅支持英文)生成图片

+

2. 图生图:根据图片及提示词
(仅支持英文)生成图片

- image2image_sdk
@@ -1223,9 +1240,9 @@
-

4. Controlnet 图像生成-4.1. Canny 边缘检测

+

4. Controlnet 图像生成
-4.1. Canny 边缘检测

- controlnet_canny_sdk
- - Canny 边缘检测预处理器可很好识别出图像内各对象的边缘轮廓,常用于生成线稿。
+ - Canny 边缘检测预处理器可
很好识别出图像内各对象
的边缘轮廓,常用于生成线稿。
@@ -1237,9 +1254,9 @@
-

4. Controlnet 图像生成-4.2. MLSD 线条检测

+

4. Controlnet 图像生成
-4.2. MLSD 线条检测

- controlnet_mlsd_sdk
- - MLSD 线条检测用于生成房间、直线条的建筑场景效果比较好。
+ - MLSD 线条检测用于生成房间、
直线条的建筑场景效果比较好。
@@ -1251,23 +1268,23 @@
-

4. Controlnet 图像生成-4.3. Scribble 涂鸦

+

4. Controlnet 图像生成
-4.3. Scribble 涂鸦

- controlnet_scribble_sdk
- - 不用自己画,图片自动生成类似涂鸦效果的草图线条。
+ - 图片自动生成类似涂鸦效果的草图线条。
- +
-

4. Controlnet 图像生成-4.4. SoftEdge 边缘检测

+

4. Controlnet 图像生成
-4.4. SoftEdge 边缘检测

- controlnet_softedge_sdk
- - SoftEdge 边缘检测可保留更多柔和的边缘细节,类似手绘效果。
+ - SoftEdge 边缘检测可保留更多
柔和的边缘细节,类似手绘效果。
@@ -1279,9 +1296,9 @@
-

4. Controlnet 图像生成-4.5. OpenPose 姿态检测

+

4. Controlnet 图像生成
-4.5. OpenPose 姿态检测

- controlnet_pose_sdk
- - OpenPose 姿态检测可生成图像中角色动作姿态的骨架图(含脸部特征以及手部骨架检测),这个骨架图可用于控制生成角色的姿态动作。 + - OpenPose 姿态检测可生成图像
中角色动作姿态的骨架图
(含脸部特征以及手部骨架检测)
,这个骨架图可用于控制生成角色的姿态动作。
@@ -1293,9 +1310,9 @@
-

4. Controlnet 图像生成-4.6. Segmentation 语义分割

+

4. Controlnet 图像生成
-4.6. Segmentation 语义分割

- controlnet_seg_sdk
- - 语义分割可多通道应用,原理是用颜色把不同类型的对象分割开,让AI能正确识别对象类型和需求生成的区界。 + - 语义分割可多通道应用,
原理是用颜色把不同类型的对象分割开,
让AI能正确识别对象类型和需求生成的区界。
@@ -1307,9 +1324,9 @@
-

4. Controlnet 图像生成-4.7. Depth 深度检测

+

4. Controlnet 图像生成
-4.7. Depth 深度检测

- controlnet_depth_sdk
- - 通过提取原始图片中的深度信息,生成具有原图同样深度结构的深度图,越白的越靠前,越黑的越靠后。 + - 通过提取原始图片中的深度信息,
生成具有原图同样深度结构的深度图,
越白的越靠前,越黑的越靠后。
@@ -1321,9 +1338,9 @@
-

4. Controlnet 图像生成-4.8. Normal Map 法线贴图

+

4. Controlnet 图像生成
-4.8. Normal Map 法线贴图

- controlnet_normal_sdk
- - 根据图片生成法线贴图,适合CG或游戏美术师。法线贴图能根据原始素材生成一张记录凹凸信息的法线贴图,便于AI给图片内容进行更好的光影处理,它比深度模型对于细节的保留更加的精确。法线贴图在游戏制作领域用的较多,常用于贴在低模上模拟高模的复杂光影效果。 + - 根据图片生成法线贴图,
适合CG或游戏美术师。
法线贴图能根据原始素材生成
一张记录凹凸信息的法线贴图,
便于AI给图片内容进行更好的光影处理,
它比深度模型对于细节的保留更加的精确。
法线贴图在游戏制作领域用的较多,
常用于贴在低模上模拟高模的复杂光影效果。
@@ -1335,10 +1352,10 @@
-

4. Controlnet 图像生成-4.9. Lineart 生成线稿

+

4. Controlnet 图像生成
-4.9. Lineart 生成线稿

- controlnet_lineart_sdk
- controlnet_lineart_coarse_sdk
- - Lineart 边缘检测预处理器可很好识别出图像内各对象的边缘轮廓,用于生成线稿。 + - Lineart 边缘检测预处理器可很好识别出
图像内各对象的边缘轮廓,用于生成线稿。
@@ -1350,23 +1367,23 @@
-

4. Controlnet 图像生成-4.10. Lineart Anime 生成线稿

+

4. Controlnet 图像生成
-4.10. Lineart Anime 生成线稿

- controlnet_lineart_anime_sdk
- - 通过提取原始图片中的深度信息,生成具有原图同样深度结构的深度图,越白的越靠前,越黑的越靠后。 + - Lineart Anime
边缘检测预处理器可很好
识别出卡通图像内各对象的边缘轮廓,
用于生成线稿。
- +
-

4. Controlnet 图像生成-4.11. Content Shuffle

+

4. Controlnet 图像生成
-4.11. Content Shuffle

- controlnet_shuffle_sdk
- - Content Shuffle 图片内容变换位置,打乱次序,配合模型 control_v11e_sd15_shuffle 使用。 + - Content Shuffle 图片内容变换位置,
打乱次序,配合模型
control_v11e_sd15_shuffle 使用。
@@ -1378,6 +1395,7 @@ + - 8 8_desktop_app - [桌面App] ```text 1). 大模型离线桌面App @@ -1436,23 +1454,13 @@ -#### archive - [废弃不再维护的项目] - +- 9 archive - [废弃不再维护的项目] -#### 1. 官网: -- 网址:http://www.aias.top/ -- 帮助:https://aias.top/guides.html -#### 2. 开源地址: -- Gitee: https://gitee.com/mymagicpower/AIAS -- GitHub: https://github.com/mymagicpower/AIAS - -#### 3. 人工智能算法: -- https://zhuanlan.zhihu.com/p/693738275 -#### 4. 其它研究专题: +### 其它研究专题: #### 1). AI + 量子计算