Research

该项目是个人研究学习使用，为了节省空间，notebook都清空了输出

Note: 环境变更请使用git查看历史的requirements.txt

目录说明

mrc.ipynb > 基于BERT做的QA问答
mlm.ipynb > 基于BERT的预训练
generate_model_train.ipynv > 基于bloom的预训练
lora_for_seq_cls.ipynb > 基于lora做的bert训练
ner.ipynb -> 基于BERT做的NER任务
lora_for_llm.ipynb -> 基于lora做的大模型NER任务
agent_tools.ipynb -> 最基础的agent示例
tokenizer_train.ipynb -> 实现了三种编码方式，以及如何解决tokenizer编码回来的空格问题。考虑后续做tiktoken集成到tokenizer中

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
CV		CV
NLP		NLP
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt