Paddle-awdlstm

论文地址：Universal Language Model Fine-tuning for Text Classification

概述：归纳迁移学习已经极大地影响了计算机视觉，但现有的NLP方法仍然需要特定任务的修改和从零开始的训练。我们提出了通用语言模型微调(Universal Language Model Fine-tuning, ULMFiT)，这是一种有效的迁移学习方法，可以应用于自然语言处理中的任何任务，并介绍了语言模型微调的关键技术。在6个文本分类任务上，我们的方法显著优于目前最先进的方法，在大多数数据集上降低了18-24%的错误。

模型概述

原论文效果

开始

1.预训练权重下载

链接：https://pan.baidu.com/s/1wTaAFGFKKlHoFI92Pf4sIw 提取码：wtrq

Wikitext-103是超过 1 亿个语句的数据合集，全部从维基百科的 Good 与 Featured 文章中提炼出来。广泛用于语言建模，当中包括 fastai 库和 ULMFiT 算法中经常用到的预训练模型。该权重为基于此数据集上预训练后得到的权重包含了已转换的fwd和bwd两个权重

2.模型微调

AG News Dataset 拥有超过 100 万篇新闻文章，其中包含 496,835 条 AG 新闻语料库中超过 2000 个新闻源的文章，该数据集仅采用了标题和描述字段，每种类别均拥有 30,000 个训练样本和 1900 个测试样本。

本次微调过程均在AIStudio上进行，使用GPU模式进行步骤： 1.进入bash执行 pip install paddlepaddle pip install paddlenlp pip install spacy pip install --upgrade numpy

2.下载预训练权重，将converted_fwd.pdparams和converted_bwd.pdparams放入根目录

3.进入bash，执行命令sh run_pretrain.sh 在每一个阶段会生成当前最佳acc的权重并且保存，作为下一个阶段微调的预加载权重所有的language model finetune和text classifier finetune的日志都记录在log文件夹下

3.数据集验证

进入bash执行 python merge_preds.py 分别对converted_fwd.pdparams和converted_bwd.pdparams的微调结果生成对应的结果文件然后再执行 python create_final_preds.py 对两个结果文件进行融合，得到最终的预测

由于时间关系，只有对converted_fwd.pdparams微调后的预测结果，该权重对测试集的预测acc如下：

fwd预测效果

而若在与converted_bwd.pdparams微调后融合的结果下，理论上能提升0.5-0.7pp

论文理论效果

可使用已微调的forward权重和backward权重来查看效果。已微调权重链接下载：链接：https://pan.baidu.com/s/18UB_irYi6yRZJMsZKUwC9w 提取码：0wyy

将已微调权重放在根目录后，执行命令sh run_final_pred.sh

最终融合效果

在一定误差范围内达到论文理论效果

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
images		images
log		log
log_reprod		log_reprod
README.md		README.md
cls_data.py		cls_data.py
create_final_preds.py		create_final_preds.py
dataset.py		dataset.py
eval_cls.py		eval_cls.py
logger.py		logger.py
merge_pred_bwd.py		merge_pred_bwd.py
merge_pred_fwd.py		merge_pred_fwd.py
merge_preds.py		merge_preds.py
model.py		model.py
run_cls.py		run_cls.py
run_final_pred.sh		run_final_pred.sh
run_lm.py		run_lm.py
run_pretrain.sh		run_pretrain.sh
test.csv		test.csv
tokenizer.py		tokenizer.py
train.csv		train.csv
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Paddle-awdlstm

模型概述

原论文效果

开始

1.预训练权重下载

2.模型微调

3.数据集验证

fwd预测效果

论文理论效果

最终融合效果

About

Releases

Packages

Languages

akari0216/Paddle-awdlstm

Folders and files

Latest commit

History

Repository files navigation

Paddle-awdlstm

模型概述

原论文效果

开始

1.预训练权重下载

2.模型微调

3.数据集验证

fwd预测效果

论文理论效果

最终融合效果

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages