欢迎来我的知乎博客提问: https://www.zhihu.com/people/be_with_you
translate 域适应翻译模型, 微调模型命令
python run_translation.py --model_name_or_path
facebook/m2m100_418M
--do_train
--do_eval
--fp16 True
--dataset_name custom_zh_en
--source_lang zh
--target_lang en
--output_dir output/zh-en-translation
--per_device_train_batch_size=8
--per_device_eval_batch_size=8
--overwrite_output_dir
--predict_with_generate
实际测试准确率不高,还是需要结合人工制定规则+有监督训练,在结合部分无监督训练可能有更好效果
unsuper_classification.py
TextCNN文件夹 注意:数据目录下的每个文件夹放好对应的要训练的目录,目录里面放好单个文件就可以 /data/train/
├── Readme.md
├── config.py
├── data
│ ├── eval
│ │ ├── 新闻
│ │ ├── 科技
│ │ └── 天气
│ ├── predict
│ └── train
│ ├── 新闻
│ ├── 科技
│ └── 天气
├── data_utils.py
├── main.py
├── model
└── model_utils.py
Res2Net文件夹
├── __init__.py
├── config.py
├── data
│ ├── eval
│ │ ├── 狗
│ │ ├── 猫
│ │ ├── 鸡
│ │ └── 鸭
│ ├── predict
│ ├── test
│ │ ├── 狗
│ │ ├── 猫
│ │ ├── 鸡
│ │ └── 鸭
│ └── train
│ ├── 狗
│ ├── 猫
│ ├── 鸡
│ └── 鸭
├── data_utils.py #数据处理
├── main.py #程序入口,支持训练,预测,继续训练
├── model #保存模型
├── model_utils.py #模型处理
└── res2next.py #res2next模型