训练 | 标签 | OldWang TechTalk

OldWang TechTalk

用chatgpt生成多轮完整对话数据，而不是QA对，从而有更好的效果。同时使用chatgpt做了一个对齐方式代替人类的对齐方式（SDF，Self-Distillation with Feedback）

老王TechTalk

老王TechTalk

Do not go gentle into that good night, rage, rage!

最新文章