OldWang TechTalk
首页
搜索
归档
文章
1
分类
1
标签
3
归档
搜索
分类
标签
#训练(1)
LLM-白泽🐲
2023-06-30
用chatgpt生成多轮完整对话数据,而不是QA对,从而有更好的效果。同时使用chatgpt做了一个对齐方式代替人类的对齐方式(SDF,Self-Distillation with Feedback)
LLM
chatgpt
训练
PEFT
老王TechTalk
Do not go gentle into that good night, rage, rage!
文章
1
分类
1
标签
3
最新文章
LLM-白泽🐲
2023-6-30