近日
国产大模型DeepSeek备受关注
成功引发了热议
HCP实验室优秀本科毕业生辛华剑
是DeepSeek-R1的主要参与者之一
辛华剑本科就读于中山大学,曾担任梁小丹老师的研究助理,专注于语言模型在定理证明中的应用,现于爱丁堡大学攻读博士学位。
在DeepSeek AI实习期间,辛华剑以核心作者身份发表了以下论文,为DeepSeek大模型的研发提供了重要支持。
论文链接:
https://arxiv.org/abs/2405.14333
该工作提出了一种从高中和本科水平的数学竞赛问题中生成大量合成证明数据的方法。通过将自然语言问题转化为形式化声明、过滤掉低质量的声明,并使用迭代证明生成技术,该工作创建了800万条证明数据点,并显著提高了DeepSeekMath 7B模型在ATP任务中的表现。模型在这些合成数据上进行训练时,表现优于GPT-4和其他方法,在miniF2F和FIMO等基准测试中取得了更好的成绩。
该论文的合作者郭达雅正是DeepSeek-R1的核心作者,同样毕业于中山大学。