负责大模型方向技术的研究和应用,构建大规模通用智能系统,工作内容包括以下三个方向:
1. 从零训练语言大模型,并优化全链路相关技术,打造行业领先的大模型
2. 负责追踪大模型学术进展,预研前沿技术问题,打造行业领先技术影响力
3. 负责根据业务场景,抽象技术问题,预研和实现大模型技术,打造卓越的用户体验
技术方向包括但不限于:
1. 模型架构、预训练方法、高效微调、模型评估及迭代
2. 知识增强、工具增强、AI Agent
3. 幻觉、安全、时效性等问题解决
4. 训练和推理加速、模型量化、端测落地
5. 大模型核心能力提升,包括理解能力、知识能力、推理能力、生成能力和语言能力等
职位要求
1. 计算机相关专业获得硕士及以上学位, 发表过自然语言处理/大模型相关研究AI顶会论文优先;
2. 掌握NLP主流大模型,如GPT3/T5/PaLM/LLaMA/GLM等的原理,并对差异有深入的理解;
3. 熟练掌握主流深度学习框架pytorch/tensorflow,大模型训练框架Megatron-LM/Deepspeed等多机多卡方案,有大模型训练和项目经验优先;
4. 有良好的代码开发能力,有开源项目开发经验优先。
Copyright C 2019-2024 All Rights Reserved 版权所有 怀才当遇人才科技集团 赣ICP备20001974号-1
地址:江西运营中心:江西省南昌市红谷滩区VR产业基地4A写字楼6楼 EMAIL:admin@hcdyhr.cn
Powered by 怀才当遇人才科技集团