内容简介

"●为预训练和微调寻找合适的用例和数据集

●使用定制的加速器和GPU,为大规模训练做好准备

●配置AWS和SageMaker环境,**限度地提高性能

●根据模型和约束条件选择超参数

●使用多种并行方式分发模型和数据集

●利用作业重启、间歇性健康检查等方式避开陷阱

●定性和定量地评估模型

●部署模型,在运行时进行改进和监控

"