Torchtitan

Torchtitan使用native pytorch实现了3D并行,摆脱了Megatron和Deepspeed。

待更