苹果公司在机器学习的研究页面上公布了一项最新的自动驾驶研究论文,其中提出了一个全新的名为GIGAFLOW的大规模自博弈强化学习框架。该框架能有效地训练出通用的驾驶策略,并且具有高度的鲁棒性。据数据显示,通过这套自监督训练体系,每10天就能完成16亿公里的训练,相当于9500年的驾驶经验。这种训练方式的成本效益也非常高,每百万公里的模拟成本低于5美元,而且不需要真实的驾驶数据。
苹果公司在机器学习的研究页面上公布了一项最新的自动驾驶研究论文,其中提出了一个全新的名为GIGAFLOW的大规模自博弈强化学习框架。该框架能有效地训练出通用的驾驶策略,并且具有高度的鲁棒性。据数据显示,通过这套自监督训练体系,每10天就能完成16亿公里的训练,相当于9500年的驾驶经验。这种训练方式的成本效益也非常高,每百万公里的模拟成本低于5美元,而且不需要真实的驾驶数据。