编辑
2025-07-16
技术杂谈
00
编辑
2025-06-27
技术杂谈
00

强化学习基本组件

  • Actor 你的策略 (一般来说你只可以控制这个)
  • Environment 环境
  • Reward Function 奖励函数
编辑
2025-06-21
技术杂谈
00

回忆版

编辑
2025-05-12
技术杂谈
00

在具身智能成为国家新型发展战略的当下,本文尝试完整梳理具身智能的技术路线。

编辑
2025-05-11
技术杂谈
00