编辑
2025-07-30
技术杂谈
00

事件起因:

我需要微调一个多模态大模型,为了压缩图片输入的token数量,防止上下文数量过长导致训练时间和效果变差,在多模态大模型的Vision Encoder后加入一个模块用于把每张图片的token数压缩至32个.

编辑
2025-07-16
技术杂谈
00
编辑
2025-06-27
技术杂谈
00

强化学习基本组件

  • Actor 你的策略 (一般来说你只可以控制这个)
  • Environment 环境
  • Reward Function 奖励函数
编辑
2025-06-21
技术杂谈
00

回忆版

编辑
2025-05-12
技术杂谈
00

在具身智能成为国家新型发展战略的当下,本文尝试完整梳理具身智能的技术路线。