编辑
2025-12-18
技术杂谈
00

Credit

  • 授课教师: 梁红瑾
  • 上课时间:2025秋
  • 主要是分成lambda calculussemantics两部分
编辑
2025-07-30
技术杂谈
00

事件起因:

我需要微调一个多模态大模型,为了压缩图片输入的token数量,防止上下文数量过长导致训练时间和效果变差,在多模态大模型的Vision Encoder后加入一个模块用于把每张图片的token数压缩至32个.

编辑
2025-07-16
技术杂谈
00
编辑
2025-06-27
技术杂谈
00

强化学习基本组件

  • Actor 你的策略 (一般来说你只可以控制这个)
  • Environment 环境
  • Reward Function 奖励函数
编辑
2025-06-21
技术杂谈
00

回忆版