本文旨在总结在阅读多智能体协作相关论文时的感想

AutoAgents: A Framework for Automatic Agent Generation

Blind Judgement: Agent-Based Supreme Court Modelling With GPT

具体实现细节
- 作者以2003-2022的判决书为数据集。一共145MB.
- 数据集样式：{ ’issue’: ’Lorem ipsum...’, ’topic’: ’Lorem ipsum...’, ’opinion’: ’Lorem ipsum...’ ’decision’: ’Lorem ipsum...’ }用gpt-3总结的topic，法官提出的opinion和是否赞同决议decision
- 训练作者以gpt2为基础模型进行微调，一共训练了30个epoch。先以Robert IV的法庭形成一致意见的case为数据训练一个base model，然后根据每个法官各自对case的判罚来独立训练模型。模型最终loss为1.5, 仍有很大优化空间。
- 结果：平均60%,仅仅比随机高50%. Pearson coefficient在-0.03~0.30之间，仍有很大优化空间。
总结：非常好的idea，由于基础模型和训练数据不足等问题仍需改进。

多智能体协作中如何共享信息是一个很重要的点。AutoAgents通过长短期记忆相结合的方式克服了上下文不足的问题，通过多个leader来把任务切分成小点并给予评估。

而Blind Judgement则是一篇很有意思的文章。与其说是多智能体，不如说是单智能体的组合，信息的共享体现在训练数据中。当然，法院的判决是一个能够非常好以自然语言体现出的方面，通过最高法院数据的注入实现了知识的表示。