Technical Note
Doubao-Seed-1.8 Agent评测:大模型送外卖的长上下文能力实测
09:14 关注
让大模型送外卖?来看字节跳动刚刚发布的新模型Doubao-Seed-1.8 Agent能力评测!
大家经常看到我的评测都是让大模型写代码,今天咱们整个新活,如果让大模型送外卖,看看大模型能赚多少钱?
为了这个测试我写了个框架,叫做硅基骑手,内置了15个toolcall,包括移动、接单、获取小票、取餐、送餐、充电等等,让大模型通过调用这些toolcall来模拟整个外卖骑手的送餐过程。
想要查看完整笔记内容并体验 AI 智能整理功能吗?
免费注册 MeActDoubao-Seed-1.8 Agent大模型长上下文评测Agent工具调用实测