✨ 使用 AI 智能整理您的技术笔记、提取关键词和待办事项。立即体验 →
Technical Note

Doubao-Seed-1.8 Agent评测:大模型送外卖的长上下文能力实测

📅 2025-12-19Summary

09:14 关注

让大模型送外卖?来看字节跳动刚刚发布的新模型Doubao-Seed-1.8 Agent能力评测!

大家经常看到我的评测都是让大模型写代码,今天咱们整个新活,如果让大模型送外卖,看看大模型能赚多少钱?

为了这个测试我写了个框架,叫做硅基骑手,内置了15个toolcall,包括移动、接单、获取小票、取餐、送餐、充电等等,让大模型通过调用这些toolcall来模拟整个外卖骑手的送餐过程。

想要查看完整笔记内容并体验 AI 智能整理功能吗?

免费注册 MeAct
Doubao-Seed-1.8 Agent大模型长上下文评测Agent工具调用实测

提升学习效率

Memory 记录瞬间,AI 整理智慧。让每一个技术灵感都能沉淀为知识。

免费注册 MeAct