火山引擎发布深度思考模型豆包1.5
2025-04-17 20:09
新京报贝壳财经讯(记者罗亦丹)当腾讯和百度选择在C端产品接入DeepSeek获得大量关注时,4月17日,字节跳动迈出了自己在推理模型领域的关键一步——正式发布豆包1.5・深度思考模型。
字节跳动旗下火山引擎总裁谭待以“效果好、延迟低、支持多模态”来描述这一模型。他表示,“深度思考模型是构建Agent的基础,模型要有能力做好思考、计划和反思,并且一定要支持多模态,就像人类具备视觉和听觉一样,Agent才能更好地处理复杂任务。”
在关键的技术性能方面,火山引擎方面披露豆包1.5在通用任务中的人类评估表现超DeepSeek R18%,覆盖多场景需求。而单位推理成本相比DeepSeek R1降低50%。
技术报告显示,豆包深度思考模型采用MoE架构,总参数为200B,激活参数仅20B,基于高效算法和高性能推理系统,豆包模型API服务在保障高并发的同时,延迟低至20毫秒。
豆包深度思考模型还具备视觉推理能力,能像人类一样对看到的事物进行联想和思考,谭待举例说明,“模型可以看懂复杂的企业项目管理流程图表,快速定位到关键信息,并以强大的指令遵循能力,严格按照流程图,回答客户的问题;分析航拍图时,能结合地貌特征判断区域开发可行性。有多模态能力的加持,豆包深度思考模型可以助力企业在更多场景实现智能化升级。”
据火山引擎披露,截至2025年3月底,豆包大模型日均tokens调用量已达到12.7万亿,较去年5月发布时增长上百倍。谭待表示,Agent智能体应用发展将带动大模型进一步普及。
此外,火山引擎还同步升级了文生图模型3.0、视觉理解模型,并推出OS Agent解决方案及AI云原生推理套件。
编辑 黄鑫宇
校对 王心
来阅读我的更多文章吧

罗亦丹
贝壳财经记者
记者主页
展开全文


全文
0字
您已阅读
%

打开贝壳财经APP 阅读更多精彩资讯