有道云密集展示大模型成果！100集短剧翻译、配音、润色成本仅100元，音视频翻译平台开启内测-ks8凯发官方网站

8月20日报道，今天，网易有道集中展示了多项大模型成果，包括子曰3系列大模型的新进展，以及ai有道词典、有道音视频平台、有道ai答疑笔spacex等多项软硬件成果。

网易有道ceo周枫谈道，目前网易有道聚焦于广告和教育领域。

教育领域，其今年6月开源的子曰3系列数学大模型，是14b参数的轻量级推理模型，每百万token服务成本0.15美元，是通用大模型的1/10。此外网易有道还升级了ai有道词典，二代ai答疑笔新增了全景拼图、视频答疑等功能，二代有道答疑笔wi-fi版本售价1199元，4g版本1399元。

广告领域，网易有道针对电商、短剧出海等需求推出的有道音视频平台，可以处理1gb、60分钟音视频的原声人声翻译能力。网易有道智能应用事业部负责人张艺透露，目前处理一部100集短剧的行业平均价格为1500元，有道音视频翻译平台成本仅为100元，能一次性提供翻译、配音到润色的全流程服务。

刚刚！阿里推出首个开源多模态深度研究agent，四大vqa基准测试赶超gpt-4o

对于ai教育行业的发展，周枫将教育行业类比自动驾驶的分级，他认为，教育ai正在从l3的学习辅助到l4的虚拟导师完成一次关键的跃迁。目前，ai已经不是被动的应答者，而是具备了接近人类老师的思考能力，能主导引导学生思路甚至预判学生的难点。

一、ai应用加速向高价值垂直场景渗透，有道聚焦教育和广告

周枫分享了基于当下大模型行业的发展，其对大模型应用落地、技术迭代的思考。

首先，他认为大模型的推理能力更强、思考更加深入，当下从推理迈向agent时代体现出两大新变化，agent可以自主执行复杂任务，能自主完成此前需要人工分解的繁琐步骤；agent能自主检查和修正答案，可以攻克更难的问题。

第二个趋势是ai应用正在加速向高价值垂直场景渗透，在创意设计、市场营销、办公、医学研究等高度专业化场景的ai工具越来越好用。

刚刚！阿里推出首个开源多模态深度研究agent，四大vqa基准测试赶超gpt-4o

在此基础上，网易有道已经形成了聚焦教育和广告两大领域的业务体系。

广告和市场营销层面，今年以来，网易有道依托模型能力，有道智选推出了小智广告ai优化师与创意生产工具箱imagicbox。

小智广告ai优化师基于ai投放决策模型可满足企业从投前到投后全流程的辅助决策，投前针对广告策略素材投放计划和行业素材解决广告主需求，投中一键生成最优的人群投放决策，投后生成投放问题的诊断报告；imagicbox可以帮助广告企业独立生成图像、视频模版。

刚刚！阿里推出首个开源多模态深度研究agent，四大vqa基准测试赶超gpt-4o

这两大产品实现了企业从广告创意到投放优化的全流程智能化。

在教育层面，今年6月，网易有道推出14b轻量级子曰3系列数学大模型，在ck12-math（internal）、gaokao-bench（math）、mathbench（k12）、math500等数据集上各项得分均高于deepseek-r1等通用大模型，在数学解题和讲题方面的多个评测中，表现达到sota水平。

此外，网易有道子曰教育大模型在翻译和辅导场景进行了重点优化。

翻译场景，小语种翻译模型可以实现38种语言实时翻译，并具备多模态深度理解能力；辅导场景覆盖英文作文批改、文言文解析、数学习题拆解等全学科高频场景。

刚刚！阿里推出首个开源多模态深度研究agent，四大vqa基准测试赶超gpt-4o

技术层面，小语种翻译模型实现基于单一模型原生支持38种使用语言。周枫透露，其研究人员实现了使得模型底层具备理解和多语言表达能力，并通过针对翻译需求的打分模型，进行多阶段强化学习训练，解决了模型翻译复杂句式、专业术语的难题。

在子曰3系列数学大模型上，网易有道同样采用了强化学习训练策略，引入难度加权策略等加强模型的解题能力等。

二、有道词典累计用户量超10亿人，有道音视频翻译平台开启内测

网易有道智能应用事业部负责人张艺透露，2023年至今，网易有道ai应用订阅的销售额超过3余亿元，ai功能整体渗透率超过40%。截至目前，网易有道词典累计用户量超过10亿人次。据他们观察，词典用户的需求正变得更加细分、专业。

网易有道升级后的ai有道词典搭载了14b小参数的子曰翻译大模型2.0，在翻译和多模态能力方面进行了升级，该模型已经实现翻译能力超越国内外通用大模型。

具体来看，首先是ai同传能力，其围绕识别能力、语言覆盖、翻译质量三个方面进行了升级。

ai有道词典可实现抗噪声稳定识别输出，同时新增支持71种语言、125种口音，以及经济、化学、计算机、医学等学术术语库。张艺称，有道词典ai同传已服务超1000万人次。

此外，他谈道，随着大模型的发展，ai翻译已经进入多模态内容深度理解与生成的阶段，基于此网易有道展示了基于多模态大模型的ai翻译平台有道音视频翻译。

该平台内测版本已经上线，正式版本9月初发布，发布初期可以限时免费使用。有道音视频翻译平台支持任意语种音视频上传，实现原声克隆、人声翻译，已经在电商出海、短剧出海有所应用。

刚刚！阿里推出首个开源多模态深度研究agent，四大vqa基准测试赶超gpt-4o

这背后的技术优势在于，网易有道研发了文本、音频、视频多模态一体化原声翻译系统vocalfusion，可以识别主播的性别、年龄、动作、场景，进行深度还原。音色方面，有道自研tts技术adaptive voice cloning，用户可以通过简单提示词调节主播说话的语气，如让说话声音更兴奋、更低沉等。

刚刚！阿里推出首个开源多模态深度研究agent，四大vqa基准测试赶超gpt-4o

在时间方面，有道音视频翻译平台处理10分钟视频耗时3分钟，可以处理1gb、60分钟的视频。

刚刚！阿里推出首个开源多模态深度研究agent，四大vqa基准测试赶超gpt-4o

三、ai答疑笔升级，新增视频讲题、扫描拼图

今年2月网易有道推出ai答疑笔spaceone，网易有道高级副总裁吴映晖透露，目前小p答疑累计响应次数已经超过1.4亿次，ai答疑功能的使用频次从每人每日4-5次，到现在超过10次。他补充说，ai答疑笔会先给学生关键提示，鼓励学生尝试自己解决，如果还是没有解决，会提供详细解决过程，分步解析，学生中途不明白的地方可以随时追问。

此次有道推出的二代ai答疑笔spacex，新增了全景拼图、板书式视频答疑等新功能。

spacex笔头宽度为3.6cm，吴映晖称，据他们调研，这可以实现80%的题目一次扫描完成，对于带图片、长篇幅的题目，spacex可以基于全景拼图功能自动拼接题目。

刚刚！阿里推出首个开源多模态深度研究agent，四大vqa基准测试赶超gpt-4o

此外，有道将答疑功能放置到了答疑笔的第一入口，可以让用户快速调用相应功能，并且不同于拍照搜题，提笔扫描的交互方式，直接扫描可以简化用户打开摄像头、拍照等步骤，更便捷、速度更快。

讲题过程中，该答疑笔在文字分步骤答疑模式、苏格拉底引导答疑模式之外，新增了板书式视频答疑功能。这一新功能通过图片、文字、声音的形式，更适合于推演过程复杂、本身就有图片的题目。

刚刚！阿里推出首个开源多模态深度研究agent，四大vqa基准测试赶超gpt-4o

硬件层面的升级，二代有道ai答疑笔搭载4.4英寸oled全面屏，机身厚度为13mm，重量为105g，支持4g插卡上网，满电续航可以达到7天。

结语：软硬件融合破解教育、广告行业痛点

从有道词典笔到有道答疑笔，网易有道正不断发掘大模型在教育领域的多样化需求，并通过软硬件结合的方式推陈出新，解决更多教育上的痛点。与现在市面上的学习机等硬件形态相比，网易有道聚焦于扫读的交互形式，覆盖到其在查词、翻译等教育领域的更多高频使用场景。

与此同时，ai应用正在加速向高价值垂直场景渗透的当下，网易有道基于其在多模态大模型领域的布局，聚焦于教育和广告领域，将进一步将这些场景的痛点与大模型发展深度融合。

有道云密集展示大模型成果！100集短剧翻译、配音、润色成本仅100元，音视频翻译平台开启内测-ks8凯发官方网站

干货教程