ks8凯发官方网站
> 实用技巧 > 免费教学 > 有道云密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测

有道云密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测-ks8凯发官方网站

发布时间:2025-08-22 12:44:33

8月20日报道,今天,网易有道集中展示了多项大模型成果,包括子曰3系列大模型的新进展,以及ai有道词典、有道音视频平台、有道ai答疑笔spacex等多项软硬件成果。

网易有道ceo周枫谈道,目前网易有道聚焦于广告和教育领域。

教育领域,其今年6月开源的子曰3系列数学大模型,是14b参数的轻量级推理模型,每百万token服务成本0.15美元,是通用大模型的1/10。此外网易有道还升级了ai有道词典,二代ai答疑笔新增了全景拼图、视频答疑等功能,二代有道答疑笔wi-fi版本售价1199元,4g版本1399元。

广告领域,网易有道针对电商、短剧出海等需求推出的有道音视频平台,可以处理1gb、60分钟音视频的原声人声翻译能力。网易有道智能应用事业部负责人张艺透露,目前处理一部100集短剧的行业平均价格为1500元,有道音视频翻译平台成本仅为100元,能一次性提供翻译、配音到润色的全流程服务。

刚刚!阿里推出首个开源多模态深度研究agent,四大vqa基准测试赶超gpt-4o

对于ai教育行业的发展,周枫将教育行业类比自动驾驶的分级,他认为,教育ai正在从l3的学习辅助到l4的虚拟导师完成一次关键的跃迁。目前,ai已经不是被动的应答者,而是具备了接近人类老师的思考能力,能主导引导学生思路甚至预判学生的难点。

一、ai应用加速向高价值垂直场景渗透,有道聚焦教育和广告

周枫分享了基于当下大模型行业的发展,其对大模型应用落地、技术迭代的思考。

首先,他认为大模型的推理能力更强、思考更加深入,当下从推理迈向agent时代体现出两大新变化,agent可以自主执行复杂任务,能自主完成此前需要人工分解的繁琐步骤;agent能自主检查和修正答案,可以攻克更难的问题。

第二个趋势是ai应用正在加速向高价值垂直场景渗透,在创意设计、市场营销、办公、医学研究等高度专业化场景的ai工具越来越好用。

刚刚!阿里推出首个开源多模态深度研究agent,四大vqa基准测试赶超gpt-4o

在此基础上,网易有道已经形成了聚焦教育和广告两大领域的业务体系。

广告和市场营销层面,今年以来,网易有道依托模型能力,有道智选推出了小智广告ai优化师与创意生产工具箱imagicbox。

小智广告ai优化师基于ai投放决策模型可满足企业从投前到投后全流程的辅助决策,投前针对广告策略素材投放计划和行业素材解决广告主需求,投中一键生成最优的人群投放决策,投后生成投放问题的诊断报告;imagicbox可以帮助广告企业独立生成图像、视频模版。

刚刚!阿里推出首个开源多模态深度研究agent,四大vqa基准测试赶超gpt-4o

这两大产品实现了企业从广告创意到投放优化的全流程智能化。

在教育层面,今年6月,网易有道推出14b轻量级子曰3系列数学大模型,在ck12-math(internal)、gaokao-bench(math)、mathbench(k12)、math500等数据集上各项得分均高于deepseek-r1等通用大模型,在数学解题和讲题方面的多个评测中,表现达到sota水平。

此外,网易有道子曰教育大模型在翻译和辅导场景进行了重点优化。

翻译场景,小语种翻译模型可以实现38种语言实时翻译,并具备多模态深度理解能力;辅导场景覆盖英文作文批改、文言文解析、数学习题拆解等全学科高频场景。

刚刚!阿里推出首个开源多模态深度研究agent,四大vqa基准测试赶超gpt-4o

技术层面,小语种翻译模型实现基于单一模型原生支持38种使用语言。周枫透露,其研究人员实现了使得模型底层具备理解和多语言表达能力,并通过针对翻译需求的打分模型,进行多阶段强化学习训练,解决了模型翻译复杂句式、专业术语的难题。

在子曰3系列数学大模型上,网易有道同样采用了强化学习训练策略,引入难度加权策略等加强模型的解题能力等。

二、有道词典累计用户量超10亿人,有道音视频翻译平台开启内测

网易有道智能应用事业部负责人张艺透露,2023年至今,网易有道ai应用订阅的销售额超过3余亿元,ai功能整体渗透率超过40%。截至目前,网易有道词典累计用户量超过10亿人次。据他们观察,词典用户的需求正变得更加细分、专业。

网易有道升级后的ai有道词典搭载了14b小参数的子曰翻译大模型2.0,在翻译和多模态能力方面进行了升级,该模型已经实现翻译能力超越国内外通用大模型。

具体来看,首先是ai同传能力,其围绕识别能力、语言覆盖、翻译质量三个方面进行了升级。

ai有道词典可实现抗噪声稳定识别输出,同时新增支持71种语言、125种口音,以及经济、化学、计算机、医学等学术术语库。张艺称,有道词典ai同传已服务超1000万人次。

此外,他谈道,随着大模型的发展,ai翻译已经进入多模态内容深度理解与生成的阶段,基于此网易有道展示了基于多模态大模型的ai翻译平台有道音视频翻译。

该平台内测版本已经上线,正式版本9月初发布,发布初期可以限时免费使用。有道音视频翻译平台支持任意语种音视频上传,实现原声克隆、人声翻译,已经在电商出海、短剧出海有所应用。

刚刚!阿里推出首个开源多模态深度研究agent,四大vqa基准测试赶超gpt-4o

这背后的技术优势在于,网易有道研发了文本、音频、视频多模态一体化原声翻译系统vocalfusion,可以识别主播的性别、年龄、动作、场景,进行深度还原。音色方面,有道自研tts技术adaptive voice cloning,用户可以通过简单提示词调节主播说话的语气,如让说话声音更兴奋、更低沉等。

刚刚!阿里推出首个开源多模态深度研究agent,四大vqa基准测试赶超gpt-4o

在时间方面,有道音视频翻译平台处理10分钟视频耗时3分钟,可以处理1gb、60分钟的视频。

刚刚!阿里推出首个开源多模态深度研究agent,四大vqa基准测试赶超gpt-4o

三、ai答疑笔升级,新增视频讲题、扫描拼图

今年2月网易有道推出ai答疑笔spaceone,网易有道高级副总裁吴映晖透露,目前小p答疑累计响应次数已经超过1.4亿次,ai答疑功能的使用频次从每人每日4-5次,到现在超过10次。他补充说,ai答疑笔会先给学生关键提示,鼓励学生尝试自己解决,如果还是没有解决,会提供详细解决过程,分步解析,学生中途不明白的地方可以随时追问。

此次有道推出的二代ai答疑笔spacex,新增了全景拼图、板书式视频答疑等新功能。

spacex笔头宽度为3.6cm,吴映晖称,据他们调研,这可以实现80%的题目一次扫描完成,对于带图片、长篇幅的题目,spacex可以基于全景拼图功能自动拼接题目。

刚刚!阿里推出首个开源多模态深度研究agent,四大vqa基准测试赶超gpt-4o

此外,有道将答疑功能放置到了答疑笔的第一入口,可以让用户快速调用相应功能,并且不同于拍照搜题,提笔扫描的交互方式,直接扫描可以简化用户打开摄像头、拍照等步骤,更便捷、速度更快。

讲题过程中,该答疑笔在文字分步骤答疑模式、苏格拉底引导答疑模式之外,新增了板书式视频答疑功能。这一新功能通过图片、文字、声音的形式,更适合于推演过程复杂、本身就有图片的题目。

刚刚!阿里推出首个开源多模态深度研究agent,四大vqa基准测试赶超gpt-4o

硬件层面的升级,二代有道ai答疑笔搭载4.4英寸oled全面屏,机身厚度为13mm,重量为105g,支持4g插卡上网,满电续航可以达到7天。

结语:软硬件融合破解教育、广告行业痛点

从有道词典笔到有道答疑笔,网易有道正不断发掘大模型在教育领域的多样化需求,并通过软硬件结合的方式推陈出新,解决更多教育上的痛点。与现在市面上的学习机等硬件形态相比,网易有道聚焦于扫读的交互形式,覆盖到其在查词、翻译等教育领域的更多高频使用场景。

与此同时,ai应用正在加速向高价值垂直场景渗透的当下,网易有道基于其在多模态大模型领域的布局,聚焦于教育和广告领域,将进一步将这些场景的痛点与大模型发展深度融合。

干货教程

网站地图