出版进化论专访于洋,探究大模型战略布局
近日,国家数据局等17部门联合印发的《“数据要素×”三年行动计划(2024—2026年)》提出,挖掘文化数据价值,贯通各类文化机构数据中心,关联形成中华文化数据库,鼓励依托市场化机制开发文化大模型;建设高质量语料库和基础科学数据集,支持开展人工智能大模型开发和训练。总的来看,这无疑强化了出版机构利用与研发大模型的保障支撑。
2023年ChatGPT火爆全球,生成式人工智能(AIGC)引发了内容创作、审校、翻译、营销等传统生产方式的变革,同时也激发了大众对于多模态大模型的想象与真实需求。在新图景的驱动下,一批领域大模型冉冉升起,并逐步迈入探索商业化与应用场景的阶段。中国出版集团作为出版“国家队”,旗下多家企业依托自身内容资源和技术优势,加强对人工智能、大数据等前沿技术的研究,积极参与通用大数据和垂类大数据模型建设及应用,推进新技术与传统出版业态融合创新。2024年开年之际,出版进化论采访了中国出版集团旗下的中国对外翻译有限公司总经理、中译语通科技股份有限公司董事长于洋,探究布局大模型的战略进展。
技术派企业做大模型
走出一段新增长曲线
于洋
中国对外翻译有限公司总经理、中译语通董事长
近日,中译语通科技股份有限公司(以下简称“中译语通”)与昆明人工智能计算中心签署人工智能战略合作协议,双方将以多模态大模型为核心的通用人工智能为基础展开深度合作,通过建设昆明人工智能计算中心,实现多模态大模型技术重要研究突破,大力探索在军事、国家安全和产业科技等关键领域的场景化应用。
中译语通是中国出版集团旗下中国对外翻译有限公司控股子公司。该公司自2013年成立以来,自主研发并构建起了包括机器翻译、大数据、知识图谱等方向的关键技术生态。在人工智能浪潮中,又成功架起人工智能生成、人机交互和大模型的技术桥梁。用从容、激进、有雄心这几个词描述它进军大模型的状态,仿佛都很适合。作为一家长期坚持技术务实的公司来说,如何在大模型技术浪潮里找到自身的“成长性”,将是其站稳科技前沿阵地的关键。
务实的技术基因
技术作为核心,始终驱动着中译语通的业务成长,同样,中译语通也始终站在世界技术的前沿,发力自研技术与应用。展开中译语通大模型技术研发路线图,会发现,其表现称得上是布局早、发力猛。凭借自身强大的分析及决策工具平台,为企业用户的跨域协同和智能决策提供一体化人工智能解决方案。
中国对外翻译有限公司总经理、中译语通董事长于洋介绍道,2013年中译语通成立之初,公司就启动了以机器翻译和自然语言处理为核心的人工智能技术研发,那时还是以传统的统计机器学习和浅层深度学习网络为主。2017年,Google提出了Transformer模型架构,机器翻译技术由统计机器翻译过渡到神经网络机器翻译,中译语通在神经网络机器翻译方面取得了巨大成果,翻译质量和处理效率显著提高,模型网络结构的进化为后续大型模型打下了基础。
2018年末,Google发布了初代预训练模型BERT,中译语通敏锐地意识到预训练大模型的巨大潜力,开始利用BERT、Bart等预训练模型对自然语言处理、知识图谱和机器翻译进行全新革命,并在行业内取得了领跑多个自然语言处理任务榜单的佳绩。
2019年,中译语通在大模型领域初露头角——正式发布跨语言知识图谱平台产品,着手打造了预训练大模型和知识图谱的深度融合架构,大幅提升了预训练模型能力和跨语言知识构建能力。2020年,公司的研究重点转向了多语言翻译模型,利用多语言翻译模型的迁移学习能力,提升资源稀缺语种的翻译质量。2021年,依托科技部科技创新2030——“新一代人工智能”重大项目,致力“以中文为核心”的多语言多模态机器翻译核心技术、自然语言处理技术的基础研究和应用研究,同年成功申报了云南省科技厅重点研发计划“以中文为核心的超大规模神经机器翻译模型研究及产业应用项目”。
2022年,依托云南省项目、联合实验室,中译语通发布“格物”大模型,包括支持113个语种的多语言预训练模型、支持单一模型上百语种上万语言方向的千亿级参数多语言机器翻译超大模型,以及融合文本-图像-音频-视频全模态能力的多模态生成式对话模型,针对多行业和应用场景提供多模态机器翻译、语音识别与合成、图像理解与OCR(文字识别技术)、自然语言处理、知识图谱、多模态内容理解生成等一系列高效、准确的智能服务,为用户带来前所未有的便利和体验。
2023年,ChatGPT的横空出世,以生成式AI为核心的统一任务大模型开始席卷整个人工智能市场。这一年,中译语通公司将10余年积蓄的力量,精准输出,发布了格物—多语言生成式对话大模型,并启动格物—多模态生成式大模型的研发,实现垂直领域人工智能大模型的落地。
“从技术中来到技术中去”。对于中译语通来说,每一次跳跃,都是一种信息创造。在于洋看来,格物-多语言预训练模型、格物-多语言机器翻译超大模型、格物-多语言生成式大模型、格物-多模态大模型,代表着格物人工智能平台研发成果的四大方向。这一成绩单仿佛在传递着一个信号:只有在“去”的场景方向中始终保持正确瞄点,降本增效,大模型的搭建才会有价值。至于真正能给其商业化带来多少增长,假以时日,市场会给出一个答案。
落地才是硬道理
从机器翻译、语音识别,到大数据分析、知识图谱,再到大模型全栈技术[指包括应用程序前端(客户端)和后端(服务器端)]等完整的开发生态,中译语通在军事、国家安全、国防科技、产业科技、数字经济和出版传媒等领域已拥有丰富的落地应用案例。于洋表示,中译语通将在2024年将大模型技术全面升级为全栈技术平台的底层基础技术框架,一方面快速迭代并适应大模型所带来的技术革命,提升研发效率,另一方面快速实现产业的场景化落地应用。
出版业是中译语通关注的重点领域之一。于洋认为,大模型技术在自然语言处理、图像识别等领域展示了巨大的潜力,在出版传媒行业同样有着丰富的应用场景。一方面,能够提升出版企业的生产效率,自动化处理大量数据和内容,实现编辑、排版和出版流程高效运作;另一方面,在内容制作方面,能助力出版机构实现个性化内容创造、内容分析与市场洞察、数据驱动的故事叙述,增强现实和虚拟现实内容。除了将大家熟知的机器翻译、语音识别和人工智能生成等技术应用在出版传媒领域,中译语通与商务印书馆共同打造了基于区块链的图书防伪溯源系统,实现了区块链、大数据以及人工智能技术在传统图书出版行业打击盗版新实践。
中国出版集团作为出版业的“国家队”,正在努力构建适合集团发展的新型共性技术平台服务支撑体系。于洋建议,集团首先要做好顶层设计,根据旗下企业实际情况制定集团内数字化与大模型战略推进时间表;其次,要加快推进大模型等新技术与业务的融合发展,统筹平台、技术和数据的建设实施,提高集团数字化水平的同时,最大程度地节约资源。此外,要统筹数据资产治理,形成集团的集约优势,发挥庞大的高质量知识数据的最大价值。
除了出版业,中译语通已将大模型技术应用于不同垂直领域、不同场景下的科学研究,“AI for Science”技术与产品生态已然形成。依托庞大的高质量全球专利、科技文献、科技资讯、专家学者和全球产业链数据,中译语通2030人工智能研究院与清华大学、天津大学、哈尔滨工业大学等高校展开联合研究合作。产业应用场景方面,与国防科工局成立了“全球防务信息系统创新实验室”,与中央广播电视总台新闻中心成立“多模态数据新闻联合实验室”,与军事和国家安全机关联合进行技术研发,与大型央企集团建设能源领域科技大脑大模型和航空航天科技大脑大模型,深度挖掘大模型技术在不同场景下的应用。
对于中译语通来说,关于大模型的探索,落地业务场景以后,并不代表着结束,而是开端。于洋表示,接下来,公司将发挥自身优势,夯实通用多模态大模型数据底座和技术基础,实现语言、视觉、声音的多模态统一感知和生成,结合行业特征,为一些关键领域用户构建可适应复杂场景应用的安全、可信的私有大模型应用,为用户的跨域协同、智能分析、研判决策提供一体化解决方案,打造可落地的行业级旗舰大模型,赋能大模型与行业的深度融合发展和安全可靠应用。