作者:王立非
国家发展改革委、商务部第52号令公布《鼓励外商投资产业目录(2022年版)》(以下简称《目录》),将“语言服务产业”纳入《目录》(2022版)第460条的租赁与商务服务业,包括翻译、本地化服务、语言技术开发应用、语言资源服务等,对于推进服务业扩大开放、助力语言服务产业高质量发展意义重大。
教育部和国家语委《关于加强高等学校服务国家通用语言文字高质量推广普及的若干意见》(教语用〔2022〕2号)提出,探索数字化赋能推普新举措。积极建设国家通用语言文字数字化资源、教学和科研平台。支持全球中文学习平台和国家语言资源服务平台建设。语言资源是数字和人工智能时代的新型生产力要素,是数字治理、数字经济、数字贸易、数字人文必不可少的基础性和战略性生产资料。
一、中国式语言资源服务的内涵和范围
(一)语言资源服务的概念
语言资源是指用于开展教学研究、开发语言技术和实现语言交流等所需的各种语言相关的数据、工具和资料,包括以下几类:1. 书面和口语语料库、2. 词典和词汇资源、3. 语音资源、4. 翻译记忆库、5. 语言工具和软件、6. 多语言资源、7. 语言学习资源等。语言资源的获取、管理和利用通过语言资源服务来实现,语言资源服务旨在提供高质量、可持续、便捷的语言资源,支持各种语言相关的研究和应用所需要的服务,帮助个人和组织在全球化时代有效地应对多语言环境的挑战,促进文化交流、商务合作、技术创新,推动语言资源的有效利用和传播。
(二)语言资源服务的范围
语言资源服务包括语言信息资源服务、语言内容资源服务、语言数据资源服务、语言技术资源服务、语言人力资源服务等。语言信息资源服务提供关于语言和文化的信息资源,包括语言学习资料、词典、语法参考、翻译指南等,帮助用户了解和学习不同语言的基本知识和规则,提高语言应用能力。语言内容资源服务提供多语言的文本内容资源,包括翻译、本地化、内容创作等服务。这些资源可以用于文化传播、市场营销、媒体发布等,以满足不同语言和文化背景下的用户需求。语言数据资源服务提供语言数据集和语料库,用于语言处理、机器翻译、自然语言处理等技术应用。这些数据资源可以包括双语对照语料、平行语料、翻译记忆库等,为语言技术的发展和应用提供基础支持。语言技术资源服务提供各种语言技术工具和平台,包括机器翻译系统、语音识别系统、语音合成系统等。这些技术资源可以帮助用户进行自动翻译、语音识别、语音合成等语言相关的处理和应用。语言人力资源服务提供专业的语言人力资源,包括翻译、语言教师、语言专家、语言服务企业员工等,他们提供专业的语言服务和支持,满足用户在跨文化交流和多语言环境下的人力需求。
(三)中国式语言资源服务的特点
中国式语言资源服务是指在中国特定的语言环境和文化背景下进行的语言资源保护与服务,具有语言多样性、文化传承性、社区参与性、技术创新性和可持续发展性等鲜明的特点。中国拥有众多的语言,包括汉语、藏语、蒙古语、维吾尔语等,注重保护和传承各个语言的文化和多样性,促进不同语言社群的发展和交流。中国式语言资源服务注重语言与文化的紧密联系,致力于保护和传承语言所承载的文化元素,如口头传统、民间故事、传统音乐和舞蹈等,以维护和弘扬中国文化遗产。中国式语言资源服务强调社区的参与和共同努力,鼓励语言社群自主组织和参与语言资源保护与服务的活动,如语言节日、文化展览和社区项目,增强社群对语言的认同和自豪感。中国式语言资源服务积极探索和应用现代技术和工具,如语言学习软件、在线资源和语言技术,利用技术手段提升语言资源服务的效率和质量,推动语言的传承和发展。中国式语言资源服务注重语言资源的可持续发展,通过培养语言服务人才、制定相关政策和法律、促进语言产业发展等方式,推动语言资源的保护和利用,为经济社会和文化繁荣提供支持。
二、语言资源服务的重点领域
语言资源服务主要包括以下重点领域:
(一)语言信息资源服务
通过建立综合的语言信息资源服务平台,为用户提供全面、准确、专业的语言学习资料和支持。收集和整理语言学习资料,包括课程教材、语法指南、词汇表、听力练习等。确保这些资料具有准确性、全面性,并满足用户的学习需求。创建在线学习平台,将语言学习资料进行整合和发布,方便用户随时随地访问和学习。平台可以提供用户注册、学习进度跟踪、学习社区互动等功能,提升用户体验。提供个性化学习建议,根据用户的语言学习需求和水平,通过用户自测评估、学习目标设定和学习计划制定来实现,帮助用户制定有效的学习策略。开发语言学习应用程序,开发手机应用程序,包括单词记忆游戏、语音练习、语法测试等功能,帮助用户通过手机随时进行语言学习互动体验。创建在线语言社区和论坛,供用户之间交流、分享学习经验和解答疑问,促进用户之间的互动,提供学习资源推荐和学习支持。提供在线语言咨询服务,为用户提供关于语言学习和应用的咨询服务,包括回答学习问题、提供学习建议等。不断更新和改进,通过用户调查、数据分析和市场研究等方法来了解用户需求和优化服务。
(二)语言内容资源服务
语言内容开发与管理是语言内容资源服务的重点之一,通过了解用户的多语言翻译、本地化、内容创作等方面的需求,组建一支具有专业翻译技能和领域知识的团队。这些翻译人员应具备熟练掌握目标语言和源语言的能力,同时要了解目标领域的专业术语和文化背景。建立质量控制机制,确保所提供的翻译、本地化和内容创作服务的准确性和专业性。这可以包括对翻译稿件进行审校和编辑、采用术语管理系统和翻译记忆库等方法。制定项目管理流程,确保项目能够按时交付,并与客户保持良好的沟通和协作。这可以包括项目分派、进度跟踪、反馈收集和客户满意度调查等环节。应用现代技术工具和平台,包括机器翻译系统、术语管理工具、内容管理系统等,提供自动化和标准化的服务流程。确保客户信息和知识产权的保密和安全。建立严格的数据保护措施和合同条款,确保客户的信息和知识产权不被泄露或滥用。持续关注行业动态和技术发展,通过参加培训、学习新技术和分享经验等方式,提升团队的专业水平。
(三)语言数据资源服务
提供语言数据资源服务,包括数据收集与整理,包括语料库、翻译记忆库、语言模型、语音数据等。数据加工与标注,包括对语料库清洗和预处理,对翻译记忆库对齐和标记,对语音数据分割和标注等。数据存储与管理,包括建立数据库和文件管理系统,实施合适的权限控制和备份机制,以保护和维护数据资源。提供数据查询与访问服务,让用户能够方便地搜索、查询和下载所需的数据。数据定制与加值服务,对特定领域或特定语言的数据定制、数据分析和挖掘、提供数据处理和转换等附加服务。数据质量与更新保障,通过建立数据质量评估机制、与数据提供者合作,更新数据。与语言研究机构、语言技术公司和学术界等建立合作与伙伴关系,共享和交换语言数据资源,扩大数据资源的范围和质量。
(四)语言技术资源服务
开展语言技术研发,包括机器翻译、语音识别、语义分析等。通过投入资源和人才,不断改进和创新语言技术。对现有的语言技术进行评估和选择,通过技术评估和实验、与技术供应商的合作等方式。将语言技术应用于具体的场景和任务中,包括开发和定制特定领域的语言技术应用,进行系统集成和部署等。为用户提供技术支持和培训,包括提供在线文档和教程、定期举办培训和研讨会等方式,帮助用户充分利用语言技术资源。建立和维护大规模的语言数据资源和语料库,为语言技术的训练和应用提供支持,包括收集、整理和标注大量的语言数据,构建具有代表性和多样性的语料库。
(五)语言人力资源服务
开发语言人力资源,招聘与选拔语言人才,发布职位广告、面试和评估候选人的语言能力和专业技能等。提供语言学习培训、专业知识和技能培训、跨文化沟通和管理培训等,以提升员工的综合素质和能力。建立有效的绩效管理机制,设定明确的工作目标和标准,定期绩效评估和反馈,提供奖励和晋升机会,激励员工的积极性和工作表现。建立良好的工作环境和发展空间,建立开放的沟通渠道、鼓励团队合作和知识分享,提供平衡工作与生活的政策和福利等。为员工提供能力和表现相匹配的职业发展路径,提升员工的职业满意度和忠诚度。建立人才储备和交流平台,吸引和留住优秀语言人才。通过了解行业动态和最佳实践,不断改进和优化人力资源管理策略和方法。
三、积极推进中国式语言资源服务能力建设
加强中国式语言资源服务能力现代化建设十分重要:首先,它是保护语言多样性和文化遗产的需要。语言是一个民族的重要文化标志,承载着该民族的历史、传统和价值观。加强语言资源服务能力建设,保护和传承语言的文化元素,维护和促进文化多样性。其次,它是促进社会发展和人文交流的需要,为社会提供更好的语言服务,促进经济社会和文化发展,推动各国人民的交流和合作。第三,它是保障语言权利和减少语言歧视的需要。可以确保我国的通用语言文字和民族语言权利得到充分尊重和保障,避免语言歧视。第四,它是适应全球化和数字化时代的需要。全球化和数字化的发展促使语言服务需求不断增长,提升语言资源服务人才队伍的专业能力和技术应用能力,是新时代的要求。第五,它是推动可持续发展的需要。语言资源是宝贵的财富,保护和传承语言资源可以促进可持续发展。
(一)建成国家语言资源服务平台,服务数字中国建设
教育部积极推进国家语言资源服务能力建设,取得实质性进展。2023年,教育部语言文字信息管理司主导建设的全国性、综合性在线开放资源服务平台——“国家语言资源服务平台“成功上线,面向社会提供语言文字资源服务。网站提供公益性学习、研究或欣赏,以及其他非商业性或非盈利性用途的语言资源服务。平台建设以服务教育数字化战略行动为目标,秉持“开放、共享、智能、服务”建设理念,深入分析教育教学、科学研究、文化传承、社会应用中急需的语言文字需求,努力破解语言资源版权复杂、碎片化严重、服务性不强等问题,建设满足国家、社会和人民需要的语言资源服务。平台汇聚近 50 家单位提供的近百项高质量语言资源和优质语言服务,同时收录资源涵盖语言教育、语言文化、语言翻译、语言技术等公共语言资源,聚焦社会需要和实际应用建设近 20 项语言服务。平台数据和资料包括文字、图片、声音、录像、图表等。该国家级语言资源服务平台的建成对积极服务数字中国建设,服务教育数字化战略,服务国家语言资源安全,探索语言文字事业数字化赋能,推动教育和语言文字事业高质量发展做出重要贡献。
(二)建立语言资源学学科,加强语言资源人才培养
北京语言大学创立“语言资源学”学科,以语言资源为研究对象,系统研究语言资源的类型、构成、分布、质量特征、使用状况及其与语言研究和社会发展之间的关系,聚焦语言资源理论与实践、语言资源应用技术、语言资源管理与伦理三个主要研究方向,培养具有开拓精神和创新思维能力的语言资源服务高水平人才。人工智能时代,对各种语言资源的汇集、保护、利用和开发,对语言研究、国家经济建设、科技文化建设、国家安全与稳定、人类命运共同体构建都具有重要价值和重大意义。
本文为北京市社会科学基金重点项目“一带一路”语言服务便利度测量模型构建与应用(20YYA002)的相关成果。
(作者简介:王立非,北京语言大学高级翻译学院教授,国际语言服务研究院院长,国家语言服务出口基地负责人,上海财经大学特聘教授,华北科技学院特聘兼职高层次专家)