组词通用版范文

时间:2023-10-11 20:20:48

组词通用版篇1

1主题词的查找

1.1通过查找主题词

作为标引工作的首要环节,是避免重复劳动、提高标引工作效率与保证书目数据质量的一条捷径。在知识爆炸的今天,出版物的数量逐年急剧上升,其中存在大量同主题图书出版的情况。对于此类图书,标引人员可以通过以确定图书的主题词。如题为《新编大众菜谱》的在编图书,因馆藏图书中有《大众菜》、《大众菜谱》、《大众菜1000例》等。因此,标引人员完全可以参考这三种图书的主题词,选择任何一条主题标引数据加以利用。题名是最为常用的方式,查全率和查准率都比较高,主要分为两种形式:第一种是利用计算机检索馆藏书目数据库,选择题名检索,将在编图书的题名全部准确地输入计算机,查找本馆是否收藏。大量教材类图书的主题标引都可以采用这种方式查找主题词;第二种是采用前方一致的检索方式,通过检索图书正题名,将正题名前面一部分相同的图书检索出来,便于标引人员参考。例如:要对《ActionScript3.0宝典》一书进行主题标引,标引人员可通过题名中的“ActionScript”作为题名检索词,利用前方一致的检索方式,可以查到题名带有“ActionScript”的图书,如《Action-Script3.0从入门到精通》、《新手学ActionScript3.0》等,这些图书的主题词都为“动画制作软件”,因此《ActionScript3.0宝典》的主题词也是“动画制作软件”,其主题标引数据为:6061#$a动画制作软件。以上两种形式简单而又直观,已被广泛地用于文献标引工作中。然而,有些图书的标引比较复杂,需要拓宽途径。如在题名中增加中间一致、后方一致,也称为截词。例如:要对《家庭保洁服务》进行主题标引,标引人员可以题名中的“保洁”作为题名检索词,采取后方一致的方式,可以查找到《家庭保洁》、《保洁员》等书,直接利用这些书的主题标引数据“6061#$a住宅$x清洁卫生$x职业培训$j教材”。另外,利用ISBN、著者等也是查找主题词的重要方法。ISBN主要用于重印图书、不同装帧形式图书、不同版本图书、连续出版物和多卷书的。著者可检索到同一责任者的文献,多用于文学类图书的分类标引。这些途径灵活组合运用,可极大地提高主题标引效率。

1.2新增主题词的查找

《中国分类主题词表》(二版)增加了大量的关键词作为主题词检索的入口词,通过关键词的查找,便可检索到主题词。例如:对于《大麦丰产种植新技术》,标引人员可通过查关键词“丰产”,就能检索到“高产栽培D丰产栽培”,该书主题标引为“6061#$a大麦$x高产栽培”。又如:《中国特色社会主义理论体系基本问题研究》一书,通过查关键词“中国”、“特色”、“社会主义”或者“色社”都能检索到“中国特色社会主义”这一新增主题词,该书主题标引为“6061#$a中国特色社会主义$x理论研究”。利用《中国分类主题词表》中的分类号查找主题词,如通过分类号“I210.97”可以检索出新增主题词“鲁迅著作研究、鲁迅著作评论”等词,同样通过分类号“I054”可检索出“小说理论、小说创作”等新增主题词。利用《中国分类主题词表》,通过词语组配检索新词。例如:对于主题标引数据“6061#$a家庭$x生活$x基本知识”,通过“家庭”和“生活”的组配,便可检索出“家庭生活”这一新词,再如:对于主题标引数据“607##$a中国$x历史$j通俗读物”,通过“中国”和“历史”的组配方式同样可检索到新增的“中国历史”主题词,该书主题可直接标引为“6061#$a中国历史$j通俗读物”。

2图书在版编目数据的合理利用

在主题标引工作中,标引人员可合理参考、利用图书在版编目(CataloguinginPublication,简称CIP)数据。在版编目是指在图书出版过程中,由确定为集中编目的机构,根据出版部门提供的图书校样或有关编目资料,按一定标准进行规范化的编目处理,然后再将这种格式化的编目数据资料返回原出版部门,印制在图书的版权页上供图书出版发行部门、图书馆、书目编制机构和读者使用。

2.1利用CIP数据标引的优点

CIP数据在图书主题标引方面起着一定的参考作用:一是为标引人员提供了专、深主题词,指引标引人员对于一些专、深学科主题进行标引,起到一定程度的引导作用;二是标引人员在进行主题概念转换时,不仅获取了图书主体因素的词源参考,同时也得到了通用因素、位置因素、时间因素、民族因素、类型因素等词源参考。例如:《应力波诱发冲击矿压的动力学机理研究》一书,CIP数据主题分析为“6061#$a矿山压力$x冲击地压$x动力学分析”,标引人员可直接采用这一CIP数据。

2.2CIP数据存在的不足

CIP数据在主题标引方面存在着一些问题,最主要的是选词不当,如所选主题词不规范,过于宽泛,专指度不够。同时也存在错标、漏标等现象。如清华大学出版社出版的由龚威主编的《现代楼宇自动控制技术》一书,其CIP数据主题标引为“6061#$a智能建筑$x房屋建筑设备$x自动控制$x高等学校$j教材”,其中的“智能建筑”为非正式主题词,正确的标引应该是“6061#$a智能化建筑$x房屋建筑设备$x自动控制$x高等学校$j教材”。正确认识CIP数据的优缺点,有助于标引人员更好地利用CIP数据。对于CIP数据,标引人员不能完全持全盘否定的态度,而应该有效地利用CIP数据,提出提高CIP数据质量的意见,以利于出版机构对CIP数据的改进。图书馆应重视CIP数据,批判性加以利用,以减少重复编目、缩短编目程序、提高编目效率,从而节省大量的人力、财力、物力,同时还可以加强与出版发行机构的交流合作,以促进我国图书在版编目质量的提高。

3《中国分类主题词表》(Web版)的使用

随着计算机技术、网络技术在我国图书馆界的广泛应用,联机编目与远程编目的进一步发展,传统印刷型的《中国分类主题词表》已满足不了快速建立机读数据库的需求,不能帮助标引人员提高选词的效率。因此,要提高和优化主题标引工作,必须具有符合当今时代要求的查表选词工具作支撑。《中国分类主题词表》(第二版及电子版)已于2005年9月由北京图书馆出版社出版。该书Web版于2010年3月17日通过国家图书馆验收。新修订的《中国分类主题词表》是我国规模最大的分类主题一体化的标引工具,为了适应新学科、新技术、新事物文献标引的需要,该表主题词增至110837条,新增主题词为21607条,如新增的“电子政务”、“电子银行”、“网络营销”、“网上购物”、“网络贸易”等与网络有关的主题词。新增的主题词提高了文献主题内容揭示的专指度,是广大标引人员提高标引工作效率、提高主题标引的质量的重要参考依据。又如《选股不如选时:中国式炒股圣经》一书,第一版的《中国分类主题词表》标引为“6061#$a股票$x证券投资$x基本知识”,新修订的《中国分类主题词表》已有“股票投资”一词,该书主题可直接标引为“6061#$a股票投资$x基本知识”。《三维动画特效》以前主题标引为“6061#$a三维$x动画$x软件”,新版的《中国分类主题词表》增加了“三维动画软件”主题词,该书主题可直接标引文“6061#$a三维动画软件”。《中国分类主题词表》(Web版)是通过互联网技术为《中国图书馆分类法》、《汉语主题词表》、《中国分类主题词表》的广大用户提供各类信息资源的知识组织、知识检索、学科导航和实时更新的一个通用的数字型知识组织系统服务平台,具有多样化的检索功能、丰富的超文本链接功能以及提供各类知识内容、主题词、分类号的在线浏览、互动显示和多途径检索服务。用户可根据需要打开多个浏览窗口并在文档之间和各款目要素之间进行切换,可以用族首词查找新词,如用“文学研究”一词可以检索出“诗歌研究、小说研究”等新增的主题词。

4结束语

组词通用版篇2

关键词:辅助翻译;机器翻译;翻译策略;多语种;基于项目的翻译工程

中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)02-0345-06

Study and Implementationof the Multilingual ComputerAided Translation System

NIJAT Najmidin1,2, XI Xiao-gang2,MA Bin3, MAHMUD Mamat3

(1.North China Electric Power University, Beijing 102206, China; 2. Xinjiang Xinneng Information Communications Co. LTD, Urumqi 830026, China; 3. Xinjiang Information industryCo. LTD, Urumqi 830022, China)

Abstract: Workflow, structure and functions of multilingual computer aided translation system are researched in the paper. Application of machine translation technology in the aided translation system is descripted, and multilingual translation technology about Chinese, Uy? ghur, Kazak, Kirgiz is emphasized to improve accuracy and applicability. At last, we give an instance of multilingual computer aided transla? tion system and expect development in the future.

Key word: computeraided translation; machine translation; policy of translation; multilingual; project based translation; CAT

信息技术的高速发展和信息网络的快速扩张,极大的促进了人类社会的进步和文化知识的交融,人们获取信息、学习知识的途径和手段已经扩展到跨地域、跨语种、网络化、多媒体等方式。面对海量增长、不同语言构成的各类信息,催生了机器翻译技术的快速发展,并被应用于构建以此为核心的辅助翻译系统中,有效应用在日常学习和工作中。

机器翻译技术则出现较早,但翻译的精确性不高,尤其是针对超长文本的精确翻译技术还需要深入研究;目前的辅助翻译系统主要借助机器翻译和人工干预两种手段,提高系统翻译的精确性。辅助翻译系统主要应用于各少数民族地方政府、翻译出版、广播媒体、研究、教育等行业和机构。

当前,辅助翻译系统的应用普及还不广泛,主要局限在如下原因:一、系统功能较弱、翻译准确率较低,不能很好满足用户需求;二、系统的机器翻译手段单一,不能很好利用用户已有的翻译资源;三、当前翻译工作往往涉及多语种,而辅助翻译系统只能提供针对某一种语言的机器翻译功能,应用范围有限。本文论述的多语种辅助翻译系统较好的解决了这些问题,能够提供面向新疆地区民族语言的汉语、维吾尔语、哈萨克语、柯尔克孜语等多语种、多方向、综合性的辅助翻译功能,系统实现了基于统计、实例以及记忆库的辅助翻译模式,属国际首次基于哈柯文语言的辅助翻译软件,并易扩展到中亚地区民族语言。

1多语种辅助翻译系统特点

辅助翻译是一种借助计算机信息处理能力和人工干预方式实现源语言文本向目标语言翻译的方法,通过翻译引擎自动对源语言文本实现语法分析、词法分析,以及相关语料库、实例库等数据库检索查询,再经过统计分析和优化,最后对自动翻译输出的目标语言译人工排查、修正,最终获得符合用户意图的翻译文本。辅助翻译的基本流程如图1所示。

在上述流程中,人工干预主要发生在翻译过程的开始和结束阶段:一是提供语义清晰的文本,在选择机器翻译的文本时尽量提供完整语义和有规则的短语或句子,从而提高准确率;二是对于机器翻译结果做出人工校对和适当修改,以达到满意的程度。

多语种辅助翻译系统在满足基本需求之外,采用了多种策略和独有技术来提高翻译的准确率、易用性和可靠性。

1.1多种翻译策略

机器翻译是辅助翻译系统的核心组件,常见的策略包括基于统计、基于实例、基于规则的机器翻译等技术,目前商用的辅助翻译系统针对特定行业或领域开发,只提供一种机器翻译策略。多语种辅助翻译系统的翻译引擎使用了基于统计和实例的翻译方式,又特别提供了基于记忆库的翻译功能,面向多种行业应用,从而提高了翻译准确率和普及性。

同时系统提供双向翻译支持,在国内外首次实现了汉语到维吾尔语、哈萨克语、柯尔克孜语,维吾尔语、哈萨克语、柯尔克孜语到汉语的辅助翻译功能,其中平均机器翻译准确率在60%以上,基于记忆库的翻译准确率可达100%。

图1辅助翻译基本流程

1.2多语种支持

语言分析是辅助翻译系统和机器翻译不可或缺的组成部分,多语种辅助翻译系统集成了汉语、维吾尔语、哈萨克语和柯尔克孜语等四种语言的翻译功能,因此系统中必有分析这些的组件。系统的汉语分析采用了目前成熟的组件,针对维吾尔语、哈萨克语和柯尔克孜语同一语系的相似性特点,在借鉴已有维吾尔语言分析组件的基础上,分别开发了哈萨克语和柯尔克孜语的分析组件。

1)汉语分析组件:使用了中科院的ICTCLAS分词系统。ICTCLAS分词系统具有自动分词、词性标注和人名、机构名识别等功能。在此基础上实现句子相似度计算功能。

2)维吾尔语分析组件:该组件提供维吾尔语分词、词干提取、词性标注、人名、地名、机构名识别和句子相似度计算等功能。3)哈萨克语分析组件:该组件提供哈萨克语分词、词干提取、词性标注、人名、地名、机构名识别和句子相似度计算等功能。4)柯尔克孜语分析组件:该组件提供柯尔克孜语分词、词干提取、词性标注、人名、地名、机构名识别和句子相似度计算等功能。5)同时,系统还支持多语种(汉、维、哈、柯、英)用户界面,界面语言、界面习惯(从左向右、从右向左显示和排版)等方面全面提供了多语言支持,便于用户根据习惯进行操作。

1.3多种文本文档兼容

多语种辅助翻译系统实现了word2003、2007文档、txt文件、xml文档、RTF文档、Html等常见文本文档的兼容,系统可以很方便的导入、导出以上文档,译文文档不需要或少许排版后就可以直接使用。通过良好的人机交互界面,实现对项目文档的完美翻译,不损环原文格式,保持译前原排版格式,最大限度地降低排版工作量。

多语种辅助翻译系统提供自动翻译和交互式辅助翻译两种翻译模式。自动翻译模式利用实例库和机器翻译引擎直接翻译用户提交的文本,并根据用户要求把不同候选译文根据翻译评价分高低排序提交给用户来选择最合适的译文。

自动翻译过程中,首先把待翻译的内容按句子与实例库进行匹配,完全相似的句子匹配完后,对剩下的句子进行语言分析并使用基于实例的翻译方法和统计的翻译方法进行翻译。翻译完成后,把不完全相似句子的译文按照翻译评价分排序并提交给用户选择。该翻译过程不包含任何用户参与,用户只能对翻译完的译文进行选择或修改。

交互式辅助翻译模式使用询问方式,从源语言的分析开始每一步向用户提供分析结果并提供修改分析结果的机会,从而减少语言分析所产生翻译错误率,提高翻译的质量。该过程中与自动翻译模式不同之处是用户从对语言分析到翻译可以调整每一步的分析结果。交互式翻译的流程如图2所示。

1.5翻译项目管理功能

多语种辅助翻译系统的项目管理功能,主要是针对于翻译量比较大的文档,为此可建立一个项目实现超大文档的拆分和合并,项目有属于自己的项目名称、起止时间、项目人员、项目任务等。项目当中源语言和目标语言是一对多的关系,用户可以在一个项目里面将某种语言的一份文档翻译成多个目标语言的译文。

2多语种辅助翻译系统结构

多语种辅助翻译系统采用网络版和单机版两种架构模式。网络版系统包括:客户端在线功能模块、服务端接口模块、核心功能模块,服务端WCF服务接口模块、应用服务模块、数据库接口模块,以及后台数据库存储模块。单机版包括:系统核心功能模块、本地接口模块和本地文件存储模块。

多语种辅助翻译系统网络版中,客户端接口通过HTTP/HTTPS、XML等协议同服务器端通信,调用服务端提供的服务接口,实现Web Service方式的服务调用。服务端的Web Service采用.NET框架的WCF实现。

多语种辅助翻译系统单机版中,本地接口层实现了两类功能:一是机器翻译服务,其功能与网络版服务端提供的翻译服务功能一致;二是文件读写功能,通过本地数据文件实现数据访问,与网络版中数据库接口和后台数据库存储服务功能一致。

图2多语种交互式辅助翻译流程

网络版为团队协作的翻译工作提供项目级管理服务,而单机版为个人翻译工作提供服务。系统功能结构如图3所示。

图3多语种辅助翻译系统功能结构

具体功能服务描述如下。

2.1辅助翻译应用服务

多语种辅助翻译系统提供的应用服务包括:

1)机器翻译服务:包含机器学习组件、语言分析组件、翻译组件等,为网络版和单机版用户提供源语言文本的词法分析、语法分析、目标语言生成等服务功能,是系统关键模块。系统提供三种机器翻译服务,包括基于实例的翻译、基于统计的翻译、基于语料库的翻译方式,用户可以根据翻译文本的特点、工作性质选择对应的翻译方式,以此来提高翻译的准确性。例如,针对重复量较多、翻译文本前后衔接紧密的工作,可以选择基于实例的翻译方式;对于工作量较大,关键词较多的翻译工作,可以选择基于统计的翻译方式;对于共享翻译资源、协同工作的用户,可以选择基于语料库的翻译方式。

2)语料库管理服务:为系统语料库提供维护、查询、检索等服务,语料库是机器翻译的重要基础,完善的服务能够方便用户构建、管理和健全语料库。

3)词典查询服务:为翻译人员提供单词和短语查询服务,词典查询服务包含汉语、维吾尔语、哈萨克语、柯尔克孜语等地双向检索查询服务。

4)系统管理服务:网络版专用服务,为系统用户提供人员管理、项目管理等服务,用户可以通过客户端维护、检索、查询数据库中的应用数据。

5)文件传输服务:为用户提供项目管理中翻译文件的上传、下载、加密和解密功能。

2.2辅助翻译核心模块

多语种辅助翻译系统提供的核心模块,包含在线功能和核心服务,其中:

在线功能为团队用户服务,提供用户、角色、权限、日志和即时通讯服务,管理员可以通过系统管理维护系统用户和权限,团队翻译用户可以通过即时通讯工具实现实时通信。

核心服务包括:项目管理、词典查询、在线升级、辅助翻译和语料库管理等功能。项目管理为翻译团队提供基于项目的翻译工程管理活动,管理人员可以通过项目管理实现项目制定、任务分配、项目查询、人员分配等活动;翻译人员通过项目管理可以检索、查询分配的任务,上传和下载任务包含的翻译文档;审核人员通过项目管理对上传的任务文档进行审核和意见批注。辅助翻译功能则为翻译人员提供在线方式的机器翻译功能,系统提供了基于实例、统计和语料库的三种翻译方式供用户选择。

2.3辅助翻译接口模块

多语种辅助翻译系统提供的接口模块包括服务端接口和本地接口两部分,其中:服务端接口主要是系统网络版核心功能模块调用该接口,实现与后台服务的交互,通过参数传递,完成服务调用和获取数据结果。本地接口主要是系统单机版核心功能模块调用该接口,通过与本地数据层之间的交互实现数据获取和保存,以及与本地机器翻译组件之间的调用和交互,实现文本翻译服务等。

2.4辅助翻译数据层

多语种辅助翻译系统实现了网络版的后台数据库存储机制和单机版的本地文件存储机制,以及为访问数据库提供的数据接口和访问本地数据文件提供的接口。

1)数据访问接口:为后台数据库连接提供数据库连接池,并提供数据加密、解密服务;为本地文件和后台文件访问提供文件加密、解密、文件格式解析等服务。

2)后台数据库:为网络版提供实例库、双语语料库、词典库、项目文件等存储,通过数据访问接口提供的数据库连接池和数据加密、解密,以及文件访问接口实现数据交互。

3)本地文件存储:为单机版提供实例、双语语料、词典、项目等数据的文件存储方式,通过文件访问接口实现数据加密、解密和交互。

3多语种辅助翻译流程

多语种辅助翻译系统网络版为翻译团队协同工作提供服务,以实现汉语向维吾尔语、哈萨克语、柯尔克孜语的翻译提供一对多的辅助翻译功能。系统服务端提供了系统管理、词典查询、翻译服务、项目管理等服务,其中,系统管理、词典查询和项目管理流程主要在客户端完成,服务端提供数据更新和保存服务;翻译服务流程主要在服务端完成,客户端在辅助翻译操作发送请求,调用该服务启动流程。其流程如下所述。

3.1多语种辅助翻译服务流程

多语种辅助翻译的服务流程通过WCF服务接口,为系统客户端提供服务。服务端启动后,初始化各类服务,并创建服务监听线程;客户端向服务端发送服务请求,请求类型包括系统管理请求、词典查询请求、翻译服务请求、项目管理请求。服务端监听线程在接收到客户端请求后,判断请求类型,调用相应服务;当服务启动后,接收服务参数,按照参数类型完成后台数据库操作,并返回结果。

如图4所示,服务流程包含四个子流程,在服务调用完成后,服务端终止服务流程,继续监听客户端请求,等待下一次请求。客户端在接收到返回的数据后,继续完成后续操作。

由于网络版的数据和文件都存储在服务器端,所以涉及数据更新和保存的操作都要通过服务请求和调用来完成。此外,客户端每次启动都会自动发出一个服务请求,查询是否有新版本或功能更新的通知,一旦由更新信息则提示用户需要更新系统。

3.省略框架实现,提供自动翻译模式和交互式辅助翻译模式等两种翻译模式。系统为维吾尔语、哈萨克语和柯尔克孜语用户提供了相应语种的操作界面,翻译编辑器能够完全支持维哈柯文的书写习惯和显示界面,使用简单、方便,并提供了多种翻译策略、一对多翻译、双向翻译等特点辅助翻译功能。系统操作界面如图6所示。

在完成上述功能的基础上,系统在未来的升级扩展中,将针对多语种扩展、语料库共享、记忆库扩充等方面做进一步的研究和开发,从而提供更高的翻译精确性、可靠性和易操作性。

图5基于项目的翻译工程管理流程

图6多语种辅助翻译系统

参考文献:

[1]黄金柱,李青.基于大规模语料库的多引擎语言翻译模型的构建[J].洛阳:洛阳师范学院学报2010(2).

[2]冯志伟.自然语言机器翻译新论[M].北京:语文出版社,1995.

[3]王海峰.机器翻译技术及应用[J].中国计算机学会通讯,2008(2).

[4]钱多秀.计算机辅助翻译[M].北京:外语教学与研究出版社,2011(3).

组词通用版篇3

关键词:文体特征 词汇 句法 译 英语商务合同

中图分类号:H 315.9 文献标识码:A 文章编号:1003-9082(2014)02-0317-01

随着我们国家加入WTO以及与外国人的业务量的不断增长,中国的很多公司都在和外国公司不断的有业务往来,提供了很多的合作机遇。与此同时,公司和外商在洽谈成功后签署的商务合同的时候,翻译在此期间起了重要的作用。商务合同在两国之间起了一定的维权依据,所以翻译工作人员水平要高。在很大的程度上商务合同中的特性给翻译工作者带来了很多的困扰,为了能使得商务合同翻译的准确性,就必须要求翻译工作者要熟悉其特点。版权所有

一、词汇的特性

1.如何使用词汇

商务合同实际上就是一种法律依据,文字性要求极为严格,文字性还必须要求其庄严性、严肃性、正式化、具有法律的约束力等词语组成。在写商务合同的时候经常会出现几个词语,例如,“end”的文字表达意思为“期满”,而在合同中就要写作“expire”; “begin” 的文字表达意思为“开始”, 而在合同中就要写作“commence”; “about” 的文字表达意思为“关于/涉及”, 而在合同中就要写作“pertaining to”; “before” 的文字表达意思为“在…之前”, 而在合同中就要写作“prior to”; “if” 的文字表达意思为“如果”, 而在合同中就要写作 “In the event that/in case”等等。所以在翻译合同的时候必须保证选字的正式性、严肃性才能使其中文寓意与其翻译前的合同达到功能对等才行。

2.如何使用专业术语

专业术语都是由名词或者多为名词性的组词。由于各行各业都涉及着英语商务合同,所以合同中固然要有很多的专业语言。翻译工作者必须要保证翻译出来的字眼要符合专业术语,要符合各行各业的行规。

3.如何使用here/there/where+介词

here/there/where+介词经常的在商务合同证出现此类词语。为了达到翻译后的专业术语与其法律文体相对等的法律文字,翻译工作者就必须要翻译准确。比如,“兹证明”就要翻译成为“hereby”, “关于这点” 就要翻译成为“hereof”, “随附”就要翻译成为“thereto”, “鉴于” 就要翻译成为“whereas”, “在下文中”就要翻译成为“hereinafter”等等等等。

二、句法特征

1.陈述句的使用

陈述句主要用于阐述、说明、解释客观事实。商务合同主要陈述和规定合同双方的利益和义务以及涉及运输、保险、付款方式等各方面的规定,因此一般都使用客观平实的陈述句。在翻译此类句型时,译员必须采取相应的中文陈述句,使译文和原文风格一致。

2. 被动句的使用

由于商务合同是规定各方权利与义务的文书,文字叙述客观公正,措辞严谨庄重,因而英文商务合同中较多地使用被动句,以体现合同文体的严谨性。英文商务合同中有关包装、运输、保险、付款方式、检验、争议解决等条款大多采用被动句结构。在处理此类被动句时,可将其翻译为主动句,以符合中文的行文习惯。

3.长句的使用

在双方在签署合同的时候,为了避免造成不必要的麻烦,以及文字性的描述,往往在合同中会体现长长的句子。而在英文合同中就会有很多的从句来修饰其寓意,对其主要的内容进行详细的说明。对于两个语言不通的合同范本来说,翻译工作者在翻译这样的长句的时候,就要求翻译人员先充分的了解长句的寓意,合理的将句子切分开来进行分析,吕清整个句子与句子之间的关联系,找出长句主要表达的思想内容,然后在分别翻译、组句等,切记不要直接翻译此类长句。

三、商务合同翻译的要点

商务合同的翻译实际上如同普通的译文一样,在“人言为信”、“豁达”以及“达己达人”方面都和普通的译文要求形式上雷同,当然,在“人言为信”上和“豁达”上明显要高于“达己达人”;顾名思义,商务合同中更坚守的是双方的诚信和通顺。

1.英文翻译中必须要和原译文相同的标准。简要的来讲,合同在拟定的时候,是需要经过撰写人精心琢磨才拟定出来的,在句中的每个词汇都有它特定的内涵。所以翻译工作者要有相当高的专业素养,要保证翻译的语句与原文一致,不能凭借自己的感觉任由发挥或者篡改,以免导致不必要的麻烦。翻译工作中往往为了达到统一,舍“雅”求“人言为信”,已达到原文与译文相统一的表达寓意,必须要在明确其原文寓意的基础之上方可直接翻译。

2.通顺是商务合同翻译的基本要求。对商务合同而言,文采斐然固然好,通顺明白、清楚易读更加重要。因此在翻译英文合同时,译员必须先充分理解合同的意义,在忠于原文的基础上,适当译成符合中文习惯的句子。

例如:

This AGREEMENT made and entered into on this day of , 2007 by and between X, a corporation organized and existing under the laws of Japan and having its principal office registered at Tokyo 103-8236, Japan (hereinafter referred to as X) and Y, a corporation organized and existing under the laws of Peoples Republic of China and have its principal office registered at Hangzhou 311106, China (hereinafter referred to as Y).

译文:本协议于2007年 月 日签订,协议双方为依据日本法律组织设立的X,总公司所在地为日本东京, 邮编103-8236(以下称X)和依据中华人民共和国法律组织设立的Y,总公司所在地为中国杭州,邮编311106(以下称Y)。

有版权所有版权所有版权所有版权所有版权所有版权所有版权所有版权所有所有版权所有版权所有版权所有版权所有版权所有版权所有版权所有版权所有版权所有版权所有版权所有版权所有版权所有有版权所有

四、结束语

语言的翻译是有整个篇章、句法、词汇以及语言等四大项产生的。本章程通过对英语商务合同中的句法和词汇做深层次的探讨,解答出如何有效的进行合同翻译的方式方法。与此同时,还简要的阐述了商务合同中的基本特征,并根据基本的特性提出了翻译的重点及要点,对今后的翻译起到了辅帮助。

参考文献

[1] 胡庚申 王春晖:国际商务合同起草与翻译[M],北京:外文出版社,2002.

组词通用版篇4

摘 要:“鞠”字较少见,现保留、常见的仅“蹴鞠”、“鞠躬”等个别词,都与“弯曲义”相关。“鞠”虽在同义复合词“鞠躬”的离合现象中占据主导地位,但却丧失了独用的灵活性,反而不得不依附于“躬”字,并被其完全取代(表示“弯腰行礼”义)。因此,本篇在母文“匊”族字研究背景下,从母文表义和词义感染理论入手,重点分析组合感染的历史演变中,词义地位不均衡在共时状态得以凸显,从而造成非离合词状态下“鞠”的反常现象。

关键词 :“匊”族字 母文表义 词义感染 鞠躬

一、引言

现代汉语中“鞠”字比较生僻,仅保留在“蹴鞠”“鞠躬”等个别词中,且很显然,已经丧失单独使用的灵活性。随着离合词研究的兴起,“鞠躬”重新作为示例之一进入人们的视线,但由于书面色彩性强,又是历史生僻用字,几乎还未见有专门深入的研究著作。笔者曾在离合词研究中作为示例之一有过涉及,但为凸显共性,也并未深入探讨。因此本篇将它单独列出进行个项考释,在母文表义的理论阐释下,穷尽性地列举“匊”族字例,力图系统、细致地分析该字,特别是解读它一方面在“鞠躬”一词中占有支配地位(如离合现象:“鞠xx躬”),另一方面却在表示“弯腰或行礼”的词义竞争中让位于“躬”字,不能独存的矛盾现象。

二、“鞠”字

《说文》:“鞠,蹋鞠也,从革,匊声。居六切。”[1](P158)重文作“”字。段玉裁转引郭璞注曰:“毛丸可蹋戏者曰鞠”[2](P108),也就是通说的“球子”。“鞠”义两家所释并不一致:一指踢鞠;一指蹴鞠所用器材——“皮毛球”,通“毱”。此处段说为是。

《汉语大词典》所录该字释义近二十余种,根据语义场关系大致可粗略地分为三脉:表弯曲,如“蹴鞠”“鞠躬”;表养育,爱抚,“父兮生我,母兮鞠我”(《诗?小雅?蓼莪》)[3](P460),“鞠爱”是也;释“穷极、穷苦”,如 “既曰告之,曷又鞠止。”(《诗?齐风?南山》)孔颖达疏:“当谓鲁桓纵姿文姜,使穷极邪意也。”[4](P352)《尔雅》即作此解。通“鞫”字,引申有“穷尽审问”之义,如“鞠治”“鞠狱”。此外,还有鞠姓、星名等义,这里不再赘述。除了遗留下来的古语词“蹴鞠”以及后文涉及的“鞠躬”二词外,现代汉语中,“鞠”其他古义已几乎消亡不见。因此,本篇以“弯曲义”为核心的“匊”族字研究为背景,重点讨论在该字族中现今还存活下来“鞠”字义。

三、“匊”族字及“母文表义”说

“匊”,《说文》解释:“在手曰匊。从勹、米。”[5](P521)段注认为“在手”当为“两手”之讹,指双手捧物,即“两手兜而聚之”的屈掌状。会意字。“勹,裹也。象人,曲形,有所包裹。凡勹之属皆从勹。”[6](P520)所以,凡是从“勹”的字都与弯曲有关。手弯曲,米才能在手心里。凡从“匊”的字也都与弯曲有关。围绕“匊”字,有一系列意义相关的字,《说文》所录,皆作“从某,匊声。”即所谓形声字。

这里需要说明的是,传统观念认为宋人王圣美的“右文说”:凡字其类在左,其义在右[7](P95),是指形声字声符多在右边,同时兼有表义功能。蔡永贵等人则重新阐释其内涵,从理论最初本原指出“右文”非声符,而是形音义皆备,具有孳乳、分化新字的母文(不一定是“初文”),因新孳乳字在母文基础上产生,因而沿用母文之义,进而因袭母文之音,这些为区别本义或引申义而加注外部符号的字,蔡氏称之为“母文外化字”。也即是说,“右文说”实质上是一种“母文表义”理论。在这一理论背景下,许慎所谓“亦声字”(会意兼形声)可以看做母文分化字形成的结果[8](P47)。母文造字的局限(限于同族字)和同音现象最终促成“形声相益”的形声字条件成熟并应运而生。

因此,作为会意字,母文“匊”字本身有“弯曲义”,在此基础上孳乳产生了一系列义近音同的字,形成字族。如“掬”字,表示两手并合弯曲;“婅”“躹”指弯曲身体;“菊”:菊花的花瓣是弯曲的;“趜”表“足不伸”;“淗”指“水的波纹”;“驧”指“马曲脊也”。这些词不论是身体部位弯曲,或指其他事物的形状有弯曲之态,其弯曲义皆来自于“匊”,所以这组字是在母文“匊”基础上衍生出来的,同时兼作声符。《说文》据孙愐《唐韵》皆作“居六切”或“渠竹切”。段氏说,“同声必同部”。声符相同的字,必然属于同一韵部。查《宋本广韵·入声卷》,《屋韵·菊》下注“菊,草名。……居六切,三十三”[9](P133),如“蘜”“鞠”“趜”“踘”字。《屋韵·驧》下注“渠竹切,十二”[10](P133),如“驧”“”“鞠”“趜”“踘”“毱”字。其中“鞠”等字兼有这两种读音(按:以上列字不计不从“匊”的异体字)。另外,值得一提的是“菊”小韵下有“臼”字,曰“双手捧物”。段玉裁认为“匊”“臼”二字有细微差别,王力《同源字典·觉部·见母》则认为“匊”“臼”“掬”同音,实同一词,不必强生分别。拟音为[kiuk][11](P306)。可见,同源必同义。概言之,在母文“匊”基础上孳乳的分化字义同义近,同属入声屋韵,是同源字。

“鞠”字,《宋本广韵》三见。“菊”小韵下“鞠”曰:“推穷也……又音曲。又渠六切。又蹋鞠。”[12](P133)“曲”下“鞠”曰:“姓也。又居六切。”[13](P133)“驧”下“鞠”曰:“蹋鞠。以革为之。今通谓之球子。又菊曲二音。”[14](P133)因此,“鞠”本义指外用皮革缝制、内填充毛的圆形球,通“踘”“毱”。从“革”,表示与皮革有关。最早是结毛而成,后来用毛充填皮囊而成,宋代以后才有充气的皮球,即古时一种用来踢打玩耍的皮球。《说文》所释“蹋鞠”,当是由表示“毛球”引申而来,泛指“蹴鞠”运动。后世文献多有记载,往往都“蹋鞠”“蹴鞠”双音节出现,可见词义已扩大。

另外,宕开一笔。“匊”族字背景下假设其字本义为“踢鞠时肢体弯曲状”,通“趜”。即以许慎所言为是,表“蹋鞠动作”。但古时“蹴鞠”运动具体为何种形式,多数文献语焉不详,并不能妄测类似于现代足球竞技运动。因此,表“踢球时肢体弯曲”义,并无有力左证,故弃之不取。

四、组合感染:“鞠躬”源自“躬”

与“毛球”相关的“蹴鞠”一词,较早见于文献记载。《战国策·齐策》载:“其民无不吹竽鼓瑟,弹琴击筑,斗鸡走狗,六博蹋鞠者。”[15](P285)然而,与“蹴鞠”运动紧密联系的“鞠”字又是如何由母文“弯曲义”演化为明确地表“弯曲(身体)”动作义,先秦两汉所见典籍中难寻痕迹。因此,大胆推测,后世表示弯腰动作的“鞠躬”义,可能直接感染于“躬”字,即所谓的“组合同化”。

《说文》:“躳,身也,从身从吕。”[16](P420)徐锴注曰:“吕,古膂(脊梁骨)字,象人垂骨之形。或从弓。”[17](P1062)“躳”是“躬”的异体字。“弓,以近穷远。象形。……凡弓之属皆从弓。”[18](P751)可见,此字描摹的就是弓的形状,有弯曲义。段玉裁进一步对比解释:“从吕者,身以吕为柱也。矦执信圭,伸圭人形直。伯执躳圭,躳圭人形曲。鞠躳者,敛曲之皃也。”[19](P343)因此,“躬”字本义当为“弯曲的身体”,后词义扩大,表示身体。“鞠”“躬”二字连用,较早的记载见于《论语·乡党》:“入公门,鞠躬如也,如不容。”[20](P2038)颜师古注曰:“鞠躬,谨敬貌。”[21](P962)此义应是由表示“弯曲身体”的意义引申而来的,指动作背后的寓意。不难看出,“鞠躬”所表示的“弯曲身体”与“躬”字紧密相关。一方面“弯曲”义项使两字有了同义连用的词义基础,另一方面呈线性排列的空间位置,又促进二者相互感染,强化共有的“弯曲”特征,动词性词义增强;又因“躬”本身蕴含所指对象“身体”,因而“鞠躬”一词往往不另带宾语。

“鞠躬”一词,大量使用,历代文献都有记载。如韩愈《谒衡岳庙遂宿岳寺题门楼》一诗中就有“庙令老人识神意,睢盱侦伺能鞠躬”[22](P66)之句。至元,《韵会》解释:“鞠,躬也。”[23](P1199)可见,此时,“鞠”“躬”二字互训,同义复合,词义地位趋于平等,与今无异。如:《五灯会元》记载:“僧近前,叉手鞠躬曰:‘这个是甚么字?’主无对。”[24](P361)另外,较为熟知的《聊斋志异》也有“一大鬼鞠躬塞入,突立榻前,殆与梁齐”[25](P9)的描述。

“鞠”“躬”也开始出现独用现象。《初刻拍案惊奇》:“放他(蜈蚣)出来,他鞠起腰来,首尾着力,一跳有一丈高。”[26](P46)宋元时期,“躬身”一词大量出现。《西游记》中“把腰躬一躬”的语句比比皆是,并沿用至今。当然,“躬”还作为鞠躬这种动作名称出现。如“打躬”“一躬”数名组合大量出现。而“鞠躬”离合现象下的“躬”的词义就与此一脉相承。如“鞠个躬”“鞠了一躬”“鞠了鞠躬”等。

但不同于其他联合结构的离合词例(如“洗澡”“游泳”“考试”),“鞠”并未保持在离合结构“鞠xx躬”中的主导地位,相反,与“躬”相比,丧失了独立使用的灵活性,仅局限于“鞠躬”一词。这种矛盾现象,实际上,恰好反映了离合词所受动宾结构类推的外部作用和词义内部不均衡现象斗争的动态过程。前文已述,“鞠躬”一词最初受“躬”影响,发生组合感染,词义趋同,并逐渐处于并列地位;但这种词义不平等并非全然消失,而可能隐形存在,在一定语境条件下,会被重新激活。也就是说,“鞠”“躬”二字虽在离合结构中受动宾类推作用影响,处于支配和被支配地位,然而一旦脱离离合结构限制,其本身词义地位就会凸显出来,并在具体语境中被不断强调。现代汉语“躬”字取代“鞠”而成为“弯腰动作”的代表,就是明证。

五、结论

本篇在母文表义理论的阐释下,结合“匊”族字,对“鞠”字进行个相考释,认为“鞠”本义是指古时蹴鞠活动所用器材——皮毛球,后词义扩大,泛指“蹴鞠”运动。但现仍保留的“弯曲”义项的古语词“蹴鞠”与表示“弯腰动作”的“鞠躬”一词,词义如何过渡演变,是一大难点。幸而,“鞠躬”在离合词群中的独特现象,使这种词义溯源有了可能。正如前文所提,“鞠躬”同多数离合词一样主要呈现动宾结构的离散形式,其中,“鞠”居于动词支配地位,“躬”往往充当离散结构的宾语成分。但现代汉语中,表示弯腰行礼时,往往使用“躬身”“躬一躬腰”之类的用法,“鞠”字不再独用,已丧失灵活性,仅限“鞠躬”一词及其离合形式。这恰恰反映了“鞠躬”词义组合感染在历史演变中相互作用的动态痕迹,“躬”本义为“弯曲的身体”,在“弯腰”义项中占据主导,但在同义复合的双音节趋势和动宾类推的共同作用下,“鞠”受线性组合感染,词义地位上升,并在类推作用下呈现动宾式离合,从而在离合词“鞠躬”中达到词义地位最高点。但这种词义地位的不均衡不是全然抹杀不见,而是隐性存在,并在一定条件下,有重新被激活的可能。“躬”本身表示的弯腰行礼,背后蕴含着强大厚重的中国传统礼仪文化,同时与日常身体动作密切相关,因而存在强大的语境优势。相对而言,“蹴鞠”活动已然销声匿迹,本身也不再被提及,已沦为历史古语词。因此,在表示“弯腰行礼”中,“鞠”字退出词汇竞争,让位于“躬”,也是词义历史演变的动态作用在共时状态下的必然反映。

注释:

[1][5][6][16][18][东汉]许慎:《说文解字》,北京:九州出版社,2001年版。

[2][清]段玉裁:《说文解字注》,上海古籍出版社,1988年版。

[3][4][清]阮元校刻:《十三经注疏》,北京:中华书局,1980年版。

[7][北宋]沈括:《梦溪笔谈》,北京:中华书局,1985年版。

[8]蔡永贵:《“右文说”新探》,新疆师范大学学报,1988年,第1期。

[9][10][12][13][14][宋]陈彭年:《宋本广韵》,南京:江苏教育出版社,2008年版。

[11]王力:《同源字典》,北京:商务印书馆,1982年版。

[15]缪文远:《战国策新校注》,成都:巴蜀书社,1998年版。

[17][23][清]张玉书编:《康熙字典》,北京师范大学出版社,1997年版,第1062页,第1199页。

[19][清]段玉裁:《说文解字注》,上海古籍出版社,1981年版。

[20]吴树平等校:《十三经》(校点本),北京燕山出版社,1991年版。

[21][东汉]班固,[唐]颜师古注:《二十四史·汉书》(缩印百衲本)·汉书,上海:商务印书馆,1958年版。

[22][清]苏塘退士选编,周啸天注评:《唐诗三百首注评》,南京:凤凰出版社,2005年版。

[24][宋]普济,苏渊雷点校:《五灯会元》,北京:中华书局,1984年版。

[25][清]蒲松龄:《聊斋志异》,北京:华夏出版社,2008年版。

[26][明]凌蒙初:《初刻拍案惊奇》,沈阳:春风文艺出版社,1994年版。

参考文献:

[1]程湘清.汉语史专书复音词研究[M].北京:商务印书馆,2003.

[2]蒋绍愚.古汉语词汇纲要[M].北京大学出版社,1989.

[3]王力.同源字论[J].中国语文,1978,(2).

[4]王宁,黄易青.词源意义与词汇意义论析[J].北京师范大学学报,2002,(4).

[5]张博.组合同化:词义衍生的一种途径[J].中国语文,1999,(2).

组词通用版篇5

最近几年中考对文言文翻译的考查题由选择正误改为笔译,这就增加了答题难度,而且所出试题均出于课外,仿佛无迹可求,无从下手。其实,只要掌握一些技巧,从以下几个方面着

手,即可轻易取胜:

一、 组词释义

文言文里多用单音词,而现代汉语则多用双音词,翻译时,要变古汉语的单音词为现代汉语的双音词。因此,可教学生采用组词的方法来翻译文言文。组词的方法有两种:① 在原来的单音词后面或前面加一个辅助成分。如:师老师,椅椅子。② 在原来的单音词前面或后面加一个同义词或近义词,合成一个双音词。如:学学习,书书写。一个词如果可组成两个或两个以上的双音词,就应根据语言环境来选定其中最恰当的词。如:“书”可组成“书信”、“书写”等词,在“使人遗赵王书”中,应选“书信”;在“秦御史前书曰”中则应选“书写”。

二、 字形推义

在汉字中,形声字占大多数。形声字分声旁和形旁两部分,其中的形旁为我们推断字义提供了条件。例如:“樯橹灰飞烟灭”,其中的“橹”我们知道是木制的“船具”,而对“樯”就不甚理解,但我们知道“樯”从“木”,同“橹”字联合成词,都属船具,便可推知“樯橹”有“船”的意思,使用了借代的修辞格。再如:从“足”,表示这个字的意义与脚或脚的动作有关;从“牛”,词义就同“牛”有关;从“厂”,词义就和“房子”有关等等。

三、 对比见义

古人行文常常讲究对称,有很多运用了对偶的整齐句式。我们可根据相应位置的词词义或相同或相反的规律来推断词义。例如“忧劳可以兴国,逸豫可以亡身”句运用了对偶的修辞。其中“逸豫”义可由“忧劳”来推断,词义相反。“吾尝终日而思矣,不如须臾之所学也”,我们知道“终日”与“须臾”是反义对文,这样就可以由“终日”是“整天、时间长”的意思推知“须臾”的意思是“时间短”了。再如“贤俊者自可赏爱,顽鲁者亦当矜怜”中,“顽鲁”一词供选择的义项有:A. 愚笨而鲁莽;B. 固执而粗鲁;C. 顽皮而愚蠢;D. 愚昧而愚蠢。由于“顽鲁”与“贤俊”对应,“贤俊”是指有德有才且才智出众的人,这就可以排除A、B、C三个义项,选D。

四、 通假知义

文言文中通假字甚多,一般有三种情况:① 完全同音。如“兵不顿而利可全”,把“顿”理解为“劳顿”,就成了“武器不劳顿就可以取得完全的胜利”,意思显然不通,这时“顿”的意思就成了理解全句的关键了。如果我们根据同音形似通假的规律,联想到表示“不锋利”意思的“钝”字,就可以将全句译为“(未经战斗)武器还很锋利而胜利可以完全取得了”,句意就通畅明白了。② 声母相同。如:“河曲智叟亡以应”句中“亡”通“无”字。③ 韵母相同。如:“张仪至秦,详失绥堕车”句中“详”字通“佯”。翻译时,只要找出通假字,就能明白原字的含义,翻译就不困难了。

五、 活用解义

词类活用是指甲类词在特定的语言环境中具有乙类词的语法特征。有名词用作动词、名词作状语、使动用法、意动用法等几种情况。对这类词要理解其在特定语言环境下的特殊含义。这样,翻译起来才会顺畅。如名词作状语表状态时,一般要用“像……一样”来对译;意动用法要用“以……为”来对译。

六、 查书明义

古文中,有的词学生难以理解,教师必须教会学生使用《辞源》、《辞海》等工具书。

组词通用版篇6

本研究以2012年与传媒业相关的网络新闻与微博信息为基础数据,以词频分析的方法提取了传媒业地域关键词、传媒业行业关键词、传媒集团与上市公司关键词、传媒业年度热词四个词群。在舆情分析中高频词与突发词可以用来发现热点事件与突况,本文试图以“词”带“事”,通过词频的量化呈现出本年度传媒业的重点,并预测传媒业未来的热点趋势。总体来看,数字化、移动互联网将是传统媒体与新媒体近几年的共同热点,对于传媒业界人士与传媒研究者来说,大数据则是未来的一个机遇。

关键词:

传媒业 词频分析 数字化 大数据

对于认识和把握传媒业态的发展而言,除产业运作的客观数据、行业专家的逻辑分析之外,中国人民大学舆论研究所还提供了一种新的视角:基于智能化文本分析软件所采集的社会文本的数据视角,科学可靠地反映了社会眼中及话语中的传媒业态,为传媒业的自身观照提供了一个来自社会层面的镜鉴。本研究以科学抽样的方式搜集了2012年百度新闻和2012新浪微博(认证人群)中包含“传媒业”“传媒产业”“媒介业”“新闻传播业”等任一关键词的关涉文本,通过词频分析后共得到新闻词汇21 928个,平均词频13.4次,微博词汇18 765个,平均词频6.5次。经过同义词累加和无意义词剔除后,可归类出2012年传媒业的地域关键词、媒体关键词、人物关键词、动态趋势关键词等。实际上,还可透过某个词或某类词汇的凸显或变动观察到中国传媒业本年度的热点,更可管中窥豹预测未来传媒业的发展趋势。

一、传媒业地域关键词:国内方面,北(京)上(海)广(东)深(圳)依然是中国传媒业聚焦的热点;国际方面,美国是中国传媒业主要参照的对象,英国也因为奥运会、欧锦赛和女王加冕等异军突起成为关注率仅次于美国的国家

本研究对于筛选出的本年度传媒业新闻、微博中的高频地域词汇进行了专题研究,通过词汇在文本中的共现关系可构建出传媒业地域高频词的社会网络。词汇节点的大小代表了词汇的度数,即表示与这个地区直接联系的其他地区的数目,某地区的度数越大,表明这个地区在传媒地区关键词网络中越处在中心的位置上,与较多其他地区产生关联关系。

与去年相比,国内方面,北(京)上(海)广(东)深(圳)依然是中国传媒业聚焦的热点;国际方面,美国是中国传媒业主要参照的对象,英国也因为奥运会、欧锦赛和女王加冕等异军突起成为关注率仅次于美国的国家。尤其是北京、上海,处于中国传媒业地域关键词的核心位置,是中国传媒行业新闻中与其他地域关联最多的城市;其次为深圳、广东、浙江、江苏、武汉、成都等中国经济发达的省份或城市,以及香港、台湾等呈辐射状关联。

(一)国际关键词

1. 数字化转型加速。数字技术的广泛运用和新兴媒体的迅猛发展已成为国际传媒业不可阻挡的潮流,如数字出版(173)、数字音乐(43)、数字电视(30)、数字电影(19),数字化技术已经渗入了传统媒体的各个方面,成为社会关注的一大热点。(见表1)

本年度世界传媒业加快了数字化转型的速度:美国传媒巨头赫斯特(Hearst)将进军社交游戏产业,将社交游戏作为其内容产业延伸的全新平台;2012年《纽约时报》线上线下的总订阅收入达到7.683亿美元,首次超过广告收入;加拿大四大名报《渥太华民报》《温哥华省报》《温哥华太阳报》和《全国邮报》的网站从8月23日开始竖起“付费墙”,设置免费信息数量的上限,读者浏览更多在线新闻时需要支付费用。内容付费为报纸网站带来一丝希望,也寻找到了报业在数字化时代的盈利模式。美国知名刊物《新闻周刊》宣布将于12月31日停止发行印刷版杂志,全面转向名为“新闻周刊全球”的数字版刊物,今后将只保留在线出版的形式,包括iPad收费版及官方网站。澳大利亚菲尔费克斯集团通过合并重组推进新闻产品数字终端。

欧洲恶化的经济环境使欧洲传媒业充满动荡。据美联社5月28日报道,希腊全国记者28日举行24小时大罢工,抗议减薪和失业率上升,28日希腊所有的电视和广播新闻节目停播,多数门户网站没有更新。希腊的传媒业从20世纪90年代开始飞速发展,然而受财政紧缩政策的影响,传媒业近年来陷入衰退。过去两年来,希腊已有4000多名传媒从业者失业,从业人员的待遇下降了两三成。2012年德国第二大新闻机构,德国国际通讯社(DAPD)、老牌左派报纸《法兰克福论坛报》相继申请破产,《德国金融时报》也宣布在12月7日正式停刊。德国也有媒体专家称,2020年,将是第一代在数码媒体环境下成长起来的年轻人正式成年之时,因而传统媒体须抓紧时间开发新的产品维护读者群。

2.“英国年”。2012年可称为英国传媒业充满机遇的一年。从传播仪式观来看,加冕、战争、竞赛,都是构建共同文化、信仰与共享权威的传播盛事。而对于传媒业和传媒经济来看,这些传播盛事则代表了广告赞助商和激增的收视率。许多英国传媒从业者都认为,伦敦奥运将带动英国传媒行业的发展,后续的欧洲足球锦标赛、女王登基60周年庆典、威廉王子与凯特大婚使新闻机构有很多巩固其地位的机会。接二连三的传媒大事件使英国成为各国媒体的焦点,因此英国(216)伦敦(120)的词频总和已经接近了美国(323)。除此之外,中国社会对于澳大利亚、新加坡的媒介业也有相当的关注度,值得注意的是,韩国首度超过日本成为中国人观察国际传媒业的重要国度。

2011年《世界新闻报》窃听丑闻发生后,为争取流失的270万读者,新闻集团旗下畅销的英国小报《太阳报》于2月26日发行其周日版《星期日太阳报》。《星期日太阳报》的零售价为50便士,是其同类报纸《星期日镜报》《每日星报》的一半,该报在第一个完整的月内(即2012年3月)的平均销量高达240多万,英国的小报之间又将掀起新一轮的价格战和读者争夺战。

3. 澳大利亚:数字化引爆传媒业重组,“恶搞”带来职业道德悲剧。数字化的冲击下,澳大利亚大传媒集团试图以实体合并、人员精简、业态转型、股权调整实现媒体的数字化转型。一番重组洗礼之后,澳大利亚传媒业预计将在采编结构、内容风格和盈利模式等方面发生深刻变化。2012年澳洲最大多媒体集团费尔法克斯宣布将裁员1900人。费尔法克斯集团旗下都市类媒体受众中,纸质媒体读者仅占23%,网络和手机终端读者占77%。为顺应读者在数字化时代的需求,缩减成本,集团还有意合并《悉尼先驱晨报》和《时代报》两个报社编辑。按照既定安排,集团将加速数字化订阅策略,通过新媒体终端向读者传输个性化的新闻产品,对数字化终端用户推广网上“分级计费”模式,并逐步推广应用范围。

澳大利亚媒体所有权集中度较高,全国主要城市的12家报纸中的11家归新闻集团或费尔法克斯所有,这两大传媒集团旗下的都市媒体发行量分别占全国总量的64.2%和26.4%。因此,费尔法克斯集团的重组和新闻集团的重组酝酿将在整体上推动澳传媒业更加适应数字化要求,但也可能带来股权过于集中、内容同质化等新问题。

2011年英国媒体的“窃听门”的阴影还未散去,2012年年底悉尼“2天调频”电台两位主持人冒充英国女王伊丽莎白二世,获取凯特王妃怀孕信息并间接导致了一名护士死亡,这一事件值得媒体人对媒体的强大影响力以及应遵循的职业道德进行深刻反思。

4. 韩国:中国的《限外令》影响韩剧对华出口,文化产业向产业文化过渡。2月13日,广电总局《关于进一步加强和改进境外影视剧引进和播出管理的通知》,通知规定:引进境外影视剧的长度原则上控制在50集以内;境外影视剧不得在黄金时段播出。这条貌似针对韩剧的《限外令》引发了韩国电视剧产业的震动,韩国每年对华的电视剧出口额高达 1500多万美元,这条禁令可能会影响韩剧的对华出口。韩国相关业界正在探讨以“共同制作”的形式曲线进军中国市场的方案。

另一方面,以韩剧与韩国音乐、电影为代表的韩国文化产业正在与其他相关产业进行融合,将传媒产品转化成生活方式,带动服装、旅游、生活用品、IT产品等其他相关产业的共同发展,提升韩国国家形象,为更多的韩国品牌拓展国际市场。5月,韩国进出口银行海外经济研究所发表的“韩流出口影响分析与金融支援方案”表明,韩国文化产业出口每增加100美元,就能使韩国商品出口增加412美元。在亚洲地区,韩国的CD唱片等音乐出口对韩国化妆品出口的牵引效果明显,电视剧、娱乐节目的出口对手机、电脑等IT产品贡献突出。而在中南美地区,CD唱片等音乐出口对手机、电脑出口影响最大。 对于中国相对过剩的电视剧生产而言,“限外”并不一定可以提升国产剧的质量,应该向韩国文化产业借鉴,增强软实力的同时带动其他产业的发展。

(二)省市关键词

1. 经济发达地区是中国传媒业发展的主轴,部分经济欠发达地区传媒业也有令人瞩目的表现。在省和直辖市的词频中,北京、上海一直是中国社会关于传媒业的话语文本中提及最多的地区,与去年对照,深圳、香港、台湾、河北、湖北、浙江、广西、河南、等区域在提及频率排名上有大幅提升。香港、台湾本年度关注量猛增的原因是引发各界讨论的壹传媒(词频25)并购案。香港传媒大亨黎智英麾下的壹传媒有限公司欲全面退出台湾市场,欲将其在台湾地区的印刷、电视业务及资产,以175亿元新台币的价格出售。壹传媒在港台地区影响力颇大,因此壹传媒并购引发台湾各界对于媒体垄断的担忧,并购后的台湾媒体会因言论集中化而损害新闻自由。(见表3)

在城市方面,深圳尤其是杭州受到了人们较多的关注,而西安、南京、宁波、大连、厦门等城市的词频幅度提升较大,是本年度传媒业新闻事件中提及较多的城市。(见表4)

2. 跨界整合、产业融合成为当下中国传媒发展的主题词。综合省市词频中的高频地域词汇和该区域2012年发生的重大传媒事件,可以发现今年各地区的传媒业继续沿着跨地域发展、跨媒体合作、跨产业融资的合作与融合趋势发展。其中最值得关注的有:(见表5)

A.深圳三大传媒集团牵手腾讯,湖北广电与乐视共建网动。在媒体合作方面,互联网与传统媒体的资源互换、内容与渠道共享是当今传媒业大势所趋。深圳报业集团、深圳广电集团和深圳出版发行集团与腾讯签署战略合作协议,这是迄今国内最大规模的跨媒体平台合作项目。合作方式包括跨媒体联合报道大事件、策划大型联合报道、品牌活动的合作联动、打造微博社区化平台。深圳报业集团媒体新技术研发中心将于近期挂牌成立,该中心将着力推进流媒体定制分发交易平台、流媒体云计算平台和流媒体云基地三个媒体技术攻关项目的运行和实施。跨媒体的合作战略可以利用深圳三大媒体集团丰富的内容资源和腾讯新闻、微博、社区等新媒体渠道,实现传统媒体与新媒体的互惠共赢。

湖北广播电视台与香港电讯盈科签订了战略合作协议,推动湖北电视节目走进香港及海外,实现了一次跨地域的尝试。乐视网(词频47)与湖北卫视也在2012年达成合作协议:在联合拍剧、节目双向输出、多屏互换宣传等多个方面展开紧密合作。乐视网网络自制剧及综艺节目方面还将制作出适合电视台播出的版本,实现网络自制内容向电视台的首次大批反向输送,开辟网动全新格局。自从互联网视频诞生以来,电视台与视频网站之间在节目内容、广告资源、受众吸引力之间的竞争便从未停息过。2011年的“限广令”也意在拉回网络视频上的受众,而各视频网站的自制剧、自制栏目也崭露头角。乐视网与湖北卫视的合作也在探索一种双向输出的合作新模式。

龙虎网(词频13)与南京联通双方将运用各自的优势和资源,共同投入、联合打造南京3G互联网综合服务门户“移动龙虎・无线南京”。此外,双方还将共同搭建南京首家“全媒体移动采编传播平台”,开创3G时代下的“网络+手机、平板等移动终端+出版物”的立体化新闻报道模式,并通过共同投入、联合包装一支全媒体龙虎网市民记者队伍等创新举措,推动南京传媒业的新一轮变革。

B.产业融合、行业合作:北京同仁堂、广西皇氏乳业、广州南航跨界传媒业。本年度,众多非传媒行业尝试通过内容合作、资本投入的方式跨入传媒业。如中药企业与传媒业的合作开创了品牌推广和专业内容资源相结合的新模式。2012年,北京同仁堂国际有限公司(词频13)与中国航天科技集团所属亚太卫视签署合作协议,共同投资港币1000万元,在香港成立北京同仁堂传媒(香港)有限公司。北京同仁堂借助亚太卫视的节目制作和传播优势,将建设和经营北京同仁堂保健、养生海外卫星电视频道,向电视节目信号能够覆盖的数十个国家和地区宣传中医药文化。

皇氏乳业(词频89)与新华社广西分社的合作则意在为乳制品扩大销售渠道。为了履行与新华社广西分社的合作协议,公司与广西南宁创伟投资中心共同投资设立广西新皇传媒有限公司。皇氏乳业称,新华频媒项目争取在3~5年内建成广西最大的公众频媒系统,将覆盖广西的卫生医疗系统、金融系统、交通系统、工商税务系统等多个专业行业领域。新华影廊项目争取在2~3年内建成国内领先、覆盖广西各城市(包括县城)以及大部分大中小学校的新媒体传播平台。皇氏乳业涉足新媒体,意图在于借助新华频媒、新华影廊推动主营的乳液产品进入这些渠道进行销售。

相对而言,南航集团(词频22)在文化传媒领域的布局由来已久,继海航和国航涉足新营销后,南航也开始有所动作,直接参与央视频道的运营。2012年南航与CCTV-发现之旅频道举行了签约仪式,双方宣布将以战略合作的形式运营CCTV-发现之旅频道,并为此合资成立公司。原创节目《空姐新发现》由明星空姐“带路”,将对南航的国际航线目的地旅游资源进行充分挖掘,被业内视为南航国际化战略“软”营销的重要砝码。此次合作,也将之前一直低调运营的南航传媒推至台前。作为南航集团旗下唯一从事媒体开发和运作的企业,南航传媒早已完成了改制,并谋求上市。

二、媒体业行业关键词:网络、电视成为产业发展的热点,手机、广播人气上升,报纸淡出人们的视野

本项研究利用传媒业新闻与微博文本中的媒体高频词、经济高频词、景气高频词,共同构建了传媒业的媒体经济语义网。如图所示,该网络分化成三个子网络:一是以网络、电视为核心,广播、频道、节目、广电、手机、杂志相关联的媒体网络,并且网络与电视之间的关系最为紧密,手机、广播人气上升,而报纸则逐渐淡出人们关注的视野。一是以广告为核心,增长、堪忧、影视、电影等诸多媒体和景气词汇围绕形成的广告网络。一是以上市、经济为核心,围绕资本、改革、推进、融资等经济、景气词汇形成的媒介经济网络。可以发现,媒体、广告网络间的关系更紧密,而与媒介经济网络间的联系主要依靠频道、经营、发行、改革等关键词汇维持。可见,媒体与上市、资本、金融、融资等经济类问题的关系并不紧密。

而从媒体的绝对词频上看,相对于2011年,2012年度传媒业对出版、广告、新媒体的关注度大幅提升,手机也是2012年传媒业的高频词之一。

1. 加快出版传媒集团改革重组,运营商、电商构建数字出版平台。本年度数字出版(173)、出版传媒集团(161)、时代出版(33)、中国出版集团(33)、凤凰出版(31)、加快出版传媒集团改革(25)、电子书(18)、数字出版基地(17)、长江出版传媒(17)、数字阅读(13)等都是出版业的高频词。4月,大英百科全书公司宣布将停止出版纸质的《大英百科全书》,这部拥有244年历史的百科全书未来将只提供电子版。经过6年的快速发展,数字出版在我国已步入成长期,开启了行业升级换代之路,数字化也将是未来一段时间内出版业的热点与趋势之一。

2月27日,新闻出版总署了《关于加快出版传媒集团改革发展的指导意见》(以下简称《指导意见》),明确指出,到“十二五”期末,将进一步做强做优国家层面人文、教育、科技三大出版传媒集团,培育多个年销售收入超过200亿元的大型骨干出版传媒集团,推动新华书店(词频9)跨地区兼并重组(词频27),组建全国性国有大型发行集团。同时,鼓励出版传媒集团深化体制改革(词频126)、加强管理、应用新技术,鼓励进行战略重组,鼓励走出去(词频44)。鼓励和支持转企改制(词频47)到位的新闻出版单位自愿加入各类出版传媒集团。支持出版传媒集团发展以网络出版、手机出版、云出版等为代表的出版新业态;支持出版传媒集团实施数字化战略,加快发展有声阅读、电子书、电子书包、数字报等;支持出版传媒集团和大型电子商务(词频83)企业进行战略合作和资源整合,构建线上流通和线下流通相结合的现代化出版物流通体系。

《指导意见》强调了出版传媒集团兼并重组和数字化转型两大重要问题,而目前国内各大出版集团几乎都已成立数字传媒公司或数字出版部门,通过与电信运营商合作、网络出版、教育数字出版、拓展数字版权服务平台等方式进行转型升级。电信运营商涉足手机阅读市场,借助先进的3G技术和庞大的手机用户群体,成为当前发展最为成熟的平台模式。7月,新闻出版总署与中国联通签署《推进数字出版产业发展战略合作备忘录》。至此,出版总署已与国内3大运营商达成合作协议。11月22日,中国电信数字阅读基地正式开始公司化运作,而中国移动手机阅读基地已成为中国最大的数字出版企业。通过与三大通信运营商签订战略合作协议,今后与运营商的合作中,中国电信、联通两家给内容商的分成比例不低于65%,中国移动分成比例不低于60%。随着数字出版和手机阅读的成熟,作为内容提供方的出版业正尝试在与运营商的合作中获取更大的主动权。根据亚马逊线上交易情况,2011年美国数字出版已占到图书总销量的50%。作为数字出版的售卖终端,电子商务有着传统优势。当当网上线电子书平台之后,京东、苏宁易购、亚马逊中国也分别在今年推出了各自的电子书平台。

2. 手机终端争夺战,迎接移动互联新时代。通过词频统计可发现如下2012互联网的热点词汇:移动互联网(133)、电子商务(83)、二维码(46)、网游(44)、云计算(43)、智能手机(30)、运营商(26)、Facebook (17)、退市(16)、社交网络(11)、微信(10)、实名制(8)。从收集到的传媒业新闻和微博文本上看,互联网产业可谓分分合合,争端不断:上市与退市,电商价格战、优酷土豆合并,360与百度的搜索引擎争夺。

从之前“传媒业媒体经济词网络”图中可以发现,电视、网络、手机三者在词汇网中的绝对距离最近并且相互关联最为紧密,形成了一个子网络,虽然其中电视、网络的中心度最高且词频提及量最大,但手机却代表了未来互联网、电视乃至广播发展的一大趋势:移动互联。

中国互联网络信息中心数据显示,截至6月底,中国网民数量达到5.38亿,手机网民规模达到3.88亿,首次超越台式电脑成为第一大上网终端,这使得原本的互联网巨头开始加快移动互联网的布局。百度开展了“移动・云”、成立LBS事业部,李彦宏称:借助PC上的优势,把移动做起来,而不是拼命维持现状,想把用户留在PC上。而腾讯云平台已运营2年,微信用户已超过2亿,抢占移动互联网可谓占尽先机。搜狐和新浪2013年的市场部署显示,移动互联网业务将成为明年门户网站发展的重点。目前搜狐新闻客户端已获得近6000万安装激活量,总订阅量突破1.6亿,成为迅速发展的移动媒体平台。新浪也根据现有的用户情况将主要业务划分为门户和微博两大板块,此次业务调整显示新浪微博今后将更加专注于移动互联网领域的发展。而在终端争夺方面,百度、360、阿里巴巴、盛大等互联网厂商纷纷加入到了手机制造领域,特供机与应用推广齐头并进,直接将自己的移动应用内置在智能手机桌面。而今年的苹果iPhone 5、三星Note 2更是炒热了智能手机终端。

在布局移动互联网战略,抢夺手机终端之后,需要互联网企业和传统媒体共同思考的问题则是平台的建立和内容、应用的提供。目前移动互联网领域的应用平台包括以微博、微信为代表的社交平台、以网购为代表的电商平台、以门户网站为代表的新闻客户端媒体平台。未来的趋势则是通过开放API的方式,吸引传统媒体、出版商进驻,打造全新的“移动媒体平台”。

3. 传媒集团与上市公司成为媒体关注中的重点。上市(864)、传媒集团(637)、传媒板块(218)、传媒股(181)、IPO(177)一直是传媒业新闻中的高频词汇。对比去年传媒高频词,2011年以及2012年新上市的浙报传媒、浙江日报报业集团、大地传媒、吉视传媒等传媒业集团与上市公司在本年度的词频排序都有大幅提升。2012年被业界人士视为传媒上市热潮年。目前我国传播及文化产业类上市公司有33家,排队上市的文化传媒类企业超过30家,涉及影视、出版、传媒、广告、动漫多个领域。包括“拼抢”国内电影院线上市“第一股”的万达电影院线和广州金逸影视传媒;广播电影电视业的幸福蓝海影视文化集团、东阳青雨影视文化、北京能量影视传播、上海新文化传媒集团和保利文化集团;互联网行业的暴风科技和北京中文在线;广告业的思美传媒、中航文化、深圳市易尚展示和兆讯传媒广告。2012年,新闻出版总署了《关于加快出版传媒集团改革发展的指导意见》,政策支持和利好也推动了出版业的上市:中国出版传媒集团、中国教育出版传媒集团、中国科技出版传媒集团以及中国国际出版集团里的股份公司上市已列入中央计划,包括知音传媒等15家出版企业启动上市工作。2012年,由广东省出版集团剥离重组、联合南方报业传媒集团共同发起成立的南方出版传媒股份有限公司正式加入了首次公开发行初审大军。但是值得各类传媒上市公司和预备IPO的传媒企业注意的是,上市并非最终目的,培养和提升优质的资产更为重要。

对于已经上市的传媒公司来说,今年众多突发的利好消息刺激了传媒板块。北京时间10月11日晚,中国作家莫言获得诺贝尔文学奖,成为获得该奖的第一位中国籍作家。受此消息影响,10月12日,文化传媒板块强势开盘,新华传媒、出版传媒、大地传媒、长江传媒等多只个股涨停。长江传媒上涨6.29%、奥飞动漫上涨5.48%,凤凰传媒和粤传媒涨幅超过7%,中视传媒、浙报传媒、中文传媒和华闻传媒涨幅超过5%,吉视传媒涨2.38%,百视通涨2.1%。而在2012年底,贺岁档电影《泰》的热映也刺激了光线传媒的股价步步走高,盘中一度触及涨停。

三、传媒业年度热词

1. 微电影(117)。随着微博兴起,以一系列“微小说”“微电影”为代表的“微文化”诞生。2010年,《老男孩》开创了微电影先河。微电影的展示平台已经跳出了微博,成为各视频网站吸引流量的重要内容,爱奇艺出品的《2011城市映像》微电影系列在重庆卫视的播出,也宣告了传统电视媒体与网络媒体更深层次的进一步融合,2012年底株洲的首个公益题材微电影《爱情公交》在全市所有公交车上滚动播出。一个崭新的全媒体“微电影时代”正式来临,而2012年则是微电影大热的一年。

正是由于微电影重组了产业机构,不管是媒体、明星代言人、导演、编剧,还是娱乐公司、制作公司、广告公司,都能够在微电影的相关产业链条中找到自己的位置,去发现生产制作和传播商业价值的机会。创作人员除了草根和业余爱好者外,也有大量知名导演和明星加盟。最重要的是,这种视频内容已经成为网络营销的一种重要手段:大到汽车、奢侈品、IT、电子商务,小至饮料、食品甚至是宾馆、卫生纸,微电影这种主题明显、成本适中并且适于病毒营销口碑传播的新媒体内容为各类广告主所青睐。专家预测,微电影的产业价值保守估计未来五年内在100亿元以上。

2012年所有微电影中,营销效果和品牌宣传作用最好的当属《花露水的前世今生》(百度搜索量221,000)和《中国好厕纸》(百度搜索量230,000)。六神花露水微电影有着小清新的主题风格和新颖的表述方式、诙谐幽默的旁白,甚至在视频中顺应网民的调侃,承认其官方英文名“Six God”,让这部短片快速地风靡网络。舒洁则借用了2012年风靡全国的电视真人秀节目《中国好声音》的模式,寓教于乐讲述厕纸历史的前世今生,并且推广了新产品舒洁湿厕,成为新产品网络推广和品牌树立方面的一个典范。

2. 三网融合(词频79)。按照国务院《关于印发推进三网融合总体方案的通知》,2012年年底前需组建国家级有线电视网络公司,广电总局局长蔡赴朝去年介绍2012年工作重点时也提出,要加快推进有线电视网络整合,到2012年年底实现一省一网,同时组建国家级广播电视网络公司。各省的网络整合和三网融合的进度都在提速。2012年,江苏电信ITV目前的用户已超过400万户,用户规模居全国第一,中国电信江苏公司与包括新华报业传媒集团等合作方签署了协议,以后扬子晚报读者可以在ITV电视上“读报”。按照国务院加快推进电信网、广电网、互联网三网融合的要求,中国网络电视台、山东广播电视台、中国联通山东省分公司共同推进的IPTV业务正式开通。其中,中国网络电视台作为集成播控总平台、山东广播电视台作为集成播控分平台,山东联通负责节目内容的传输与分发,三方将通力协作。湖南电广传媒股份有限公司将投入37.27亿元对湖南省14个市州网络进行升级改造。另外,电广传媒还将建设MCC媒体处理中心、多媒体通讯平台、物联网监控平台;建设家庭网关、家庭安控、数字教育、数字旅游等业务。11月28日武汉塑料变更公司名称为“湖北省广播电视信息网络股份有限公司”,湖北广电网络借壳上市完成最后一步,这对加速湖北省网整合起着积极作用。通过上市运作,实现资产升值,能够解决省网整合中的资金问题,为省网整合扫清一大障碍。中国网络电视台(词频62)2012年7月签署北京IPTV合作协议、8月签署河北IPTV合作协议、10月签署青海IPTV合作协议,这将带动全国三网融合IPTV项目三方合作协议新一轮签约高潮。

杭州模式实质上是广电运营商主导下的IPTV发展模式,得益于杭州广电和杭州网通在资本层面上的深层次合作,华数传媒(词频18)可以运用有线网和IP网两大网络。10月19日华数传媒借壳*ST嘉瑞成功登陆资本市场,正式在深圳证券交易所挂牌上市。这次注入上市公司的资产除包括杭州市的有线网络资产外,还有华数传媒的新媒体业务,包括全国最大的数字互动电视业务,以及互联网电视、IPTV和手机电视业务。其中数字互动和手机电视是主要收入和利润来源,而互联网电视和IPTV将与全国范围内的电信和广电运营商合作来推广,将成为公司未来重要的业务增长点。

3. 大数据(词频20)。IDC研究表明,全球企业数据正以55%的速度逐年增长。有观点认为,如今只需两天就能创造出自文明诞生以来到2003年所产生的数据总量。《传媒梦工场观察》在2012年对未来传媒格局的预测之一是:没有大数据,免谈大媒体,未来的大媒体集团必然为拥有强大数据库支撑的平台型公司,而这样的平台型媒体公司在中国不会超出10家,它们可能来自互联网公司,传统媒体公司,还有从移动互联浪潮中成长起来的新新公司。本年度,大数据一词搅动了传媒业的一池春水,从传统媒体集团、互联网巨头到学界研究者、政策制定与管理者,都在讨论大数据的利与弊。甚至,今年10月,广东省省委书记到省财政厅进行专题调研时也给财政厅全体干部推荐了《大数据:正在到来的数据革命》一书。

凤凰网COO李亚认为信息“遍在化”、传播“碎片化”时代,受众成为各种各样的“控”,在碎片化时间中,通过微博、微信等多终端、多渠道的生活工作场景,多元媒体消费趋势越来越明显,甚至会发展成一种网络焦虑感。因此,只有在大数据挖掘基础上做到对品牌和消费者的充分洞察,才能以更好的创意实现对目标群体的精准覆盖,获得最有效的整合营销效果。博达大桥(DraftFCB)全球主席HowardDraft认为,广告公司、广告主对广告主和广告公司的意义是巨大的,数据储量将使媒介变得更有效率,它能帮助企业以更少的钱找到更为精准的目标受众,也能激发出那些原来不曾有购买意向的顾客的潜在购买欲望。中国人民大学新闻学院教授彭兰认为:社会化媒体、移动终端、大数据是影响新闻生产的新技术因素。目前,“大数据”的概念及其价值更多的是被IT业和企业营销领域所关注,但事实上,传媒业也将是受到大数据时代冲击的主要行业之一。当数据成为新闻生产的核心资源时,与数据有关的统计、分析与挖掘技术,也就成为新闻生产、新思维的支持工具。

浙报集团旗下的新媒体战略投资机构已展开了行动,投资了知微、优微两个项目。目标直指在社交网络的数据深度挖掘。知微主要是评估微博的传播影响,一条微博有多大威力,其传播产生了怎样的影响,人们的情绪是积极还是消极等。阿里巴巴集团在管理层设置了“首席数据官”一职,管理“聚石塔”(一个大型的数据分享平台),它通过共享阿里巴巴旗下的子公司淘宝、天猫、支付宝等的数据资源来创造价值。同样的平台模式也出现在中国的另一家互联网巨头――腾讯,腾讯正通过建立社区开放平台来实现大量的数据互通,以挖掘更大的商机,其目标是把下一代腾讯网打造成“大数据”时代的智慧门户。

注:本研究的数据基础为2012年传媒业网络新闻与微博信息,文中引用的数据和各方人士观点也均来自2012年的传媒业新闻。

基金项目:本文为中国人民大学新闻学院承担的教育部985项目的成果之一

组词通用版篇7

关键词:牛津版初中英语教材;阅读教学;教学方式

英语是初中课程的重要部分,主要培养学生的语言运用能力,体现逻辑思维的灵活性转变。英语学习包括听、说、读、写四个部分,其中读在考试中占据了很大的分值,也是许多学生无法很好掌握的部分。因此,对初中英语阅读教学方式的探究势在必行。

一、牛津版初中英语教材的特点

与其他初中英语教学版本相比,牛津版初中英语教材的特点主要体现在“突破”二字上。首先,它将原有教材的生词进行整合,在教学内容上进行优化,将单词、词组以及语法的组合方式进行变换,让学生以口语表达的形式展现出来。在学生的口语组织和表达过程中,阅读既可以锻炼他们的应用能力,又能够使他们正确掌握语法。其次,牛津版初中英语教材更加实用,形式上更加切近生活,内容上更加全面。学生既可以在学习中体会到英语交流的乐趣,又能够做到灵活变通。最后,牛津版初中英语要求教师以学生为主,设置课堂主线,给予学生更多的思考空间。

二、基于牛津版初中英语教材的阅读教学策略

1.情境教学法

情境教学法在牛津版初中英语阅读教学中比较适用,教师可以为学生设置场景,增强学习的趣味性。第一,教师可以利用现有的多媒体进行阅读教学。首先,选择几段不同的阅读内容,在每段阅读内容旁附带一张图片或者是三维动图。上课之前让学生随机选择一幅图片,对应的内容就是他们所要学习的阅读文章。选择相同图片的学生为一组,共同阅读。其中一位学生先简单浏览,将其中的生词和短语标注出来,其他学生查询。接着,学生独立分析,通过独立阅读的形式将中心思想概括出来,再与组员讨论,确定文章主旨,以达到阅读的目的。第二,教师可以利用角色扮演的方式巩固阅读内容。以牛津版初中英语阅读中的“going shopping”为例,教师可以让三名学生组成一组,分别扮演家长、孩子以及售货员。学生要根据自己的角色设定人物场景与对话,对话中要出现文章中的阅读词语。这样不仅能够使学生对阅读内容理解得更加深刻,还能够活跃课堂气氛,提升学生对英语的学习兴趣。

2.PQ4R教学法

PQ4R教学法是英语阅读中最常用的一种方式。Q代表question,教师在学生阅读之前,应该以导入的方式提出一些问题,学生带着这些问题阅读,加深对文章的整体印象。四个R分别代表read、reflect、recute、review,也就是阅读、反思、复述以及复习。首先,让学生浏览文章,以速读的方式概括出文章的主要内容。接着,学生进行二次阅读,从相关问题出发,寻找答案。反思主要体现在教师对文章的讲解上。教师对学生进行提问,将不同学生的答案进行归结,学生则要将自己的思路陈述出来,分析问题的关键点。教师对学生的答案进行评定和总结,学生要从中找出自身的不足,并对阅读中容易出现的问题进行反思。在复述方面,教师可以将学生分成两个小组,每组学生要对文章进行朗读,体现读的完备性。教师从朗读声音的大小以及单词阅读的准确率、语音、声调等四个方面进行评定,选出成绩最佳的一组进行奖励。在复习方面,学生要对课堂中罗列的生词、短语以及句型进行总结和归类,为阅读能力的提升奠定基础。例如,在牛津版初二英语的第五单元阅读内容“scholl life”为例,教师可以在问题的基础上进行阅读指导,引导学生将文章大意复述下来。

3.阅读教学中要捋清主线

在初中英语阅读教学中,教师要帮助学生捋清主线。与其他版本相比,牛津版教材内容更加丰富,知识点更加齐全,阅读难度也相对较高。所以,在阅读教学过程中,教师要引导学生捋清主线,进行综合性理解。例如,在“the ghost in the park”这篇阅读文章中,学生可以先泛读,将文中讲述的内容大致表达出来。接着,教师要引导学生对文中出现的人物、事件进行总结,在确定主人公的基础上对其他人物的行为进行归结,并找出他们这样做的原因。最后,学生要进行精读。精读是指学生带着问题,在教师的帮助下逐字逐句地翻译,提高对文章整体性的认识。

综上所述,牛津版初中英语阅读的广泛应用很大程度上提升了学生的学习能力,使学生养成了独立思考的良好习惯,为成绩的提升奠定了良好基础。

参考文献:

[1]黄翠红.“4R”阅读――为初中英语阅读教学插上隐形的翅膀[J].文理导航(下旬),2012(10):54-55.

[2]黄翠红.“4R”阅读――为初中英语阅读教学插上隐形的翅膀[J].中小学教学研究,2013(1):30-31.

[3]金婷璐.图示理论视角下的初中英语阅读导入教学[J].长春教育学院学报,2013(16):155-156.

组词通用版篇8

关键词:数字出版;资源库;Alfresco;TextRank

中图分类号:TP311 文献标识码:A DOI:10.3969/j.issn.1003-6970.2015.05.008

0 引言

随着计算机技术、通讯技术和网络技术的发展,数字出版业务相对传统出版业务,逐渐显示出独特的优势。外研社正处在由传统出版到数字出版的转型期。数字出版是为数据库而编写内容,更强调了内容数据的重要性和内容的可重复利用性。它将内容拆分成一个个的独立的内容单元,通过模板对这些内容单元进行按需重组,最后由动态引擎,生成纸质书、电子书、光盘等一系列的出版产品,实现按需出版业务。因此,资源的采集和初步加工是实现数字出版的前序环节。

目前,外研社的出版业务中存在以下一些问题。作者编写内容的结构差异,导致了出版社在处理作者交稿的时候,需要占用很大的精力去处理内容结构差异,同时,资源采集渠道的不便也会影响资源采集的数量和质量,也不便于出版社实现采集的资源的全社使用和统一管理。社里目前只是对资源进行简单地存储和基于文件夹的分类,缺乏对资源的描述,使资源的可利用性差。所以,本文设计实现了一个面向互联网和内网的资源采集、资源标注等综合型的资源库系统,可以提供方便快捷的资源上传、资源转换功能,在很大程度上减少出版社收集资源的时间和人工成本。本文还使用词语语义相似度加权的TextRank方法对社内的教育资源进行基于知识点的自动标注,方便创作者按照教学目的对内容资源进行检索和重新组织,这对数字出版中教材的创作有着非常大的帮助作用。

1 系统功能设计

1.1 总体功能模块

本文重点对外研社的出版生产业务过程进行了详细的调研,设计出的资源库系统由资源管理、资源加工、用户管理、日志管理四大功能模块组成。详细见图l所示。

(1)资源管理模块主要提供资源的上传下载、查看预览、查询等;

(2)资源加工模块主要提供对资源的格式转换拆分和资源的知识点标注;

(3)用户管理模块主要提供对用户的权限、信息的编辑和查询;

(4)日志管理模块负责记录用户行为,包括登陆、查看数据、下载数据、使用数据等。

1.2 资源知识点标注

资源加工模块提供对资源的知识点标注。资源知识点标注是资源智能化的重要体现方式之一。外研社资源主要包括各类大中小学教材教辅,文本资源占绝对大部分,每个文本资源内部都有一定的知识结构。经过知识点标注的资源具有功能上的独立性。方便创作者按照教学目的对内容资源进行组织。编辑人员的专业领域知识往往不够完备,知识点标注易受主观因素影响,使标注的准确度降低。人工标注还要耗费一定的精力和体力,工作效率会降低。因此,本文提出了资源的知识点自动标注。

关键词是表达一个文档核心意义的最小单元。本文选择文本关键词作为知识点。选择适当的关键词提取方法就显得非常重要。目前的关键词提取方法分为有监督的方法和无监督的方法两大类。有监督的方法需要通过训练语料构建模型实现,无监督的方法仅借助于词语之间的关系直接从文本本身提取,无需训练过程,计算速度快,应用较为方便。考虑到在上传文档资源时,自动完成关键词的提取,无监督方法既可以保证提取关键词的准确性,又能保证计算的快速性,因此本文选用无监督的方法实现关键词的提取。TextRank方法其中的代表,在众多无监督关键词提取方法中表现出卓越的性能。本文对传统的TextRank进行改进,使用词语语义相似度加权的TextRank关键词提取算法,使其更加适用于知识点的标注。

资源库提供基于知识点的查询。在输入查询检索词后,首先将检索词与知识点关联网中的知识点进行匹配。知识点关联网是以树形结构表示知识点之间关联的网络。若匹配成功,则选择该知识点的上一级知识点一同作为检索词抛给搜索引擎,进行资源的知识点检索,这样可以检索到相关资源。

2 资源库架构设计

本系统主要是基于外研社内网和互联网,除了为社外人员提供提交资源的入口外,主要为社内工作人员搭建一个共享社内数字资源的平台。因此决定采用browser/server(简称B/S)结构的设计思想。Alfresco一款优秀的开源资源库,是一个完全的Java应用程序,基于J2EE框架,如图2所示。它是B/S结构。Alfresco中的内容应用程序和web应用程序都是基于内容存储库的服务上开发的,内容存储库处于资源库的最底层,由数据库、索引和内容文件组成,是资源库的核心。

Alfresco是基于Java开源框架Spring开发的,它提供了一系列可以通过不同接口调用的数据存储服务,通过以下三个基本服务实现存储访问内容:节点服务、内容服务和搜索服务。内容是信息数据的载体,通过内容服务,元数据及内容都可以根据内容模型的规则定义被结构化。

本文通过对Alfresco进行开发与定制,使其满足本文的需求。Alfresco中,资源的元数据存储在关系型数据库里,而内容本身则以二进制文件的形式存储在文件系统中,数据库存储提供高效的查询、事务处理及管理功能,而文件系统则保存比较大的内容数据。根据Alfresco的架构形式,本文对资源库进行架构设计,如图3所示,使用内容存储库提供的基本服务实现资源加工模块、资源管理模块,用户管理模块功能的开发。关系数据库中主要提供资源元数据信息的存储、用户信息的存储、机构组织信息以及知识点关联信息的存储。物理文件系统提供对资源的二进制形式文件存储。

3 资源库实现的关键方法和技术

3.1 词语语义相似度加权TextRank

关键词提取算法

TextRank的思想来源于PageRank,通过把文本分割成若干组成单元并建立图模型,结点代表词语,边代表词语之间的关联,利用投票机制对文本中的重要成分进行排序,一个结点链人的结点集表示其投票支持者,投票者越重要,数量越多,则被投票者的排名越靠前。仅利用单篇文档本身的信息即可实现关键词提取。传统TextRank中,某个词语的影响力分值是均匀传递到与其相邻的词语中,构建的图模型是一种无项无权图,考虑到本文要处理的是自然语言文本,部分词语之间的关联度会更高一些,因此,本文引入边权重计算。由于教育资源中,知识点易共现,同时知识点之间存在较大语义相似度,本文考虑将相关联的词之间的语义相似度,加入边权重计算中,夏天等考虑词语本身的重要性差异,提出了考虑词语结点影响力的相关因素的词语位置加权的TextRank方法,该方法引入词语的覆盖影响力、位置影响力和频度影响力用于计算词语之间的影响力概率转移矩阵。本文考虑到知识点往往出现在文章标题中,往往是文中的高频词汇,因此本文在边权重计算中加入位置影响力和频度影响力,提出了词语语义相似度加权的TextRank方法。

令G=(V,E)为结点集和边集构成的有向图,V为结点集,由文本中的候选关键词构成,候选关键词指经过中文分词、词性过滤、去停用词处理后,获得的词语集。对于任意一个结点vi

资源加工模块中的知识点标注是在上传文档的动作中自动完成的。本文创建新的java类TextAnalyser,该类封装了读取文本内容、关键词提取、关键字存储的功能。将其加入上传文档时对应的spring配置文件中。该类首先调用内容服务ContentService获取资源的文本内容,接着调用使用词语语义相似度加权的TextRank方法对文本内容进行分析,提取后的关键词通过节点服务(NodeService)和内容服务(contentService)获取资源在数据库中的存储位置信息,将关键词保存到相应的元数据数据库中。

通过对Alfresco中的相应页面的JSP文件进行扩展或重写,可以定制实现资源管理前台界面。实现上述功能的Spring Beans、java class、iava script、JSP等文件将作为Alfresco的应用程序进行重新打包和部署,Alfresco提供AMP(Alfresco Module Packages)来实现打包,可以实现定制代码与Alfresco核心代码的分离,打包部署后,新的功能就加入到Alfresco中了。

4 结论

上一篇:妖湖范文 下一篇:天使不曾离开范文