科技信息论文范文

时间:2023-02-24 03:20:15

科技信息论文

科技信息论文范文第1篇

关键词:信息论;研究生教学;教学改革

中图分类号:G643 文献标志码:A 文章编号:1674-9324(2016)06-0131-02

《信息论》是本校电子科学与工程学院电路与系统专业硕士研究生(学术型)的专业必修理论课程,也是一般高等院校通信与信息工程、计算机科学与技术、电子科学与技术等一级学科下相关专业的本科生、研究生的主修专业课程[1-5]。通过对本课程的学习,使学生掌握有关信息论的基本理论以及编码的理论、实现原理和具体应用。虽然人们在本科生的《信息论》教学改革方面做了一定的工作[6-9],但其改革内容不符合电路与系统学科特点,更不符合研究生教学需要。笔者结合本学院学生基础、学校政策及本人近年来的教学实践,在学校研究生教学改革项目支持下,开展了本门课程的教学改革与实践。

一、课程特点

1.需要坚实的数学基础。该课程存在大量的公式推导与证明,与概率论、随机过程、近世代数等数学知识密切相关。若无扎实的数学基础,学生无法看懂推导过程,更无法从根本上理解信息论的数学意义及物理含义。

2.学生学习兴趣不高。由于电子专业硕士研究生的数学基础仅限于本科生学过的概率论与随机过程,对近世代数的了解几乎为零。学生面对繁杂、抽象的理论问题时,无法宏观地理解和把握,致使学生无法提高学习兴趣。

3.课程联系实际困难。课程抽象概念多、定理证明多,与实际应用有一定距离,且与其他课程联系较少。多数学生在学习过程中觉得内容枯燥、难度大,而且与将来就业方向联系较少。

鉴于以上问题,为了激发学生学习的积极性和主动性,促进学生更好地掌握本门课程,笔者从课程的教学内容、教学方法与考核方式三方面入手,提出了教学改革的相应措施。

二、教学内容改革――三个强化

1.强化离散信息论的基础作用。信息论的主要内容是信源概念、信息度量方式及三个香农基本定理,相应的内容又分别面向连续信源与离散信源。二者的区别在于,连续信源/信道及相应的定理一般需要结合随机过程知识来学习,而离散信源/信道及相应的定理是建立在概率论、线性代数的基础上。从推导过程和公式形式来看,二者具有内在的统一性。这可从连续信源信息熵的推导过程看出:将连续信源进行离散化,变为离散信源后再利用离散信源信息熵的求解公式并求解极限得到。因此笔者重点强化了对离散信源、离散信道及其容量、无失真信源编码定理、无失真的信源编码的内容。这对学生进一步掌握连续信源、信道及相关问题奠定了基础。

2.强化信息论的现实物理意义。笔者从课程本源出发,让学生理解公式或定理蕴含的深刻物理含义,使理论结果可视化,概念直观化。例如,在讲解离散信源的极值性定理时,可提炼出如下物理含义:第一层含义是,当信源各取值的概率相等时,人们对信源取何值的不确定性最大,由于各信源服从等概率分布,信源的平均不确定性即为各事件的不确定性,因此信息熵也越大;第二层含义是,对于具有不同数量事件的两个信源,若二者同时满足等概率分布,则预测数量较多事件的信源的难度较大,因此该信源的信息熵也较大。

3.强化教学案例的实用性。在本次教学改革中,共自创或搜集教学案例11例,每个教学案例都与教材内容有关,将晦涩难懂的理论内容变为鲜活的例子,让学生去感受和体会案例中蕴含的问题,从而为更好地理解教学内容奠定基础。以引入的六个视频教学案例为例,该案例以美国国家航天局发射的新火星探测器为背景,讲解了信息如何传播、如何加密等问题。通过这部分教学案例的学习,学生深刻地认识到了信息论的价值与实践意义。

三、教学方法改革――三个联系

1.联系计算机仿真。笔者鼓励学生应用MATLAB中SIMULINK工具设计具体的通信系统模型,如基于开关键控或正交频分复用的射频通信系统。让学生看到实验现象的同时,更加深刻地体会信息的传递过程,了解信源、信宿、信道的构成,学习信源编码、信道编码、加密、信道译码、信源译码等信息处理过程,加强学生对信道容量、信息传输速率、误码率等概念的把握。笔者督促学生将上述问题作为课程设计的作业,使其结合信息论所学的知识,提炼出相关问题、建立模型,加以认真分析解决;再将提炼问题和解决问题的过程以及结论进行汇总,撰写成研究报告。这既巩固了学生的基础知识,又锻炼了学生运用计算机进行建模和仿真的能力。

2.联系工程实际。由于研究生日常的工作大多在实验室从事工程项目的研究或开发工作,若能将这些工作与信息论知识联系到一起,无论对信息论的学习还是科研都将起到促进作用。笔者首先开展了调查研究工作,统计了各个学生从事科研项目的情况,然后让学生结合课程知识,从信息获取、处理、传输、存储的角度去解释。例如,在讲述信息不增性原理时,笔者结合温度传感器的设计问题:将大气环境温度看成连续信源,将传感器系统看作信道,将显示终端看作信宿。因此,设计该系统的关键问题――如何设计传感器才能最大化地得到信息而不丢失信息?学生带着这个问题去思考,就可以真正地体会传感器中信息传递过程。

3.联系科学前沿。为鼓励学生大胆创新,笔者尝试将科学前沿技术引入信息论课程,例如,室内、外可见光通信技术。笔者结合自己近年来从事可见光通信研究的经历,向学生讲授了可见光通信系统的设计、研制、实验测试等一系列过程;然后结合信息论课程所学的知识,将其与研制的可见光通信系统联系在一起。笔者也鼓励学生探索与信息论相关的科学前沿问题,开展课堂讨论与课下交流。让学生查询保密学、光学信息论等方面的文献,详细阅读并做总结。然后,切实提出自己的想法,再予以验证,从而将学生所学知识真正地和科学前沿结合在一起。

四、考核方式改革――三个引入

该课程原来采取任课教师命题、纸质考试方式。其弊端在于,教师命题规律和出题形式规定,学生只要做一遍往年考试题目,就可得到较高的分数。虽然这种考核形式能在一定程度上反映出学生的知识水平,但却无法体现其学术水平和实践能力。为此,笔者在考核方式上做了三个引入的变化。

1.引入随堂能力测验。随堂能力测验是考查学生运用所学信息论知识分析解决实际问题的能力。由于采取随堂考试形式,因此,对学生课堂学习效率和前期积累提出了较高的要求。例如,在学习香农公式时,笔者考查了学生运用香农公式计算射频通信所需带宽的问题;在学习无失真的信源编码时,笔者考查了应用霍夫曼编码对离散信源进行编码的能力。该测验在总成绩中占10%的比例,从而激励学生很好地利用课堂来学习知识。

2.引入学术论文加分。提升学术水平是研究生教学的任务之一。笔者针对信息论教学中每章的重点问题,均设置开放性的论题供学生选择,让其查阅文献、资料,进行认真的设计、理论推导、计算机仿真、现场实验,并将其总结成文,然后以学术论文的形式提交。笔者根据学生在文中阐述的观点、论证的严密性、结论的正确性与普遍性等方面予以考核。学术论文在总成绩中占20%的比例,是本次教学改革的重点。

3.引入上机考试。往年的信息论期末考试中,题目是由任课老师自行拟定。由于种种原因,考试题目重复率高、知识点考查单一,这给学生突击考试并取得好成绩提供了可能。为此,笔者将期末教师出题测试改为上机随机抽题考试。笔者建立了试题库,题型包括:客观题(选择、判断)、主观题(概念、简答、计算、综合)。在本校计算机学院协助下,建成了信息论上机考试系统,学生登陆系统后,按照教师设定的题目数量和难度,随机抽取试题。上机考试的在总成绩中占据70%的比例,也是这次教学改革的重点。该考核方式经试运行后,效果良好。

五、结语

笔者根据电路与系统专业信息论课程的特点以及目前教学中存在的问题,从教学内容、教学方法及考核方式三个方面提出了相应的改革措施。通过本次的教学实践证明,采取的这些措施有效地改善了课程教学效果,提高了学生的学习积极性、知识掌握程度和应用知识解决实际问题的能力。

参考文献:

[1]陈运.信息论与编码[M].北京:电子工业出版社,2007.

[2]叶中行.信息论基础[M].北京:高等教育出版社,2002.

[3]李梅.信息论基础教程(2版)[M].北京:北京邮电大学出版社,2003.

[4]曹雪虹.信息论与编码[M].北京:清华大学出版社,2003.

[5]吴伟陵.信息处理与编码[M].北京:人民邮电出版社,2005.

[6]李迎春,等.《信息论与编码》教学改革探讨[J].科技信息,2010,(20):18-20.

[7]邓家先.信息论与编码课程教学改革探讨[J].电气电子教学学报,2007,29(2):111-114.

[8]高宏峰,彭勃.信息论基础课程教学改革探究[J].洛阳师范学院学报,2010,29(2):160-161.

科技信息论文范文第2篇

在电子专业硕士研究生教学中,信息论课程是必修基础理论课程,但由于其与数学联系密切、理论性强、内容抽象,导致学生缺乏学习兴趣和效率低下。为促进学生更好地掌握课程内容,笔者从课程的教学内容、教学方法与考核方式三方面进行一系列教学探索,提出“三个强化、三个联系、三个引入”的改革措施。实践结果表明,这些措施有效地改善了课程教学效果,提高了学生的学习积极性、知识掌握程度和应用知识解决实际问题的能力。

关键词:

信息论;研究生教学;教学改革

《信息论》是本校电子科学与工程学院电路与系统专业硕士研究生(学术型)的专业必修理论课程,也是一般高等院校通信与信息工程、计算机科学与技术、电子科学与技术等一级学科下相关专业的本科生、研究生的主修专业课程[1-5]。通过对本课程的学习,使学生掌握有关信息论的基本理论以及编码的理论、实现原理和具体应用。虽然人们在本科生的《信息论》教学改革方面做了一定的工作[6-9],但其改革内容不符合电路与系统学科特点,更不符合研究生教学需要。笔者结合本学院学生基础、学校政策及本人近年来的教学实践,在学校研究生教学改革项目支持下,开展了本门课程的教学改革与实践。

一、课程特点

1.需要坚实的数学基础。该课程存在大量的公式推导与证明,与概率论、随机过程、近世代数等数学知识密切相关。若无扎实的数学基础,学生无法看懂推导过程,更无法从根本上理解信息论的数学意义及物理含义。

2.学生学习兴趣不高。由于电子专业硕士研究生的数学基础仅限于本科生学过的概率论与随机过程,对近世代数的了解几乎为零。学生面对繁杂、抽象的理论问题时,无法宏观地理解和把握,致使学生无法提高学习兴趣。

3.课程联系实际困难。课程抽象概念多、定理证明多,与实际应用有一定距离,且与其他课程联系较少。多数学生在学习过程中觉得内容枯燥、难度大,而且与将来就业方向联系较少。鉴于以上问题,为了激发学生学习的积极性和主动性,促进学生更好地掌握本门课程,笔者从课程的教学内容、教学方法与考核方式三方面入手,提出了教学改革的相应措施。

二、教学内容改革———三个强化

1.强化离散信息论的基础作用。信息论的主要内容是信源概念、信息度量方式及三个香农基本定理,相应的内容又分别面向连续信源与离散信源。二者的区别在于,连续信源/信道及相应的定理一般需要结合随机过程知识来学习,而离散信源/信道及相应的定理是建立在概率论、线性代数的基础上。从推导过程和公式形式来看,二者具有内在的统一性。这可从连续信源信息熵的推导过程看出:将连续信源进行离散化,变为离散信源后再利用离散信源信息熵的求解公式并求解极限得到。因此笔者重点强化了对离散信源、离散信道及其容量、无失真信源编码定理、无失真的信源编码的内容。这对学生进一步掌握连续信源、信道及相关问题奠定了基础。

2.强化信息论的现实物理意义。笔者从课程本源出发,让学生理解公式或定理蕴含的深刻物理含义,使理论结果可视化,概念直观化。例如,在讲解离散信源的极值性定理时,可提炼出如下物理含义:第一层含义是,当信源各取值的概率相等时,人们对信源取何值的不确定性最大,由于各信源服从等概率分布,信源的平均不确定性即为各事件的不确定性,因此信息熵也越大;第二层含义是,对于具有不同数量事件的两个信源,若二者同时满足等概率分布,则预测数量较多事件的信源的难度较大,因此该信源的信息熵也较大。

3.强化教学案例的实用性。在本次教学改革中,共自创或搜集教学案例11例,每个教学案例都与教材内容有关,将晦涩难懂的理论内容变为鲜活的例子,让学生去感受和体会案例中蕴含的问题,从而为更好地理解教学内容奠定基础。以引入的六个视频教学案例为例,该案例以美国国家航天局发射的新火星探测器为背景,讲解了信息如何传播、如何加密等问题。通过这部分教学案例的学习,学生深刻地认识到了信息论的价值与实践意义。

三、教学方法改革———三个联系

1.联系计算机仿真。笔者鼓励学生应用MATLAB中SIMULINK工具设计具体的通信系统模型,如基于开关键控或正交频分复用的射频通信系统。让学生看到实验现象的同时,更加深刻地体会信息的传递过程,了解信源、信宿、信道的构成,学习信源编码、信道编码、加密、信道译码、信源译码等信息处理过程,加强学生对信道容量、信息传输速率、误码率等概念的把握。笔者督促学生将上述问题作为课程设计的作业,使其结合信息论所学的知识,提炼出相关问题、建立模型,加以认真分析解决;再将提炼问题和解决问题的过程以及结论进行汇总,撰写成研究报告。这既巩固了学生的基础知识,又锻炼了学生运用计算机进行建模和仿真的能力。

2.联系工程实际。由于研究生日常的工作大多在实验室从事工程项目的研究或开发工作,若能将这些工作与信息论知识联系到一起,无论对信息论的学习还是科研都将起到促进作用。笔者首先开展了调查研究工作,统计了各个学生从事科研项目的情况,然后让学生结合课程知识,从信息获取、处理、传输、存储的角度去解释。例如,在讲述信息不增性原理时,笔者结合温度传感器的设计问题:将大气环境温度看成连续信源,将传感器系统看作信道,将显示终端看作信宿。因此,设计该系统的关键问题———如何设计传感器才能最大化地得到信息而不丢失信息?学生带着这个问题去思考,就可以真正地体会传感器中信息传递过程。

3.联系科学前沿。为鼓励学生大胆创新,笔者尝试将科学前沿技术引入信息论课程,例如,室内、外可见光通信技术。笔者结合自己近年来从事可见光通信研究的经历,向学生讲授了可见光通信系统的设计、研制、实验测试等一系列过程;然后结合信息论课程所学的知识,将其与研制的可见光通信系统联系在一起。笔者也鼓励学生探索与信息论相关的科学前沿问题,开展课堂讨论与课下交流。让学生查询保密学、光学信息论等方面的文献,详细阅读并做总结。然后,切实提出自己的想法,再予以验证,从而将学生所学知识真正地和科学前沿结合在一起。

四、考核方式改革———三个引入

该课程原来采取任课教师命题、纸质考试方式。其弊端在于,教师命题规律和出题形式规定,学生只要做一遍往年考试题目,就可得到较高的分数。虽然这种考核形式能在一定程度上反映出学生的知识水平,但却无法体现其学术水平和实践能力。为此,笔者在考核方式上做了三个引入的变化。

1.引入随堂能力测验。随堂能力测验是考查学生运用所学信息论知识分析解决实际问题的能力。由于采取随堂考试形式,因此,对学生课堂学习效率和前期积累提出了较高的要求。例如,在学习香农公式时,笔者考查了学生运用香农公式计算射频通信所需带宽的问题;在学习无失真的信源编码时,笔者考查了应用霍夫曼编码对离散信源进行编码的能力。该测验在总成绩中占10%的比例,从而激励学生很好地利用课堂来学习知识。

2.引入学术论文加分。提升学术水平是研究生教学的任务之一。笔者针对信息论教学中每章的重点问题,均设置开放性的论题供学生选择,让其查阅文献、资料,进行认真的设计、理论推导、计算机仿真、现场实验,并将其总结成文,然后以学术论文的形式提交。笔者根据学生在文中阐述的观点、论证的严密性、结论的正确性与普遍性等方面予以考核。学术论文在总成绩中占20%的比例,是本次教学改革的重点。

3.引入上机考试。往年的信息论期末考试中,题目是由任课老师自行拟定。由于种种原因,考试题目重复率高、知识点考查单一,这给学生突击考试并取得好成绩提供了可能。为此,笔者将期末教师出题测试改为上机随机抽题考试。笔者建立了试题库,题型包括:客观题(选择、判断)、主观题(概念、简答、计算、综合)。在本校计算机学院协助下,建成了信息论上机考试系统,学生登陆系统后,按照教师设定的题目数量和难度,随机抽取试题。上机考试的在总成绩中占据70%的比例,也是这次教学改革的重点。该考核方式经试运行后,效果良好。

五、结语

笔者根据电路与系统专业信息论课程的特点以及目前教学中存在的问题,从教学内容、教学方法及考核方式三个方面提出了相应的改革措施。通过本次的教学实践证明,采取的这些措施有效地改善了课程教学效果,提高了学生的学习积极性、知识掌握程度和应用知识解决实际问题的能力。

参考文献:

[1]陈运.信息论与编码[M].北京:电子工业出版社,2007.

[2]叶中行.信息论基础[M].北京:高等教育出版社,2002.

[3]李梅.信息论基础教程(2版)[M].北京:北京邮电大学出版社,2003.

[4]曹雪虹.信息论与编码[M].北京:清华大学出版社,2003.

[5]吴伟陵.信息处理与编码[M].北京:人民邮电出版社,2005.

[6]李迎春,等《.信息论与编码》教学改革探讨[J].科技信息,2010,(20):18-20.

[7]邓家先.信息论与编码课程教学改革探讨[J].电气电子教学学报,2007,29(2):111-114.

[8]高宏峰,彭勃.信息论基础课程教学改革探究[J].洛阳师范学院学报,2010,29(2):160-161.

[9]刘莺,胡剑炜.信息论基础课程教学优化改革的探讨[J].科技信息,2011,(35):112.

科技信息论文范文第3篇

关键词:信息论;实验课;研究型教学

作者简介:尚绪凤(1981-),女,山东莱芜人,中国计量学院理学院数学系,副教授。(浙江 杭州 310018)

基金项目:本文系中国计量学院“信息论基础”校重点课程建设项目的研究成果。

中图分类号:G642.0 文献标识码:A 文章编号:1007-0079(2014)05-0148-02

信息论、错误控制编码和密码学是现在数字通信系统中的三大支柱。信息论基础是应用概率论、随机过程和近世代数等方法研究信息的存储、传输和处理中一般规律的学科,主要解决通信过程中信息传输的有效性、可靠性与安全性的问题,是信息科学和通信科学领域中的一门基础理论。[1,2]自从“信息论”课程在信息及计算科学专业开设以来,笔者一直在研究和探索适合本专业学生学习的教学模式,经过多年的教学探索经验,在该课程的教学中,笔者发现采用分组讨论、学生组与组之间进行实验报告互评、分组研究讨论、通过图书馆及网络资源查找并研读相关论文以及学生做研读论文的研讨报告等新的教学方法和教学手段,在实际的教学过程中收到了比较满意的效果,也得到了学生比较认可的评价。

研究型教学就是要鼓励学生“在学习中研究,在研究中学习”。在教学中笔者鼓励学生除了学习选用教材上的知识外,还要借阅本课程相关的参考书,作为辅助学习资料,并用一些前沿科学问题,引导学生去探究和研究书本上没有的东西,并通过图书馆和网络上的相关课程网站及文献检索平台,增加获取知识的渠道,鼓励和引导学生学会用书本上的知识解决相关的科研问题。为此,笔者在“信息论”课程的教学过程中给学生提供基于课程教学内容而又略高于课程教学内容的科学研究问题以及相关文献资料和获取文献资料的途径,开拓学生的学习视野和途径,满足不同层次学生的需要,培养学生搜集科研论文资料以及阅读文献的能力,逐步使学生养成科学研究的素养。对于研究型教学的范畴,教育专家们 对其内涵和本质的看法基本上是一致的,大体可以归纳为:以课程内容和学生的知识经验为基础,在教学过程中选择恰当的科学问题为载体,以学生为中心创设情境,引导学生充分参与,主动探究,使学生能够自主地发现问题、研究问题和解决问题,并从中体验“搜集资料方案设计方案研讨实验验证撰写论文”完整的科学研究过程,进而学习科学知识,掌握研究方法,并培养其创新能力和探究精神。因此,研究型教学是一种学习和研究融为一体的教学体系,就是通过教师充分备课,提供基于课程教学内容又略高于教学内容的科研问题,进行合理的设计与引导,使学生在学习中主动发现和探索知识,提供给学生参与研究工作和接触科研问题的机会,从而在研究中学习,在学习中研究,逐步培养学生应用学科知识与研究方法,为进一步的研究生科研工作做准备。

课题组成员在多年的大学生数学建模竞赛指导过程中,根据已有的指导经验,发现精干的指导团队、规范的组织体系、严谨的教学计划、新颖的教学模式、先进的教学手段、灵活的教学方法、交叉的知识补充等使得数学建模活动在中国计量学院(以下简称“我校”)倍受学生青睐,每年有数以千计的学子从中受益。只要正确引导学生学习和探究问题,对于一些科学前沿科研问题,他们可以通过已有知识,并查阅相关参考文献,对科研问题会有创新性的想法和思路。只要他们发挥团队的合作精神,他们可以发挥学习的主动性和积极性,并会有突破性的成绩。鉴于在数学建模竞赛指导中的经验,课题组成员把竞赛指导中的部分经验方法应用到信息论基础课程的课堂教学中,在过去一年的实践中,已经收到了不错教学效果,并有应用信息论知识相关的科研论文公开发表在学术期刊上。

一、“信息论”课程新的教学模式

1.理论教学和实验教学相结合,以最新科研成果做引导

坚持以“理论和实验课相结合,最新科研成果作为教学过程中知识学习的主线”,引导学生探知探究问题,发挥学习的积极性和主动性,提高学生分析和解决问题的综合能力。研究型教学需要给学生提供活跃的课堂学术氛围,在教学过程中启发、引导学生主动思考,为此,在教学中笔者采用互动式讨论的教学方法,特别是以网络的BB平台作为创新实践平台,加强学生讨论组之间的互动和问题讨论。特别是要善于激发学生求知欲使他们在课堂上积极发言参与教学和讨论,激发学生探究问题的兴趣。

在教学过程中,优化拓展教学内容,保持教学内容先进性,开始每个章节的教学之前,课题组成员首先把与本章节相关的科研问题在BB平台的网络课程平台教学中,让学生先通过这些问题了解主要的知识重点,并通过图书馆和文献查阅,了解相关知识,并且在课堂的教学过程中,在分组讨论的时候,学生可以根据自己查阅的资料发表观点,教师补充纠正部分问题,学生发言的情况将作为期考考核的一部分。授课过程中注重跟踪信息处理技术最新前沿问题,通过引入信息论及编码理论知识在文本识别、语音识别和图像处理等方面的成功应用,强调理论与实际应用问题之间的关系,让学生体会学有所用的过程。通过对实际应用问题的研究和探讨加深他们对理论知识的理解,学以致用。

2.提高实践教学的效果和效率,改革实验课教学模式

由于受到教学计划设置的影响,一般一次实验课大约要2个自然班级一块上课,由于学生人数比较多,教师在实验课的教学过程中很难照顾到全部学生。针对现实的情况,目前大多数学生都拥有计算机,并且学校图书馆也有机房提供给学生使用,所以实验课的教学过程中,笔者会在每次实验课之前,先通过网络课程网站实验指导书,学生在实验课开始前根据每次实验的指导书完成实验内容,要求每个学生撰写实验报告,对于在实验过程中的问题通过网络课程平台发问,教师或者学有余力的学生都可以在平台上对问题进行解答,供学生共享,并且简单的实验内容让学生之间互评,这样更能调动学生学习的积极性和参与性。实验课时对于一些还没有解答的问题,再在课堂上统一解答。并把每次做得较优的几个同学的实验报告上传到网络课程平台供全体同学参考和学习,对于作为范本的学生在期末考核中实行额外加分。由于信息论的实验内容大多都是关于编码的实验,需要学生掌握Matlab以及C语言的基本操作代码,在实验课堂中学生们可以进行讨论和更进一步的学习,使得学生们的动手能力得到较大提高,对于学生学过的“数学软件与数学实验”以及“C语言”课程也是直接地应用,部分实验课程的相关研究内容也可以作为下学期毕业论文设计的后续研究问题。实验报告的撰写过程,培养了学生的写作能力和综合应用能力。

二、优化教学内容,把科研问题引入到教学过程中,增加课堂的学术研究氛围

自从2003年开设信息论这门课程以来,笔者先后采用过以下三本教材《信息论——基础理论与应用》、[4]《信息论基础与应用》[5]和《信息论、编码与密码学》,[6]由笔者所教授的学生为信息与计算科学专业的学生,所有最终笔者选择采用《信息论、编码与密码学》这本教材。该教材更侧重于实践应用环节,更适合调动学生的实际动手能力以及编码的编程能力,弱化编码理论的繁琐证明。

针对自信息、互信息、信息熵、平均互信息及信道容量等是“信息论”课程中较为重要的几个关键概念和知识,为了加深学生对这些概念的理解和掌握,在教学过程中,笔者选择了一些基于这些知识却能被本科生所能理解的科研题目,提供相关文献资料和获取文献资料的途径等学术资料,给出“自信息量在文本处理中的应用”、“Shannon-Fano-Elias编码理论的改进方法及应用”、“图像处理中无损压缩算法研究”、“基于预测编码的图像压缩算法研究”等题目。按照数学建模比赛的模式,以三人作为一组,学生自由组队,自选其中之一题目进行相关的讨论和探究,学生通过查阅资料、定期汇报交流等环节完成任务,提交研读报告或者学术论文。最终使基础不同的学员都能够提升学习能力,在学习的过程中享受学习和合作的乐趣,学有余力的同学可以把有创新性观点的科研问题最后撰写成科研在学术期刊上。一年的教学实践之后,已经有两篇论文公开发表在国内外期刊上,分别是《A NEAR-LOSSLESS PREDICTIVE COMPRESSION ENCODING BASED ON HEXAGONAL SAMPLING》发表在2013 International Conference on Machine Learning and Cybernetics 和《基于自信息的犯罪网络情报分析与研究》发表在2013年的科技信息期刊上。

三、利用现代网络技术,提高增加教师和学生的互动

课堂教学上,采用板书与多媒体课件并重的形式,利用网络资源,比如:网络课程平台,提供学生访问国内外著名大学的相关课程的网站,通过不同的途径对本课程进行学习,拓展学生的学习视野和途径,鼓励同学了解信息论知识发展的最新成果。

实验课程教学中,网络课程平台上设置主题讨论区,设置相关问题,例如:日常生活中哪些问题可以用信息量来刻画;什么是信息,能否举例说明;信息能否度量,如何度量等,通过这些问题的解答可以是学生更加深刻的理解信息的概念,以便于后续章节的学习,让学生把相关的概念与现实生活中的生活知识联系在一起,便于把抽象的问题具体话,学生掌握这些概念也不会太过于枯燥。同时设置答疑区,可以方便学生有问题可以及时提问,另外其他学生也可以看到相应的问题,教师统一做回复,这样可以更加有效地增加教师和学生的互动,及时地解答学生的疑问。

四、提升教学理念,优化考核评价机制

由于新的教学模式,理论与实验并重,所以笔者采用新的考核方式,期末闭卷考试(60%)+课堂讨论表现(10%)+实验报告(15%)+专题研讨(15%)+额外加分(10%)。对于有创新观点的学生可以额外加分,可以很好地调动学习过程中学生的积极性。通过期末闭卷考试的卷面成绩可以考核学生对于课本知识的掌握情况,实验报告的成绩体现了学生的实际动手能力及知识的应用能力,并且也很好地反映学生熟练应用软件的程度。

五、总结

在研究型教育理念的指导下对“信息论”课程重新进行整体设计,优化教学内容,采用有效的教学方法,使学生的积极性和主动性得到全面发展。在过去一年的教学实践中,笔者发现不同层次的学生对研究型教学模式的接受能力存在差异,因此如何针对不同层次学生开展研究性教学将是下一教学周期课题组成员的研究重点。总之,在教学过程中,只有不断探索和突破常规教学方法,积累有用的教学经验,才能培养出具备实践能力和创新思想的专业技术人才。今后笔者将在教学过程中,不断的发现问题,总结经验,不断创新,力争把信息论课程的教学和改革做得更有成效。

参考文献:

[1]陈运.信息论与编码[M].北京:电子工业出版社,2007.

[2]D CMacKay.Information Theory,Inference,and Learning Algorithms[M]. Cambridge :Cambridge University Press,2000.

[3]李春,邹逢兴,周宗潭,等.《计算机硬件技术基础》精品课程研究型教学探索与实践[J].高等教育研究学报,2013,(1):26-29.

[4]傅祖芸.信息论——基础理论与应用[M].北京:电子工业出版社,

2001.

[5]沈世镒,吴忠华.信息论基础与应用[M].北京:高等教育出版社,2004.

科技信息论文范文第4篇

[关键词]学术论文 复制检测 抄袭剽窃检测 统计语言模型 文本相似度算法

[分类号]TP391.1

自从方舟子的“新语丝”使原本长期存在于学术界的学术不端暴露出来之后,学术论文抄袭剽窃引起社会的广泛关注。抄袭剽窃的表现形式多种多样:有些只是在语言文字的表达形式上做手脚,换成同义词或颠倒语句的表达顺序,在文章框架、主要观点和主要论据上却没有大的变化;有些直接大段地“引用”别人的内容;有些综合运用多种手段,将多篇别人的文章拼凑而成自己的;有些“学术高手”直接拿国外的论文翻译成中文发表,等等。抄袭和剽窃“手段”的越来越“高明”,给抄袭剽窃检测带来很大困难。抄袭检测又叫复制检测、剽窃检测或副本检测,根据检测对象性质不同可分为图像、声音和文本复制检测。学术论文抄袭检测是文本复制检测的一种,归根到底是判断两篇学术论文的相似程度。“召回率”和“精准率”是判断检测算法好坏的两个重要指标。为了进一步提高学术论文复制检测判断的准确率,针对学术论文的文档相似度算法的改进和创新研究变得尤为重要。

1 国内外研究现状及存在的问题

1.1 国外研究现状

国外具有代表性的文档相似度算法主要有以下几种:①Manber提出一个sif工具,其“近似指纹”是用基于字符串匹配的方法来度量文件之间的相似性;②Brin等在“数字图书馆”工程中首次提出文本复制检测机制COPS(copy protection system)系统与相应算法,奠定了论文抄袭检测系统的基础;③Garcia-Molin提出SCAM(Stanford copy analysis method)原型,改进了COPS系统,用于发现知识产权冲突。他使用基于词频统计的方法来度量文本相似性,后来把检测范围从单个注册数据库扩展到分布式数据库上以及在Web上探测文本复制的方法;④贝尔实验室的Heintze开发了KOALA系统用于剽窃检测,采用与sif基本相同的算法;⑤si和Leong等人建立的CHEC系统首次把文档结构信息引入到文本相似性度量中;⑥Stein提出一种方法,这种方法能产生一种“指纹”,在某种程度上能有效防止修改;⑦MeyerzuEissen等提出通过根据写作风格上的变化来分析单篇文档,从而决定是否有潜在抄袭;⑧美国学校首先引入Tumitin侦探剽窃数据库,用于防止论文抄袭,此外还有其他类似软件系统用于进行文档相似度分析。当然不同的检测系统其相似度算法的精度也不尽相同。

1.2 国内研究现状

国内关于论文抄袭剽窃检测方面已有一些研究:①张斯通过对中文文本进行自动分词,然后计算它们的相似度,从而判别文本是否抄袭,其对应装置包括:样本输入装置、样本数据库、自动分句分词装置、分词数据库、预处理装置、特征词数据库、相似判别装置、判别结果输出装置和控制处理装置等。②鲍军鹏通过文本的结构信息和语义信息提取文本特征,是通过运用文本剽窃判定模块中设定的探针法,估计待检测文本特征和特征库中的文本特征的最大共同语义,并给出文本雷同度量,从而判别文本是否抄袭。③沈阳是通过先找到存储空间内的格式遗留,再将这些遗留格式附近文档的关键词或/和句子或/和段落与文献库中的文献内容进行比较,从而减少被检测文档的数据量,加快了反剽窃或转载文档检测速度。④张履平通过对已植入水印的文章进行特征撷取,根据所取得的词汇输入搜寻引擎以搜寻相关可疑文章;根据与原文比对结果取得的句子进行水印解析;将所取得的水印信息与原来的水印比对,从而判断是否为剽窃。⑤金博等则对基于篇章结构相似度的复制检测算法有一些研究。

1.3 存在的问题

事实上,由于剽窃形式的多样性和隐蔽性、语法和句法的复杂性等,目前主要采用的“数字指纹”和词频统计两大类抄袭识别技术已经不能满足实际的剽窃检测需求,会造成很多漏检和误检,其“召回率”和“精准率”都有待提高。归根到底是因为其检索模型有待突破,算法亟待改进或需创造全新的算法来针对学术论文抄袭剽窃检测的实际。如何把握并充分利用学术论文的结构和语言特征,提供具有针对性的检索模型和相似度算法及其实现系统,对能否在异构的分布式学术论文资源系统中,对抄袭剽窃检测进行更精确的判断至关重要。

2 学术论文复制检测研究的新思路

针对以上问题,笔者提出以下学术论文复制检测研究的新思路:①建立有针对性的学术论文语料库;②通过对语料库的深层加工、统计和学习,建立统计语言模型;③充分利用学术论文著录项目自身的特点,通过将文档结构化,赋予元数据项加权系数,运用卷积计算学术论文的相似度;④利用支持网络语言的JAVA编程实现相似度算法;⑤通过将待检测论文与数据库中已有文献对比,计算其相似度,当相似度超过某一阈值时,则判断该论文有抄袭的可能,如图1所示:

3 具体方法及步骤

3.1 建立某一学科专业的学术论文语料库

新一代的兆亿级的大规模语料库可以作为语言模型的训练和测试手段,用以评价一个语言模型的质量。本文建立的语料库中存放的是在学术论文语言的实际使用中真实出现过的学术论文语言材料;是以电子计算机为载体,承载学术资源语言知识的基础资源;通过对真实语料进行分析和处理等加工,使之成为本文的学术论文抄袭检测模型和算法的训练与测试手段。

利用丰富的学术资源数据库,如Dialog、SCI、EI、INSPE、IEEE、Science Direct、EBSCO、PQDD、SPRINGERLINK、KLUWER、Science online、Medline、CNKI、中文科技期刊全文数据库、万方数据科技信息子系统、万方数据商业信息子系统、七国两组织的专利数据库、国内外专利数据库等异构的分布资源,通过信息检索,从某一学科专业着手,构建某一学科专业领域的学术论文语料库。

3.2 以信息论为工具,创建统计语言模型用于学术论文检索

数学是解决信息检索和自然语言处理的最好工具。其实早在几十年前,数学家兼信息论专家香农(Claude Shannon)就提出了用数学方法处理自然语言的想法。语音和语言处理大师贾里尼克(Fred Je-

linek)首先成功利用数学方法解决了自然语言处理问题。统计语言模型(即基于统计的语言模型)通常是概率模型,计算机借助于统计语言模型的概率参数,可以估计出自然语言中每个句子出现的可能性,而不是简单地判断该句子是否符合文法。统计语言模型以概率颁布的形式描述了任意语句(字符串)s属于某种语言集合的可能性,需要对任意的语句s都给出一个概率值,例如:P(他/认真/学习)=0.02。本文充分利用学术论文不同于报纸新闻论文或其他类型文档的语言特点,以建立的学术论文语料为训练和测试基础,提出新的基于学术论文的统计语言模型作为针对学术论文抄袭剽窃检测算法的检索语言模型。具体做法为:以信息论为工具,把握学术论文的语言特点,通过对以上所建立的学科专业语料库进行深层加工、统计和学习,获取大规模真实学术论文语料中的语言知识,建立基于学术论文语料库的统计语言模型;通过实验,与其他文本信息检索模型进行比较,论证其有效性。

3.3 利用学术论文中描述资源对象语义信息的元数据结构,计算文档相似度

充分利用正式出版的学术论文的结构特点,根据学术论文中标引出的K个描述资源对象语义信息的元数据(Di,i=1,2…k),将学术论文结构化;然后利用已有的基于学术论文语料库的统计语言模型,将待比较的论文的各相同元数据Di(i=1,2…k)部分进行比对得相似度si,再根据元数据对论文的重要程度给定第i个元数据项相似度权函数wi;则整篇学术论文总体的相似度为Sd=∑Wi*Si。

具体算法举例如下:

将待检测的学术论文的元数据如题名Til、关键词Kyl、摘要Abl、正文.Tel、参考文献Rel等元数据字段抽取出来,与语料库中已有论文的相应元数据字段内容题名Ti2、关键词Ky2、摘要Ab2、正文Tx2、参考文献Re2进行相似度计算。计算时,在篇名字段前给以0.25,0.4,0.15,0.1和0.1的加权系数。建立的统计语言模型计算待测论文和语料库中已出版的论文j同一元数据字段的内容相似程度,记为:Sim_Tij,sim―Kyj,Sim_Abj,Sire Tej,Sim_Rej,卷积后得整篇论文与语料库中某篇论文j的相似程度值计算公式为:Sinai―larity_paper_j=0.25×Sim_Tij+0.4×Sim_Kyj+0.15×Sim_Abj+0.1×Sim_Txj+0.1×Sim_Rej;再计算与待检测论文最相似的那个最大相似度Max_Similarity=Max{Simflarity_paper_j};如果Max_Similarity大于设定的阀值1(如40%),则判断为疑似抄袭,这样的论文需要审稿专家仔细认真审理,如果Max_Similarity大于设定的阀值2(比设定的阀值1大,如80%),这样的论文极有可能存在抄袭,需要审稿专家特别注意。在计算相似度值后,计算机系统记录下相似度高于设定阀值的抄袭和被抄袭的学术论文来源、相似度值、及其各元数据项信息(包括作者信息)。以上各元数据项相似度计算过程中,加权系数可以根据需要做适当调整为其他数值,但系数总和为1。

3.4 推广使用

通过对某一学科专业的研究,进一步拓展到其他学科领域,从而最终实现在异构的分布式学术论文资源系统中,对各个学科领域的学术论文抄袭剽窃进行跨平台检测。

4 研究展望及难点、解决办法

今后的研究主要是将以上思想和方法步骤通过实验进行论证。通过JAVA编程实现算法,同时能实现对于空间地址分布和数据异构的学术资源进行跨平台的复制检测。使用支持语言模型的Lemur工具箱,在标准的TREC文档集上做测试试验,并对算法的召回率和精准率作出量化;选择与Turnitin侦探剽窃系统进行实验对比,评价该基于学术论文语料库的统计语言模型及算法。

科技信息论文范文第5篇

[关键词]载文量 信息密度 信息量 期刊评价

[中图分类号]G23[文献标识码]A

载文量是指所要统计的学术期刊当年发表的全部论文总量。载文量主要表征学术期刊在论文刊发数量方面的贡献,与期刊学术质量没有必然的联系。载文量作为衡量学术期刊吸收和传递信息能力的主要指标,是各评价体系所采用的基本指标之一,也是计算相关相对定量指标的首要基本数据。

一、载文量与学术贡献量的关系

学术期刊是科学知识的主要载体,其主要作用是为读者提供所需要的有价值的信息资料。一般来说,一本刊物的载文量越多,说明该期刊对外部信息资源的吸附能力越强,为读者提供的信息量也会越大。但仅以载文量作为评价期刊的标准,其结果也仅是文献数量的胜出。信息的有效性还需要加上刊发文献的学术水平来综合考量。为此,我们可以建立一个数学模型来解释某期刊载文量、学术水平和学术贡献量:

某期刊当年的学术贡献量=某期刊的载文量×某期刊当年刊发论文的平均学术水平

通过这个数学模型我们可以看出:

1. 假设某期刊当年刊发论文的平均学术水平恒定,那么其当年的学术贡献量与载文量成正比关系,与这种理论假设较为接近的是当年发稿的学术水平满足要求的一些学术期刊。在这样的条件下,增加载文量的确可以获得相应的学术贡献量的增加,但载文量增加的范围是有限的,因为不可能有无穷尽的同水平的学术论文存在。

2. 假设某期刊载文量恒定,那么其当年的学术贡献量与当年刊发论文的平均学术水平成正比关系。大部分学术期刊的载文量还是基本保持在一定的范围内,可以很多年不发生变化,那么其刊发论文的平均学术水平与学术贡献量也就密切相关了。每一篇高出刊物平均学术水平的论文会为刊物的学术贡献量做正向贡献,反之则做负向贡献。

3. 当某期刊的载文量和刊发论文的平均学术水平都发生变化时,如果其中一个量的增加或减少,导致学术贡献量也随之增加或减少,说明另一个量的变化不足以抵消前者变化带来的影响。同样,如果其中一个量增加或减少,反而导致学术贡献量随之减少或增加,说明另一个量的变化足以抵消前者变化所带来的影响。当然还有一种特殊情况就是,两个量都发生了变化,但学术贡献量还保持不变,这说明这两个量的变化恰好互相抵消。

二、载文量与学术质量评价指标的关系

我们还需要讨论一下载文量和即年指标、影响因子等期刊学术质量指标的关系。由于刊物的来稿学术水平有高有低,而且一般都是学术水平较高的论文数量少,学术水平平平或较低的论文数量多,所以载文量的增加或减少一般会连带影响学术质量指标相应发生变化。载文量是一个可以人为控制的变量,当然,由载文量的变化所带来的影响很可能不会立刻显现,应该有一定程度的延滞效应;学术质量指标也不能够完全反映刊物的学术水平。为便于讨论,我们假设载文量的影响没有延滞效应,学术质量指标也完全可以表征刊物的学术水平。这样,基于载文量的变化可能会出现以下几种情况:

1. 刊物载文量的增加或减少,基本上没有引起刊物的学术质量指标发生变化。这种情况其实就是上文讨论学术贡献量模型时的第一种假设类型。如图1所示,假设某刊物的选稿标准同以前一样,载文量如果在A以内进行调整的话,其学术质量指标可以基本保持不变。如J期刊载文量2008年为398篇,2009年为483篇,2010年为326篇;复合即年指标2009年为0.139,2010年为0.107;复合影响因子2010年为0.885,2011年为0.851[1]。

2. 载文量的增加或减少,随之引起了刊物学术质量指标的增加或减少。这种情况在实际编辑出版中其实很难出现,一般来说,一家刊物的来稿质量、学术水平和编辑水平很少会发生突变,如果出现这样的情况,很可能是因为由于载文量的变化影响了刊物在作者群体里的美誉度和作者的忠诚度、投稿信心等,带来了来稿质量的变化;也会影响其他研究者对该刊物的关注度,从而导致引文率的变化。比如某刊物载文量增加后,吸引了更高层次作者的来稿和研究者对该刊物的关注度,从而也提高了刊物的学术指标。如X期刊载文量2008年为360篇,2009年为396篇,2010年为617篇;复合即年指标2009年为0.075,2010年为0.105;复合影响因子2010年为0.781,2011年为0.851[2]。也可能是因为刊物的编辑工作指导思想作出了重大调整,比如刊物由以前的社会效益为主转向了以经济效益为主,只选择刊发那些愿意交费的学术水平低的论文,即使减少了载文量,也会导致学术质量指标的降低。

3. 载文量的增加或减少,带来了学术质量指标的减少或增加。这样的变化是较常出现也是很好理解的,如图2中的某刊物载文量的增加会必然带来学术质量指标的减少,图1的某刊物载文量超出A点后,也会有同样的结果。如T期刊载文量2008年为1 192篇,2009年为1 099篇,2010年为1 320篇;复合即年指标2009年为0.013,2010年为0.008;复合影响因子2010年为0.084,2011年为0.070[2]。反过来说,在编辑水平不变的情况下减少载文量,由于一般会优先刊发本刊物最高水平的来稿,会使影响因子得到显著提升。由于影响因子在各家学术期刊评价体系中占有重要地位,减少载文量实际上已经成为尽快提升刊物影响因子的利器。如S期刊载文量2008年为125篇,2009年为110篇,2010年为72篇;复合即年指标2009年为0.082,2010年为0.045;复合影响因子2010年为0.517,2011年为0.697[2]。对于采用这种办法来提高影响因子,一方面我们肯定刊物为了提升学术质量的出发点是可以理解的,但是从另一方面来说,如果只重视影响因子等期刊学术质量指标,忽视载文量,就会陷入“只重质量,不重数量;只看水平,不看规模”的误区。从宏观上讲,这会影响整体学术研究生态,会有很多本来可以发表也值得发表的学术论文被阻挡在刊发大门之外,也会影响整个学术期刊作为平台的利用率。

由上可见,载文量的确定看似简单,其实包含着很大的学问。当然,在具体的载文量设定考虑中,不仅应该考虑以上所列举的因素,还应该依据主办单位的主观意愿和办刊经费、编辑力量等办刊条件,以及受众接受程度等来综合考量。

三、信息密度和信息量

尽管对于特定期刊的载文量与其学术贡献量的关系很难找出一个可以量化的指标来衡量,人们在这方面还是有过一些尝试。1994年8月,原国家科委颁布的五大类科技期刊质量要求及评估标准中专门列出了“信息密度”一项,计算指标是以每个印张所载结构、概念完整的文章数量计算,用“信息量”表示[3]。出台这个指标的出发点是希望借此提高刊物的刊发效率,也可以理解为提高刊物的学术贡献量,但是以单位纸张刊发的文章篇数作为衡量期刊学术贡献量的前提是,每一篇论文不论字体大小、文字长短、图表多少、印刷版式以及所属学科,其学术水平都是一样的,这显然是不符合情理的。不仅如此,我们知道,不论“信息密度”还是“信息量”都是抽象概念,可以通过定性分析来比较,但不可能通过定量分析来计量。把这样定义的“信息密度”和“信息量”用作定量评价指标,其实是使用承载信息的文字符号来简单地衡量抽象信息量的做法,即使运用在对科普期刊的评价也是不合适的,不科学的。

信息论奠基人香农(C. E. Shannon)认为信源输出的消息是随机的,接受者在接受到消息后,解除了接受者对信源所存在的疑义(不定度)就是在通信中所要传送的信息量[4]。如果我们借用信息论中的“信息量”概念来重新定义学术期刊评价中的“信息量”,就可以理解为,特定读者从阅读一本学术期刊中获得了多少对其学术研究有帮助的信息,才是这本学术期刊对该读者所贡献的信息量。单位纸张或别的载体承载的信息量就是“信息密度”。也就是说,对于一本学术期刊来说,不仅仅要考虑刊发文章的数量、学术水平,还要考虑本刊物所面向的读者群整体接受水平的高低。同样一本学术刊物,对于适合接受其刊发文章学术水平的读者群来说是信息量大的,而对于学术接受水平高于或低于其刊发文章学术水平的读者群来说却是信息量小的。由此看来,学术贡献量是一个抽象的绝对量,而信息量是一个抽象的相对量。我们并不能认为那些学术贡献量大的学术期刊信息量就一定大,因为信息量的大小要看接受方的接受程度而定。

通过以上讨论,我们可以看出,“信息密度”和“信息量”不能作为学术期刊评价指标中的定量指标来使用,但是用作定性指标还是非常有意义的。我们可以通过特定期刊刊发文章的总体学术水平与其指向的读者群体需求来加以定性考查,也可以对读者群体基本相同的同一类学术刊物就此进行比较分析。

四、提高信息密度的方法

对于特定学术期刊,读者群体基本固定,通过编辑的努力是可以提高其信息贡献量的[5],这也是上文讨论过的“信息密度”从学术质量评估指标被调整到编辑质量评估指标的主要原因。

1. 防止同水平内容重复

学术论文的同水平内容重复发表,是存在于学术期刊界多年的一个痼疾。同样的理论观点,换个案例、换个角度、换个说法就是一篇新论文,其根本原因是现行的学术评价“只重数量、不重质量”导致的。这种做法不仅会影响学术期刊的信息贡献,而且对其他学术研究者的研究积极性产生消极作用,实际上已经影响了整个学术研究生态。

2. 汰除冗余信息

汰除冗余信息要与各期刊所面向的读者群体阅读水平相适应,这需要编辑对读者群体有整体的认识和把握。冗余信息包括大篇幅引用已发表文献、用读者熟知的知识作为阐发自己论点的前期铺垫、对论证观点没有太多意义的文字和图表等。标注参考文献就是为了让读者深入了解论点阐发依据的,不应再在文中大段引用来占篇幅;在文中以读者已知知识作为铺垫,也许会使文章看起来更有连续性,但在信息量的贡献上没有必要;有些文字和图表看起来好像很有必要,可是去除以后对论点的阐发影响不大,也是可以删去或者简练表达的。

3. 提高版式编排水平

版式的编排一方面要考虑版面的美观,另一方面也要考虑版面的利用率。有些学术刊物为了美观和体现个性,版面上出现大量留白和文后的空余版面。学术期刊的主要作用是传播学术知识,版面的美观固然重要,但为此牺牲刊物的利用效率就有点舍本逐末了,综合考虑两者并以版面利用率为先才是正确的做法。

4. 精炼文字、图表

学术论文的基本要求是言简意赅,当然言简意赅并不代表文字就是枯燥无味的,而是指表达不唆、行文有条理。同样,文字说明、图形、数据表要互相补充,不需要同一内容再次重复体现。

5. 适当选择行距、字距和字号

行距、字距和字号的选择首先要考虑读者的阅读习惯,有的刊物为了提高载文量片面缩小行距、字距和字号,虽然版面的利用率提高了,但刊物的利用率却降低了,因为影响了刊物的可读性。如果读者群体主要是高龄读者,反而需要增加行距、字距和字号。当然在不影响读者阅读的基础上,版面装载文字越多,刊物的利用率越高,对学术研究的贡献也就越大。

注释:

[1] 中国科学文献计量评价研究中心,清华大学图书馆. 中国学术期刊影响因子年报・自然科学与工程技术. 2010年(第8卷),2011年(第9卷),2012年(第10卷). 北京:中国学术期刊(光盘版)电子杂志社,2010,2011,2012.

[2] 中国科学文献计量评价研究中心,清华大学图书馆. 中国学术期刊影响因子年报・人文社会科学. 2010年(第8卷),2011年(第9卷),2012年(第10卷). 北京:中国学术期刊(光盘版)电子杂志社,2010,2011,2012.

[3] 详见国家科委科技信息司、中共中央宣传部出版局、新闻出版署期刊管理司、国家科委1994年8月2日颁布的《五大类科技期刊质量要求及评估标准的通知》。

[4] 李亦农,李梅. 信息论基础教程. 北京:北京邮电大学出版社,2005.

[5] 谭石初,刘继宁,牟庆森. 学术类科技论文中非信息成分的编辑识别. 编辑学报,1998(2):95-97.

[本文系教育部人文社会科学研究青年基金项目“人文社科学术、期刊评价体系研究(项目编号:09YJC870030)的阶段性研究成果。]

科技信息论文范文第6篇

1(略)1.1(略)

以往许多技术人员没有对这种相关性给予应有的重视,或是将其看成枝节问题。例如,专业人员在信息系统设计、设备选择和安装以及咨询系统的发展方面通常只注意具体的技术性问题,而不太注意它们与社会的联系,这方面的问题往往由社会科学家去研究。如今,社会信息学研究已形成了一些有利于改进信息技术的发展和应用的概念,社会背景、工作过程和社会-技术系统是其中的几个比较重要的概念。从理论上,他们对"技术决定论"提出质疑。在战后相当长的一段时期里,技术决定论的思想在西方国家十分流行,并成为一些国家官方和企业意识形态的重要组成部分,主要表现在将信息技术看成社会进一步发展的主要保证,对计算机和通信系统的投资急剧增加。例如到20世纪80年代末,美国的公司对计算机和电信系统的投资几乎相当于其投资总额的一半[2]。许多人坚信这种技术投资可以产生巨大的经济效益。管理者和专业人士也经常从技术角度提出促进计算机化发展战略的建议,例如如何使用更先进的技术,如何建立更有效的信息系统,或者如何用计算机系统代替人的重复劳动等。然而到80年代末一些经济学家注意到,国家的经济统计结果没有显示出生产力呈稳长的态势。一些管理者也发现,大量投资似乎没有使企业的生产力明显提高。这促使人们析其中的原因,并由此形成了不同看法。一些人坚持认为信息和通信技术具有许多传统媒没有的优势,计算机化可以直接和明显地提高生产力,只是目前计算生产力发展的方法不适当,一些因利用信息技术而产生的经济和社会效益--如文书工作的减少--没有统计在内。一些人认为,生产力的普遍提高不可能通过少数人对多样化计算机系统的利用得以实现,对信息技术的投入与实际需要仍相距甚远,因而不能在国家经济统计中形成具有重要意结果,唯一的出路在于进一步加大这方面的投入。另一些人则对计算机化与生产力发展之必然联系提出质疑,认为有越来越多的事实表明,计算机化战略,特别是仅仅依靠技术手段,不一定能产生预期的经济和社会效益。今天尽管不能说人们对技术决定论的信念已经彻底动摇,但是对这种思想的质疑是社会信息学研究得以兴起的重要原因。例如一些坚持"技术决定论"的权威人士认为,"网络可公众获得比以往任何时候更好的信息",而从事社会信息学研究的人士则认为,需要进一步分析"网络能够在什么时间、地点、条件下,出于什么目的和使哪些公众获得更好的信息"。这种将事物的发展置于其背景中进行研究本身说明,社会信息学研究提出了一个发展对信息技术与社会生活相关性认识的重要方面。

1.2美国社会信息学中的组织信息学近年来尽管已有研究结果表明,对信息技术的投入使一些国家和组织的生产力有不同程度的提高,但是也有研究表明,这种发展在公司之间存在较大差异。随着计算机通信网络成为政府、企业和人们日常生活的重要组成部分,如何使这些系统更有效地发挥作用的问引题已经引起更多人的关注。如今,即使是一些计算机科学家和系统设计人员也意识到,仅仅从技术角度进行系统设计,不一定能产生良好的社会效果。例如一些系统在实验中看似很好,然而一在现实环境中,往往由于设计没有适当考虑相关的社会因素,如人们的工作方式、组织形式和不同需求,因而难以达到预期的目的。社会信息学的研究领域在不断扩大。在70-80年代,社会信息学的研究主要集中在组织方面,因为当时的计算机技术应用主要在各种类型的组织中进行,与组织的计算机化有关的各种问题,例如计算机系统对组织结构、组织行为、工作质量,以及组织的集中化或分散化趋势等都受到重视。许多研究试图对这些问题作出回答,这促使一个新的科研究领域--组织信息学的兴起。组织信息学主要研究计算机化信息和通信系统在组织中的发展,包括它们的概念和设计、在组织内的有效实施、系统的维护和使用、组织的评价及其对组织中的人的影响等。近年来随着计算机通信系统进一步向家庭和社会的渗透,尤其是公众可以普遍接入因特网,于是与人们在家工作、交流、娱乐、获取信息和其他一些个人利用信息技术有关的问题日趋增多,这使社会信息学迅速成为一个涉及面十分广的研究领域。如今在美国,组织学已成为社会信息学的一个分支领域[3]。

1.3传播信息学基础上的社会信息学日本较早地研究了新闻学,也较早提出了社会信息学的概念。但是,由于社会信息学理论问题研究受到整个信息科学基础理论严重滞后的限制,在美国的科学主义与实用主义传统的影响下,他们对建立社会信息学知识体系深入不够,在信息科技的社会应用和教学方面有显著的成果。日本东京大学新闻研究所1992改名后的日文名称是"社会情报研究院",英文名称是"InsttituteofSocio-InformationandCommunicationStudies",汉语是"社会信息与传播学研究所"。如该所所长滨田横一说,这次改名,在努力摆脱"新闻无学"的舆论压力方面向前迈出了一大步,它也对日本其他与信息及传播有关的教育产生了积极的影响[4]。第一个作出直接反映的是群马大学。群马大学此后迅速设立了一个社会信息学院,下设三个系,它们是:社会与信息行为系,政策与行政信息系和经济与经营信息系。日本人非常希望它们的新闻传播学研究和八十年代下半叶在美国出现的"信息传播学"相协调。另一个特点是日本人在"信息"之前加了"社会"一词来修饰普通的"信息",这是一个很重要的举措,因为直到九十年代,立足于对一切信息加以研究的普通信息科学,一直没有取得有效的进展,而对各种分支"信息"加以研究,就有可能成为推动信息科学向前发展的一种有效办法[5]。他们感到在理论信息学的发展上难有进展,遂退回到应用信息学的研究轨道,与企业合作研究,于是和美国的社会信息学研究就同出一辙了。

2俄罗斯的社会信息学途径

从总体上看,为了独树一帜地发展,与美国争夺国际领导地位,前苏联和俄罗斯,都从国家的战略利益出发研究社会信息学。他们注重关于社会的信息学与关于自然的信息学之间的区别;他们非常地关注社会信息学的概念、原理和方法论;他们在整个信息科学体系的框架中确立社会信息学的学科地位;他们提出建立人文信息学。所以,俄罗斯的社会信息学研究开始得比较早,研究得比较深入,研究成果纳入了大、中学教学内容,在其国内影响很大,受到联合国科教文组织的重视,在全球范围处于先进行列。

2.1直接服务于国家发展战略的社会信息学1971年列宁格勒国家文化学院信息学教研室索科洛夫和曼科维奇在论文"未来的信息学"中提出社会信息学这一概念。他们提出信息学应该研究的不仅是科技信息,而且还有所有的其它各种社会信息,包括各种社会认知、心理认知和交流。所以他们提出了一个新概念:社会信息学。这意味着把研究领域扩大到全部社会信息。他们认为这一概念能避免专业片面性[6]。但是,А.В.索科洛夫等提出的社会信息学I,并没有引起学界和政府的关注。从总体上看,俄罗斯的社会信息学得以蓬勃发展,主要原因是受到执政党和政府的重视。1988年7月15日,苏共中央政治局在戈尔巴乔夫的领导下通过了《关于制定社会信息化设想》的决议。决议责令苏联科学院等制定《关于社会信息化设想》,即在国民经济的各个领域广泛传播信息技术。专门研究该领域问题的专家卡贝洛夫总结实现信息化的三种草案。但在1989年召开的苏联最高苏维埃会议上,所提出的三个草案都没有通过。在这种背景下,乌尔苏尔院士提出了社会信息学Ⅱ的概念。他《论社会信息学的形成》和《信息化的系统活动观》,指出三个方案的主要问题在于没有明确一致的方法论。他认为,应当形成新的信息学的社会作用理论,"这种被定名为社会信息学的新学科正在形成。"1990年,由苏共中央社会科学院出版社出版了他的专著,《社会信息化:社会信息学引论》。于是,А.Д.乌尔苏尔提出的社会信息学II,引起强烈反映。随后,К.К科林提出社会信息学III,则是一呼百应。他们很快地出版了一大批论文和专著,建立了相关的专业,设置了社会信息学的院系,纳入大学与中等教育的轨道,设置研究生培养计划,受到联合国科教文组织的好评。这样,在俄罗斯,建立和发展社会信息学,主要不是一种学者个人或研究组织的学术行为,而是一种行政行为,是执政党的政府实现与美国争雄的战略目标的重大举措,所以,能够由国家科学院和著名院士牵头,组织浩浩荡荡的"官办"团队,设计与苏联"登月计划"相类似的社会信息学行为,来实现国家的目标和意志。所以,俄罗斯的社会信息学发展的途径具有独特的政治优势和国家资源,它是"国家主导型"的途径。相比之下,日、美、中的社会信息学发展只是在单位和学术组织的水平上进行。

2.2信息科学世界观和方法论对社会信息学研究的指导作用2001年,科林在第6期俄罗斯《科技信息杂志》上发表题为《信息革命与基础信息学》的专论,提出了一个建立全球信息社会、信息科学知识体系、信息科学世界观、信息科学方法论的发展纲领,论述了信息科学的哲学基础以及新的教育哲学。他说:"在众多科学知识领域进行研究的国内外学者近年来出版的研究著作表明,在未来几十年内,可以期待具有普遍科学意义的新的重大成果出现,而这些成果很可能允许形成新的完整的世界科学图景、新的科学世界观以及科学研究的新方法[7]。"科林说,可以把基础信息学的对象领域分为6个基本的部分。第一,理论信息学(信息学的哲学原理和信息的一般理论)研究信息最一般属性和信息相互作用过程在自然界和社会中的规律的科学。第二,技术信息学,研究信息一般规律表现的特点和信息过程在人工建立的技术信息环境中表现的特点。第三,社会信息学,研究信息在社会中,即在完全不同的具有社会本质的信息环境中运动的形式和规律。第四,生物信息学,研究信息过程在生物圈(动物和植物)中表现的一般规律和特点。第五,无生物界信息学,研究信息属性在无生物界的信息环境中的表现特点。第六,能量信息学(энионика),研究所谓能量信息相互作用过程在生物界和无生物界客体之间表现的规律性。上述的信息科学基本结构与中国学者的观点大体相同。在理论信息学作为整个信息科学基础理论的认识上两国的学者完全一致。理论信息学的主体是关于信息的一般理论,其基础的部分是信息的哲学原理。理论信息学的目标是研究自然和社会中信息最一般属性和信息相互作用规律。这样,理论信息学自然是社会信息科学的理论基础。欧阳康教授说,提出社会信息科学的首要因素是理论信息学向具体信息学的延展。在社会信息科学的理论思维方面,中国学者走到俄罗斯学者的前面了。

3中国的社会信息科学途径

与俄罗斯和日本美国相比,中国社会信息学的产生和发展有着不同的途径。这种推动主要是学术研究和理论发展的动力,而不像美国那样,有众多企业的参与,有经济学领域专家的努力;也不象俄罗斯那样,纳入国家发展战略,由政府指令引导。中国社会信息学途径的的主要特征是三股学术思想潮流的汇聚而产生的一种涌现现象。"社会认识论","理论信息学","社会信息论"等三个方面的研究潮流,在华中科技大学形成了合力,推动着中国社会信息科学研究传统的形成与发展。在一定的意义上说,中国社会信息科学学术界的三种潮流分别与国际学术界的图书馆信息科学、计算机信息科学与通信信息科学三种不同的信息学研究传统遥相呼应。

3.1社会认识论的研究潮流20世纪80年代,中国社会认识论研究几乎与美国斯蒂夫o富勒等等同时展开,随后形成了较大的研究潮流,华中科技大学欧阳康教授是其中的主要代表。1988年1月,他在中国人民大学哲学系通过题为《社会认识论导论》的博士学位论文答辩,标志着社会认识论研究的开始。随后,社会认识论也作为一个相对独立的学科或研究领域而不断得以拓展,成为博士和硕士生的培养方向。20多年来,欧阳康出版的相关著作有《社会认识论导论》、《哲学研究方法论》、《社会认识论》等;主编的相关著作有《社会认识方法论》、《人文社会科学哲学》、等。他的20多位博士和30位硕士参加到了社会认识论的研究队伍,形成了一个非常和谐协调的社会认识论研究共同体。研究生们不仅积极参加到社会认识论的课题研究中,也以社会认识论作为学位论文的主攻方向,提出和研究了一系列的新问题,推动了社会认识论的研究。他们分别写出了《社会本体论》,《社会理想论》《,社会心态论》《,社会理解论》《,社会评价论》,《社会风险论》等一批论文和专著,形成了几百万字的研究成果[8]。2004年8月,欧阳康组织关于国家985项目二期工程申报,即申报建立华中科技大学"科技进步与人文精神"国家哲学社会科学创新基地,吸收李宗荣作为理工科专家的唯一代表参与起草申请报告。随后,欧阳康担任了李宗荣的理学博士论文的评审专家,对论文给予了很高的评价。2004年10月,欧阳康担任李宗荣博士学位论文答辩委员会的主席。他在答辩会议的总结讲话中,首次提出了"世界的信息统一性"问题,对理论信息学的发展提出了重要的指导意见。2005年11月,欧阳康派《华中科技大学学报》副主编蔡虹主任参加在北京师范大学召开的信息科学交叉研究研讨会,为中国社会信息研究中文理结合打开了通道。2006年4月,学校党委副书记欧阳康教授应邀出席一个系统科学全国研讨会,在会议开幕式上做了关于信息系统复杂性的讲话。随后,他在同济医学院主持召开了关于成立华中科技大学社会信息科学研究中心的筹备会议,与会者有欧阳康,李宗荣,闫学杉,邬,蔡虹,金新政等六人。会后,李宗荣与蔡虹提出成立该研究中心的申请报告;5月,报告获得学校批准,欧阳康出任研究中心主任,孙秋云、李宗荣、闫学杉任副主任。这样,由于这位学者兼官员型的专家的努力,中国学者关于社会信息学研究的学术潮流实现汇聚,与华中科技大学的文科发展捆绑到一起,兼具了一种单位的行政行为的性质。2006年12月,欧阳康组织了该研究中心成立暨学术研讨会,发表长篇重要讲话,论述社会信息科学的学科定位和研究思路[9]。他指出"社会认识就是对社会信息的采集、识别、处理和传播的过程,社会认识论研究的任务就是揭示社会信息的复杂性并帮助人们更好地处置社会信息。社会认识论与社会信息学研究的具体对象和侧重点有所不同,但其目标是一致的,二者研究的甚至可以说是一个问题的两个不同侧面,它们的研究可以互相补充,相得益彰。"2007年6月,他主持召开了中国首届社会信息科学研讨会。2007年7月,欧阳康教授主持审查了26个关于社会信息科学的科研课题,他作为"科技发展与人文精神"国家创新基地主任,批准了其中的14个课题立项。2008年3月,他批准组织跨学科、跨单位的研究团队,对国外社会信息学研究历史与现状展开调查研究;7月,在全国社会信息科学培训班上老师们汇报了俄罗斯、日本、美国、加拿大、英国、法国、德国、澳大利亚等国的情况;10月,他派员赴俄罗斯参加关于"人文信息学"的全俄学术大会,通报中国学者的研究进展,邀请俄罗斯科学院院士K.K.科林教授等权威学者来华参加"首届国际社会信息与系统科学研讨会",推动中国社会信息科学研究走向世界。

3.2理论信息学的研究潮流有的专家在2007年评述"计算机与信息科学"流派时说:"不论使用'计算机科学'或'信息科学'、'计算机与信息科学',到今天为止,我们几乎没有看到计算机科学界对'信息'发生过实质性的理论兴趣[10]。"此说在学界有一定影响,但是完全与事实不符。它无视或忽略了计算机科学家们在建立统一信息理论中所起到的主导的和实质性的作用。正如没有计算机科学技术的引领就不可能有信息科学的历史一样,不承认"计算机与信息科学"流派的成就自然就对已经产生、不断成长的统一信息理论视而不见,悲叹连连,很难写出信息科学发展的正史。计算机已经被证明有效地模拟了人脑的功能与机制,为人们理解自然和社会的信息过程提供了最佳模型,精通计算机理论与实践的专家作出独到的贡献是他们的知识结构和学术背景使然。建立和发展信息科学基础理论是所有信息学专家的共同需要。在探索统一信息理论或一般信息学的努力中,实际上几乎包含了所有学科的专家。《探索统一信息理论》的主编、奥地利维也纳技术大学WHofkirchner教授所列的学科顺序是:计算机科学、物理学、生物学、数学逻辑学、系统科学、心理学、社会学、经济学、语言学、哲学,等等。美国韦恩州立大学计算机科学系康德拉(MConrad)和密西根大学计算机与信息科学系卡姆扑夫勒(RRKampfner)等人1994年开始倡导寻求整个信息科学的理论基础。在发起和组织关于信息科学基础研究的第一、二次国际会议的少数几个最重要的人物中,都有美国韦恩州立大学计算机科学系康德拉教授。以第二次国际会议的代表为例,除了康德拉教授之外,还有德国HamburgandCesellschaft大学信息系Fuchs-Kittowski教授,英国Kingston大学计算机系PAMGelepitis教授,美国Misgen大学计算机与信息科学系Kampfner教授,德国不莱梅大学数学与计算机科学系KHaefner教授等。在中国,计算机科学与技术专业李宗荣教授的研究经历也能说明问题。他开创的关于理论信息学体系的研究是对国际"计算机与信息科学"成果的直接继承和发展。1987年以前,他曾在武汉大学计算机软件工程研究所任副所长,从事软件工程的教学与科研。那以后,逐渐地走上了计算机信息学与医学、生物学、社会科学、哲学相结合的道路。他在武汉大学参加国家攻关项目WPADT系统的开发,在湖北医科大学开发出肺鳞癌细胞学诊断专家系统,在美国密苏里大学研制成功医疗质量管理系统QFES。1995年回国后,先后在湖北医学院、湖北大学、华中科技大学组织跨学科的研究团队,开展关于信息科学的跨学科讨论,编印出30余期研究通讯。这些实际经验和研究经历,为理论信息学的综合积累了素材,也为关于信息的哲学思考打下了基础。在新世纪之交,中国信息科学理论研究者中间弥漫着一股浓重的悲观主义情绪。物质世界观转变的艰巨,还原论习惯的根深蒂固,自然、生物、人类、机器中信息现象的高度复杂,物理学范式渗透的学术刊物、学科建制、基金分配中的强烈排他,等等,让学者们真正体会到建立统一信息理论的困难。可惜,如果有影响力的学者带头去宣传悲观论调,必然对信息科学基础研究造成负面影响。在华中科技大学张勇传院士的指导和帮助下,李宗荣逆潮流而动,于2004年写出题为《理论信息学:概念、原理与方法》的博士学位论文,全文发表。2005年在北京师范大学召开的"信息科学交叉研究研讨会"上,会议只是热烈地讨论领域信息学(或部门信息学),对一般信息学则认为不合时宜。但是,李宗荣不仅立即主持出版《理论信息学导论》,而且继续研究,发表题为《论信息科学的世界观》的博士后研究工作报告。对中国学者的理论信息学和信息世界观研究成果,加拿大专家M.邦格和俄罗斯专家K.K.科林十分看重。在华中科技大学社会信息科学研究中心成立暨学术研讨会上,欧阳康教授做了题为《社会信息科学的学科定位与研究思路》的长篇发言[11]。他提到:"李宗荣老师在取得了管理科学与系统工程的博士学位后,又到哲学系来攻读他的马克思主义哲学第二个博士学位,这给我以很大的影响。他自己长期进行信息科学研究,取得了很多的成就。在与他的学术交往中,我进一步认识到对于当代科学和当代文化与当代哲学的研究都还有一个重要的锲合点,这就是社会信息科学。"关于社会信息科学问题的提出,他说:既包含"理论信息学向着具体信息学的延展",也包含"深化社会认识论的研究"。中国社会信息科学研究传统之所以形成于华中科技大学并向全球辐射,有它自身的内在逻辑。北京大学闫学杉教授自20世纪80年代末,开始关注信息科学知识体系,提出它的六个分支:电讯信息学、计算机信息学、光信息学、生物信息学(细胞信息学)、动物信息学和人类信息学。1997年,发表了《论普通信息科学》,提出作为统一的规律性理论,必须同时适合于任何一种部门信息科学。1999年发表《关于21世纪信息科学发展的见解》,提出三个部门信息学:机械信息学、细胞信息学、人类信息学。2000年,他发起并参与组织北京大学、中国人民大学等单位的学者关于信息科学的交叉研究。2005年11月,他参与组织在北京师范大学召开了全国研讨会议,在会议报告中将他过去的称谓"人类信息学"改称为"社会信息学"。2006年2月,他在发表《人文与社会科学中的信息考察》。2007年7月,他在题为《信息科学的历史、现状与未来》中,明确地提出了信息科学的"1+3"体系结构,即:"信息科学的体系=(一般信息科学/统一信息理论/理论信息学)+(工程信息科学+自然信息科学+社会信息科学)"。

科技信息论文范文第7篇

【关键词】决策树算法 应用 优点

决策树是在信息论基础上建立的,对数据进行分类的一种常用方法。决策树是一种树型结构,执行过程与流程图比较相类似,在决策树中的各个结点以及分枝分别代表着一种测试,属性上的一个测试就用结点进行表示,输出一个测试则用分枝进行表示,树中的叶结点代表类或类分布。首先,一棵决策树的创建是通过训练数据建立的,训练数据是根据一批已知的数据得到的。其次,决策树建成后,要进行数据预测。决策树创建整个过程,我们可以视为是数据规则的生成过程,因此,决策树成功实现数据规则的可视化,输出结果易于理解,效率也比较高,所以比较常用。

1 决策树生产过程

决策树进行传统的数据分类包含两个步骤:

第一步:利用训练集进行创建模型阶段,找到映射函数表示模型,从指定的训练集中获取知识,这是一个学习的过程。

第二步:利用生成的决策树预测数据的类别,使用上一步训练完成的函数模型进行预测,对输入的记录,从根结点开始一直到叶结点进行测试属性值,然后对数据集中的每一类数据进行描述,生成分类规则。

具体工作过程如图1所示。

2 决策树算法的优点

(1)学习该算法,不要求使用者的知识背景丰厚,就能够在训练事例中用属性结论的方式来进行表达。

(2)训练集数据量较大的情况下,决策树模型效率较高。

(3)决策树是一种树状结构,它是最简单直观的,因此在分类模型中经常被应用的方法之一,通过从根结点一直到达叶子结点的路径转换,最终能够生成分类规则以IFTHEN形式进行表示,这样更能够让人容易理解。

(4)决策树方法对于分类而言,精确度较高。

3 决策树的评价指标

(1)准确的预测性。决策人员最关心的就是预测的准确性,分类模型具有对未知新数据进行准确预测的能力、也能对未知的数据类的预测能力。

(2)描述的简洁性.分类发现模型对问题的描述方式提出的分类发现模型只有越简洁越容易理解才能够方便决策人员使用。

(3)计算复杂性。在数据挖掘的过程中,操作的数据对象是海量信息的数据库,所以空间和时间的复杂性将直接影响模型的计算成本,计算的复杂度是在海量数据库中具体实现的细节决定的。

(4)处理规模性。

(5)模型强健性。

4 决策树算法在学生就业工作中应用

4.1 设计方案

利用决策树C4.5算法分析哪些因素对学生就业有影响。

选取计算机系10届、11届、12届计算机科学与技术专业学生为研究对象,学生人数为200人。

4.2 数据采集

(1)学生基本信息库。数据结构如下:姓名、学号、性别、班级、籍贯。

(2)学生就业信息库。内容包括学号、姓名、参加公司培训、是否优质就业(工资在3000元以上为优质就业)等。

(3)成绩表。成绩数据库中包括了学生的课程总成绩平均分和综合测评成绩平均分,这个数据库由教师在教学过程中和辅导员对学生表现评定产生。

4.3 数据项处理

数据集成。根据给出的数据文件,将三个数据源的数据利用数据库技术生成学生就业分析表。

数据清理。生成学生就业分析表工作要进行填补遗漏的数据值。

数据转换。数据转换中离散值属性要占大多数,连续值属性并不多,只有个别的需进行离散化处理。现将上述综合成绩属性的属性值化分为4类:成绩从0~60分属于“及格”,60~80分属于“中”,80~90分属于“良好”,90~100分属于“优”,性别两类:男或女;参加公司培训分为两类:是或否;就业分为三类:工资在3000元以上为优质就业,2000-3000元为普通就业,2000元以下为一般就业,无工作为待就业。增加参加公司培训可以判断优质就业的可信度。

数据消减。由于学生基本信息表和学生就业信息表中的属性比较多,笔者为了便于分类挖掘,将籍贯、班级这两个属性进行删除,原因是这两个属性与就业相关性不大,为了能够保护学生的隐私,笔者将学生姓名属性也删除掉,从而生成新的学生就业分析表与转换数据表。

参考文献

[1]郭佳,陈春燕.数据挖掘技术在高校毕业生就业工作中的应用[J].中国科技信息,2008,14:67-69

[2]宫杰,谭跃生,李慧萍.数据挖掘技术在高校教务管理中的应用[J].科技信息,2010,13:56-60

作者简介

王秀岩(1975-),黑龙江省望奎县人,副教授。研究方向为计算机教法研究。

作者单位

科技信息论文范文第8篇

其次是研究领域不广。从整个西北地区和西北各省区信息化研究主题分布来看,研究基本上深入了信息化所包括的各个部分,但在某些领域仍显薄弱,例如,对于传统工业改造中,煤炭、钢铁、石化、建材等传统工业如何利用信息技术提升行业竞争力、转变经济增长方式等方面的专门理论研究几乎没有。说明研究者对于这个问题还没有给予充分的重视。再如信息安全、信息化环境等内容,研究涉及的也很少。

再次是研究分布不均。在西北地区信息化理论、西北地区信息化进程、西北地区信息化实践三者研究中有关理论和进程的文章较少,实践的较多。有关整个西北地区信息化的研究少,但研究西北各省区信息化的论文相对较多。而从西北各省区信息化研究论文地区分布来看,新疆最多,青海最少。

、西北地区信息化研究展望

根据以上分析和判断,西北地区信息化研究将会出现如下几个方面的趋势:

1.信息化与西北地区经济发展的研究将会继续升温。信息化在宏观经济学研究中将成为重中之重,因为信息化直接关系中国经济发展的增长点及动力问题。这方面的论著将会增多,研究将会更加深入细化。如信息化与经济增长的理论联系、信息化对经济发展的影响、经济信息化水平测算与发展模式等研究将会继续升温。同时随着国家实施信息化战略的进程,信息化的研究将会和更为具体的行业经济联系起来,如煤炭、钢铁、石化、电力、建材等传统工业在利用信息技术提升行业竞争力、转变经济增长方式等方面的理论研究将会进一步细

化、具体。

2.信息化与西北地区城市发展的研究将会深入。从收集到的资料看,有关信息化与西北地区城市发展的研究几乎没有,而随着我国城市发展的进程,信息化与城市发展论述将会增多。如信息化与城市化问题、城市信息化问题、信息产业与城市发展问题等研究应该有所增加。在以政府的发展规划和城市发展一般趋势为依据的前提下,这一方面的研究也会更加细致。如信息产业与城市发展、信息产业与城市经济发展、信息产业的空间发展及其对城市地域结构的影响等问题研究者将会认真分析并提出对策建议。

3.信息资源开发及其配置问题的研究将会更加重视。虽然国家一直在积极进行信息资源的建设,西北地区也在努力进行这一方面的建设,但信息资源建设方面存在着重复建设、形式不规范、配置不合理、资源数据难以整合等现象。再加上信息资源运行机制的不合理及缺少政策支持,致使网上信息资源贫乏,共享困难。根据这些,信息资源及其配置问题的研究将会成为热点,如良好的运行机制、评价标准,实现资源配置与共享的途径和方法、知识产权与流通共享等问题的研究将会有更多的人关注。

4.信息化水平测度及标准化将会成为研究领域的热点和难点。国家已出台了一些信息化标准,但目前的工作只涉及网络相关的技术标准,因此信息化的标准化工作还有很大的发展空间。而为了提高信息化建设的理性化和规范化,信息化的建设必须建立一套完整的评价系统。但从研究来看,西北地区的评价体系还不够完善,今后这也是西北地区信息化研究的重要方向。同时,要逐步实现西北地区信息化的标准化和规范化管理。西北地区及西北各省区的信息化基础设施建设、资源建设都必须要有一个统一的标准和规范。而且此标准的推广、普及

将是未来标准化工作的重点。

5.欠发达地区信息化推广研究将会进一步拓展。信息化不单纯是一个技术问题,更是一个认识和观念问题,西北贫困地区由于历史和社会发展的原因,对信息化在社会发展中的地位和作用缺乏足够的认识。所以,要推进西北地区的现代化,首先改变人们的看法,提高认识,这是发展的前提和基础。对于西北贫困地区而言,不管是当地政府还是社会大众,都应该充分认识到信息化在社会进步和社会发展中的重要地位和作用。信息化在一个社会发展中的作用和地位愈来愈显著,现代化的进程首先是观念的现代化,观念现代化的前提则是信息化的推广,这也是理论研究者要去做的。

参考文献:

[1]梁春阳.西北地区信息化现状的国际比较[J].图书馆理论与实践,2004,(2):87-89.

[2]刘珙.西北地区信息化水平的定位与分析[J].情报资料工作,2004,(2):60-63.

[3]王海彬.不发达地区信息化问题[J].开发研究,2002,(2):37-39.

[4]史培军,周武光.西北地区可持续发展的几个关键问题[J].北京师范大学学报(人文社会科学版),2000,(5):130-140.

[5]中国科学院中国工程院.加快西北地区发展的几个关键问题[J].地球科学进展,2000,(10):489-498.

[6]李雪慧.信息化与西北农业发展[J].农村经济,2003,(9):27-29.

[7]李惠兰.甘肃农村经济发展必须大力推进农业信息化[J].甘肃农业,2005,(11):22-23.

[8]白明.信息+技能+资本=最大收益:新世纪农民收入增长新模式[J].开发研究,2001,(5):37-39.

[9]谢忠民,王红蕾.浅谈新疆农业信息化建设[J].新疆财经,1999,(4):22-23.

[10]张晓峰.西部地区中小企业信息化现状及对策[J].CAD/CAM与制造业信息化,2003,(1):8-10.

[11]何彦平.宁夏中小型企业信息化建设的再认识[J].图书馆理论与实践,2007,(4):131-133.

[12]李纯英.对青海省企业信息化建设的思考[J].青海社会科学,2005,(9):58-60.

[13]巫江,史煜娟.甘肃企业管理信息化发展的思考[J].甘肃理论学刊,2002,(11):63-65.

[14]滕堂伟.论新型工业化进程的区域路径与模式选择———以西北民族地区为例[J].经济研究参考,2006,(67):33-39.

[15]付小妮.抓住契机积极推进西北民航的信息化建设[J].民航经济与技术,2000,(6):58-59.

[16]宋雪飞.西北地区信息咨询业的发展现状及社会经济效益分析[J].发展,1998,(9):29-30.

[17]梁春阳.论西部地区信息服务业发展的投资取向[J].情报资料工作,2001,(5):57-59.

[18]李晓东.对制定西北物流业发展规划的管理分析[J].甘肃省经济管理干部学院学报,2005,(9):40-43.

[19]黄智杰.甘肃省商务物流建设的基本框架研究[J].开发研究,2004,(1):68-69.

[20]龚海涛,张晟义.以涉农供应链的成长促进新疆新型工业化:互动关系及现实基础[J].新疆大学学报(哲学·人文社会科学版),2006,(7):5-9.

[21]李凤虎.发展电子商务促进陕西开发[J].统计与信息论坛,2000,(11):63-65.

[22]徐燕.对新疆中小企业发展电子商务的思考[J].全国商情,2006,(5):33-34.

[23]余兆明,高玉琢.加快西部地区教育城域网的建设推动地方教育信息化的发展[J].中国科技信息,2007,(1):259-261.

[24]郭靖花.西北民族地区教育信息化发展探析———由正宁五顷原回族自治乡信息技术教育发展所观[J].甘肃联合大学学报(自然科学版),2006,(9):79-82.

[25]王海燕,龙英艳.西北地区中小学教师信息素养现状调查研究[J].现代教育技术,2007,(4):58-64.

[26]张景春.复合图书馆与总馆分馆制西部公共图书馆事业的两大增长点[J].图书馆理论与实践,2002,(6):67-69.

[27]雷润玲,赖伯年:数字图书馆建设与西北地区经济跨越式发展[J].情报杂志,2004,(8):42-44.

[28]曹臻.西北地区数字图书馆建设若干问题的探讨[J].图书馆理论与实践,2005,(2):103-104.

[29]张彬.民族地区行政环境与电子政务建设[J].内蒙古大学学报(人文社会科学版),2004,(7):34-37.

[30]王利清,张建新.民族区域自治地方电子政务建设现状与对策[J].内蒙古农业大学学报(社会科学版),2007,(3):61-63.

[31]冯玉才.电子政务也要国产货[J].软件世界,2006,(8):65-66.

[32]常红,黄玉花.关于开发利用我国西北地区地理信息资源的思考[J].西北师大学报(社会科学版),1999,(3):100-102.

[33]刘斌,辛海强.新疆基础地理信息库建设构想[J].测绘通报,2002,(9):51-54.

[34]唐志荣.星火农村信息服务体系[J].甘肃农业,2003,(9):34-35.

[35]张照云.青海科技信息开发利用之障碍分析及对策研究[J].青海科技,2001,(2):49-51.

[36]马春赞.谈陕西地市级科技信息网络的建立与发展[J].情报杂志,1998,(1):86-87.

科技信息论文范文第9篇

关键词:系统科学理论 图书情报学定律 知识组织 系统论 控制论 信息论 协同论 耗散结构理论 突变论

中图分类号: G254.29 文献标识码: A 文章编号: 1003-6938(2013)06-0001-07

1 引言

科学研究需要有科学的理论和方法来支撑,对于每一项研究也需要科学的理论来升华和诠释、需要借助科学的方法来实现。就知识组织研究而言,欲获得高效知识服务需要来自于科学理论指导知识组织,需要科学的方法实现知识组织。长期以来支撑着知识组织研究的除了图书情报学中一些定律之外,还涉及与数学密切关联的理论和方法,尤其是系统科学中一些重要理论对知识组织研究与实践都有着很大的指导意义和解惑作用。应该说,这些理论和方法促进了知识组织研究与实践的快速发展和完善。

长期以来,在图书情报领域,学者非常注重应用性研究、方法性研究、技术性研究以及解决图书情报工作中实际问题的研究,在理论研究方面或者说研究理论对研究的指导作用、理论对研究对象的科学阐释相对较少。例如,笔者对CNKI检索,发现学界在科学理论对知识组织的理论价值、指导作用等方面的研究尚缺乏系统和深入。因此,迫切需要这样的探讨来改进和提升知识组织效率和水平,从而提升知识服务的效率。

早在20世纪80年代,刘植惠教授就对系统科学理论在情报学研究中的应用进行了系列讲座[1-2],探讨了这些理论对图书情报学研究中的指导作用和有关应用问题;王知津教授等于2009年出版的《知识组织理论与方法》[3],主要探讨了网络环境下知识组织的学科基础、基本原理、方法与技术,以及新概念、新理论和新工具等问题,但尚缺乏深入的知识组织的理论探讨;柯平教授等[4]从知识资源论的角度研究了图书馆学基础理论体系的三层结构;周文芳等[5]从系统论的角度论述知识组织的构建原理;李红春[6]根据系统论的原理探讨了知识组织中的分类系统和主题系统;雷会珠等[7]利用耗散结构理论等信息资源系统中的信息自组织与熵值变化进行了探索。

此外,在图书情报学理论与实践研究方面也有一些代表性的相关成果。如,武汉大学马费成教授在情报理论方面从事过大量的研究,其中最突出的贡献凝聚他2008年出版的专著《IRM-KM范式与情报学发展研究》[8]中,他从知识网络演化及知识网络中的群体行为等方面,提炼出情报学的六个基本原理(离散分布原理、有序性原理、相关性原理、易用性原理、小世界原理、对数透视原理),这些理论对知识组织研究有很大的指导作用;邱均平教授早在1988年就从文献计量学角度深入探讨了布拉德福定律、齐普夫定律、洛特卡定律等,并对这些理论在文献计量学中的应用做了大量阐述[9],其后20多年他借助这些理论从事了大量的应用研究;中国科技信息所的化柏林博士提出了适合于以信息、知识、情报为对象的三动论(序化论、转化轮、融合轮)思想 [10], 主要探讨了资源的空间分布、资源转化和资源互操作的理论思想;武汉大学董慧教授等从本体演化角度,结合逻辑学、图论等理论,构建了一个以本体、本体分子为核心的知识组织动态模型[11];温有奎教授、焦玉英教授从范畴论角度对知识对象的进行了描述,并构建了范畴知识单元信息模型 [12]。

国外虽然也有大量关于知识组织理论与方法上的研究,但真正涉及科学理论与知识组织紧密联系的诠释也不多见。如,Judit Bar-Ilan等[13]从认知理论出发,根据儿童特点研究了网络知识资源如何适合儿童,并构建了适合于儿童使用Web的知识构建模型;Alon Friedman[14] 结合知识表示、语言学模型和概念理论的知识组织方法,提出了一个融合两者优点的综合知识组织模型;Richard P[15]基于Idea Collider 信息解组合重构理论,提出了在知识检索和分类中,需区分相对于“常识知识”的“多元知识”的理念。

无论是国内还是国外,学者很少涉及科学理论的机理(尤其是系统科学中一些横断理论与方法)研究知识组织的理论价值,确切的说是技术与方法的研究,欲使知识组织更加科学合理,必须将科学理论融入知识组织研究中,用科学的理念指导知识组织研究与实践,从而促进知识组织理论框架的完善。

2 系统科学理论与知识组织

知识组织不同于信息组织,它更强调数据间的有机关联,通过数据间的联系从而形成相关知识。所以,知识组织更关注知识组织的结构和系统性,强调数据质量控制和数据流程管理,注重数据关联的平衡性和稳定性,重视知识间关系的协同作用,发现知识组织中的特殊规律等,都需要相关的理论来支撑和解释。作为系统科学理论中的“老三论”、“新三论”对一切科学都有着重要的指导作用,同样对知识组织研究过程中一些问题和现象也能够进行科学的阐释和有效地引导。

2.1 系统论与知识组织

中国大百科全书认为:系统论(System Theory)是研究系统思想和系统方法的哲学理论。它包括三部分内容:系统的科学(或称数学系统论)、系统技术论(包括系统工程)和系统哲学[16]。从图书情报学或信息学角度阐释系统论,认为它是研究系统一般模式、结构和规律的理论,是研究各类系统的共同特征,并用数学方法定量描述其功能,寻求并确立适用于一切系统的原理、原则和数学模型,是具有逻辑和数学性质的一门新兴科学[17]。

从系统论角度出发,任何事物都具有整体性、关联性、动态平衡性,以及具有等级结构、时序性和可延续性。我们不仅要利用系统论的思想和方法去认识事物的规律和特征,更重要的是借助所认识的规律和特征去创造新事物、管理新事物,使事物达到最优化。

借助系统论思想,我们可以把知识服务系统中的知识资源看成一个整体,利用系统论的事物(知识资源)都具有关联性的思想,认识到孤立的数据不能成为知识。这一思想指导我们必须寻找知识或数据间的联系,并把这些联系上升为语义关系,保证经过关联的知识和数据的知识总量高于知识资源内个体知识之和。

系统论的系统内部事物的动态平衡性思想可以指导我们在进行语义网络构建时,注重语义网络的平衡性,在知识聚类过程中,要保持各类元素的平衡,切忌出现大量的孤立点(或元素很少的类)和稠密网络(元素很多的类),这样既可以避免在进行知识查询时命中很少的结果而不能满足需求,也可以避免命中大量的结果而加重用户筛选结果的负担。

在知识组织的分类系统和词表系统中,其体系的层次结构和词汇间的属分关系,充分印证了系统论中所认为的事物的等级结构之特征。而系统论的这一思想对知识分类体系的建立和词表构建都具有指导意义。同样,系统论中事物的时序性思想,对进行知识组织中的文献链结构和用户行为知识的组织都具有非常重要的参考价值。

2.2 控制论与知识组织

中国大百科全书对控制论(Control Theory,Cybernetics)的定义是:研究生命体、机器和组织的内部或彼此之间的控制和通信的科学[18]。我们可以理解为,控制论是关于工程系统、生命系统和社会系统等领域中有关反馈现象和控制机制共同理论的一门学科。控制论的主旨思想是,通过反馈机制,采用系统方法或过程方法对复杂事物或现象进行控制,通过调节使被控对象达到预定目标。因此,作为一门横断理论的控制论,其理论几乎可以应用于任何复杂过程。

在知识组织领域,控制论可以全面运用于数据的质量控制、数据和知识生产流程控制,并借助控制论基本原理解决知识组织过程中大量复杂问题。例如,在进行知识组织的架构时,需要针对系统的服务目标,借助控制论的系统分析方法,辨识数据或知识间的关系,使知识的关联达到最优化;在数据组织与操作过程中,控制论可以将人们对数据组织的计划、组织、激励、领导等职能与纠正工作中偏差紧密结合起来,使数据的管理工作形成一个有机的系统,以确保对数据质量的有效控制。

总之,强调系统方法、过程方法和微观调整的控制论,在知识组织的实施中发挥着重要作用。具体而言,控制论指导人们对数据结构和数据关联所进行的宏观控制思想,为实现知识服务目标提供了保证;过程化的控制思想对数据加工处理环节的数据质量控制、加工处理环节的时间、进度等控制,为知识组织工程的时间、进度和质量的控制提供了有效地理论与方法;为了对事物有效控制,控制论还强调反馈和调节功能,在知识组织的一些细节中,通过系统使用或测试的反馈信号,加强了对数据或知识间关系的调节,确保知识的组织能够提供更为有效的知识服务。

2.3 信息论与知识组织

信息论(Information Theory)是利用数学的方法来讨论信息本质、信息度量、信息识别和信息传递与交换共同规律的科学理论。正如中国大百科全书对信息论定义所述:信息论是研究信息的表示、传输、处理、存储和利用的理论科学。它的经典内容包括信息的数量定义(信息量)、信道容量、信源和信道编码以及信息失真率理论等[19]。由此可见,知识组织所涉及的知识表示、知识传递、知识的处理与存储、知识的利用等研究与实践,都可以得到信息论思想的指导,并促进知识组织研究的升华。

信息论将信息描绘成在现实世界中客观、广泛地存在着的对象,信息空间充斥着大量杂乱无章的信息子,当信息子有规律的排布时,就会产生能量,这些能量经过传递就会使确定的事件发生。而知识组织正是遵循这一原理,将数据或信息(可比做信息子)有机联系,建立数据、信息之间的语义关系后,就可能确定知识或产生新的知识,当这些知识传递给人们解决问题时,就激发出知识的能量。

知识组织的一个重要因素就是将数据进行关联后,使之能够进行推理获得知识,以满足知识服务的要求。信息论中所述信息子的摩擦碰撞产生能量,信息子的排布形式决定事件的性质,这一信息论机制非常雷同于知识组织中数据仓库的数据间的多维联系、本体结构数据间的语义关系,这种联系与关系完全可视为信息子的碰撞和排列,其产生的知识恰恰可视为解决问题的能量。

信息论思想告诉我们,知识系统内部存在着大量知识熵,为了控制知识熵的增长,我们必须将知识系统内的知识序化,也就是进行有效地知识组织。信息论有助于我们去探索知识组织的本质,去观察知识组织中的全新世界,让我们跳出传统的数据组织思想去建立一个全新的知识组织领域,促使系统提升了知识服务的能力,为我们构造出更加高效的知识服务系统提供理论基础。

2.4 耗散结构理论与知识组织

耗散结构理论(Dissipative Structure Theory)是指“寻求系统在非平衡状态下形成稳定有序结构的条件和机制,探索自组织过程的一般原理的理论”[17]。在知识组织过程中,无论是知识聚类、分类,还是语义网络的构建,亦或数据仓库的组织等,均存在大量非平衡状态,而这些知识组织体系本身就潜在着稳定的有序结构,我们需要认识这些有序结构形成的条件和机制,完成这些知识组织结构的自组织过程。

典型的耗散结构需具备四个基本特征:系统的开放性、系统的非平衡性、系统与外界物质和能量的可交换性、系统的自组织性。也就是说,具有耗散结构的系统必定能和外界进行某种交换,孤立或封闭的系统不可能产生耗散结构;其次,耗散结构是远离平衡态的,平衡态或衡态都不可能将已有的有序走向更高级的有序,只有远离平衡的开放系统,通过与外界进行物质与能量交换时,所积聚的能量达到某个临界值将会引起突变,形成稳定有序的结构;第三,耗散结构具有自组织能力,这种自组织能力使系统具有柔韧性和鲁棒性,具备抗拒外界的干扰能力,确保系统走向自我完善。

因此,知识组织可视为一种耗散结构,如何借助耗散结构理论促进知识组织的稳定有序、提升知识组织的知识服务能力,需要将耗散结构理论充分运用于知识组织的研究中。知识组织是一个开放并远离平衡的系统,它需要外部知识的介入,语义关系的链接激活了知识,随着内外部知识交换的频繁,新的知识大量增生,产生了质变,构成了自成一体的知识组织系统,形成了知识组织的耗散结构,为实现理想的知识服务提供了保证。

随着社会、文化和科学技术的发展,原有知识体系将不断被新生知识所取代,如果原有知识组织不更新,很快就会衰退到惰性的平衡,又从有序走向无序。所以,欲保证知识组织对知识服务的持续有效性,需要不断加强内外部的能量(数据、知识、关系)交换,增添新的知识和语义关系,使知识组织处在有序—无序—有序的转化过程中,保证知识服务系统始终处于高效的活动状态。

如此看来,知识组织虽然是一种耗散结构,但仍需要在耗散结构理论指导下不断提升和完善,只有这样才能在知识服务中发挥更大作用。

2.5 协同论与知识组织

协同论也称协同学(Synergetics)或协和学,是研究系统从无序到有序转变规律和特征的一种理论方法。它是研究系统中子系统之间怎样合作产生宏观的空间结构、时间结构或功能结构的[16]。协同论认为,尽管各子系统之间千差万别,但它们在一个大的系统下,依然存在相互影响、相互配合以及相互作用的关系,也存在着相互干扰、相互制约等因素。因此,协同学研究的任务就是,探索人类社会各类系统共同本质,研究它们发展演变的共同规律,以及寻求它们之间的协作机理。

协同论所研究的对象在知识组织的研究中大量存在,信息聚类组织时依赖的是信息的主题,而同一主题的信息我们可以看作是这些信息所具有的共同本质。在关联信息的组织时,相关联的数据可能会相互影响、相互作用,甚至是相互制约。将信息的这种影响或制约关系加以描述并组织起来,可使信息上升为能够提供知识服务的知识,实际上这就是协同论中所阐述的系统从无序转变为有序。然而,协同学的思想更希望我们去寻找信息关联前后信息转化为知识的转变规律和特征。

协同学应用于知识组织告诉我们这样一个道理,孤立的数据或一个个数据个体可能价值很小甚至没有价值,但是数据“协同”(关联)起来,却能展现出数据中隐藏的大量知识,也就是说“协同”可以帮我们找到了数据中大量的“客观性质”。因此,在知识组织中,我们应当借助协同学思想,针对知识服务的目的和要求,建立探索数据间各类关系的机制,解决知识组织中的复杂问题,更有效地开展知识服务。

2.6 突变论与知识组织

突变是指事物发展过程中的间断或突然转换的现象,从理论角度探讨突变,就是用数学的方法研究自然界中事物发生演变出现的不连续现象。如,中国大百科全书认为:突变论(Catastrophe Theory)是描述自然界中发生的各种突变现象的数学理论[20]。突变论使我们对人类许多社会现象的发展变化有了更深刻的理解,为我们战胜愚昧和无知提供了新的武器。突变理论使事物发生的质变或飞跃(革命性的变化)有了科学的解释依据。例如,互联网的急剧膨胀,网络地址资源远远不能满足互联网发展的需要,并制约了互联网的发展,使接近崩溃边缘的互联网处于极不稳定状态,需要一种网络技术的革命性变化(突变)使互联网达到一种新的平衡,所以新一代互联网技术完成了互联网发展历程中的突变。

信息组织同样也经历过面临从量变到质变的突变过程。从二次文献信息到全文信息、从文本信息到多媒体资源都带来信息存储技术、信息获取技术跃变和质变。目前,在大数据和云计算环境下,数据的组织更是发生了巨大的变化,大数据产业的出现,数据的计算已由GB级的计算上升到TB、PB甚至YB级 的度量,信息组织架构已不再局限于某个局部,而是拓展到全球,形成大区域甚至全球协作战略。

在知识服务环境下,随着知识服务需求的不断提升,知识组织也将会发生突变,如何应对这种突变?如何控制需求变化带来的知识组织的突变?我们可以借鉴突变论中应对突变现象的数学方法,对知识组织由于知识服务需求带来的突变进行有效的控制和科学应对。首先,我们可以针对知识服务要求分析刻画知识需求参数和满意度控制参数;其次,进行知识标引并建立知识间的关联关系,构造知识间的势函数;第三,分析关联,构建实现平衡态的知识空间;第四,研究知识空间到知识需求参数间的投影,确定知识需求可能发生的变化。总之,在突变论的指导下,知识组织研究与实践可以迅速适应用户知识需求的不断升级和变化。

3 图书情报学相关定律与知识组织

图书情报学是研究事实、数据、信息、知识和情报的产生及其有效收集、组织、存储、传递、转换和利用规律,并运用科学技术手段对其进行有效的管理和利用的一门科学[17]。因此,图书情报学中的定律注重探索信息、知识的活动特征,强调探究信息、数据中有价值情报的规律。著名的图书情报学基本定律(布拉德福定律、齐普夫定律、洛特卡定律)虽然是针对文献、词汇以及作者和文献关系给出的一般性规律,但同样对知识的组织有很大的指导意义。另外,在图书情报学中广为应用、阐述社会网络的小世界理论也对知识组织研究有着启示作用。

3.1 布拉德福定律与知识组织

布拉德福定律(Bradford’s Law or Bradford’s Distribution)是英国文献学家、化学家布拉德福先生[17]创立的,主要描述文献分散规律的经验定律。布拉德福定律认为,如果按科技期刊刊载某专业论文的数量多少,以倒序排列,则可以分出一个核心区和相应的几个区,每个区的论文数量相等,则核心区期刊数量和相继区期刊数量成1:n:n2 …的关系(n>1)[17]。布拉德福定律用专业文章数量的多少确定期刊核心区的概念,虽然这一定律不一定适合当今选择核心期刊,但他的这一思想却对当今选择核心期刊仍有很大的指导作用。

布拉德福定律的主要思想告诉我们,文献有相对集中和普遍分散两个方面,这一思想对开展知识组织研究同样具有帮助作用。我们可以将文献分散原理应用于知识组织的信息聚类研究中,聚类核心区的思想可以指导我们确定阈值,从而帮助我们确定类的规模。另一方面,无论是知识仓库还是知识库,亦或本体数据组织,都存在着知识点的集中和分散规律。布拉德福定律可以指导我们去发现知识点的集中区,了解分散的知识点,这些信息可以帮助我们更科学有效的构造各类知识库的逻辑结构。

布拉德福定律强调,对于某一专业领域的论文通常分布在众多期刊中,虽然有少量的期刊刊载了较多的该专业领域论文,但仍存在大量的论文分散在众多的期刊中,而这一经验总结提示我们,每一学科都有本学科重要知识点的关键词,也有其他学科知识点的关键词散落在自己学科,这就提醒我们在进行相关知识库组织时,对散落在不同学科的知识点(关键词)做好学科关联处理,并确定关键词的主要学科,以保证我们可以通过关键词的学科关联关系发现交叉学科,寻找学科新的增长点,以此为学科规划提供知识服务。

3.2 齐普夫定律与知识组织

齐普夫定律(Zipf’s Law)是美国学者G.K.齐普夫于20世纪40年代提出的关于词汇在文献中出现频次的分布规律,也称词频分布定律、最省力法则、齐氏分布定律。齐普夫定律的主要思想:如果把文献中词的频率(f)从高至低递减排序,并用自然数给这些词编上等级序号(r),则有 f r=C(C为常数)。这个定律与80/20规律有异曲同工之效。这条定律提示我们做任何事情尽可能以较少的付出去获得较大的收益。当然,这条定律并不是暗示我们“偷工减料”,而是指导我们如何利用事物的客观规律,发现可能产生较大影响的并较为“省力”部分作为重点突破,以后再向全局突破。

在知识组织研究中,我们可以依照这条定律的原则,归纳出社会对知识服务的需求,并分析用户对各类知识服务需求的渴望程度,再根据分析结果针对相应的知识组织的难易程度、工作量大小,选择率先建设的知识组织系统。例如,根据用户使用信息系统的行为信息,分析大家关注的领域,并针对这些领域率先构建相关知识库。如,知识点链接知识库、用户行为推荐知识库以及相关主题的知识仓库,以后逐渐扩大知识库的构建领域。再如,该定律提示我们可以针对国家、地区或企业关注的领域,选择重点建设相关知识库,确保知识服务能够首先和国家、地区重点关注的问题紧密结合起来。

在具体的知识组织方面,我们可以根据齐普夫定律将知识组织体系中工作量大小以及各项数据组织工作在知识服务中影响的大小分别进行排列,并权衡工作量大小和知识服务中发挥作用大小选取先进行的工作,使知识组织工作达到效率和效果的平衡。例如,在语义关系的构建工作中,我们可以花费较小的力气建立实体间的简单关系,那些大量的复杂语义关系可以交给计算机实现,计算机根据人们设计的推理算法就可以完成各种复杂关系的组合。这恰恰是最省力法则的精髓。

3.3 洛特卡定律与知识组织

洛特卡定律(Lotka’s Law)揭示了科学研究人员数量与所著文献数量之间的关系,认为发表两篇论文的作者数量是发表1篇论文作者数量的1/4,发表3篇论文的作者数量是发表1篇论文作者数量的1/9,如此类推,发表N篇论文的作者数量是发表1篇论文作者数量的1

n2 [17]。洛特卡定律又称倒平方定律,描述了科学生产率的经验规律,是美国学者A.J.洛特卡于20世纪20年代提出的。

洛特卡定律并未有涉及知识组织领域,但该定律能否符合知识表达上的一些规律,确切的说,在学术成果的影响上是否遵循这一规律。我们做了实验,三年以后,没有被引用的论文是被引一次论文的4倍,被引2次的论文是没有被引过论文的1/9,如此下去,基本符合洛特卡定律的倒平方定律。这一规律的出现为我们构建引文索引的数据结构,计算文章发表后的知识量提供了一个非常有效的途径。

同样,洛特卡定律也为我们探索知识词库中使用词的规律,发现常用词汇以及分析各词汇在知识服务中的贡献(热词)提供了新的思路,我们曾经对文章中汉语词汇的分布情况进行了探索,发现汉语词汇在文章中呈现洛特卡现象[21] 。这一结论为我们更加科学有效地构建知识词库提供了新的依据,为知识服务系统在分析用户行为用词上提供更加科学的方法。在引文知识组织中,洛特卡定律为我们构建作者知识库,探求核心作者群提供了新的思路。

3.4 小世界理论与知识组织

小世界理论(Small world theory)也称为六度分割理论(Six Degrees of Separation theory),它来自数学领域的猜想和社会学领域的实验。六度分割概念始自于1929年的一则小故事。匈牙利作家Frigyes Karinthy在这个小故事里论断,地球上任何两个人都可以通过一条由5位联系人组成的链条联系起来[17]。也就是说,世界上任何两个人,均可以通过不超过6个人建立联系或搭上关系。即,一个人预想结识世界上任何一个陌生人,可通过自己所熟识的那个可能认识这个陌生人的人去结识他,这个熟识的人再通过他所熟识的、可能更靠近那个陌生人的人,依此联系不断进展,这个人可能最多经过6个人就可能和那个陌生人搭上关系。这个故事后来成为数学家的猜想,也得到社会学家的实验证明[17]。六度分割理论让世界变“小”,所以也被人们称为“小世界理论”。

六度分割理论并非是准确的两个人之间需通过6个人才能建立联系,随着现代人类社会交往的密切,网络的普及而增添了更多的交往渠道,人类关系联系更加紧密,可能会使人类的联系链更短。但无论怎样,它却说明了一个问题,世界上任何事物都存在或近或远的联系,这种联系为我们建立信息、数据间的关联提供了理论依据,也为我们建立语义网实现推理性知识服务打下基础。

既然人与人之间通过联系链总能找到某种联系,那么数据、信息、知识也一定存在某种关联。小世界现象在学术文献间的引用网络、知识间的语义网络、词汇(主题词表或叙词表中)间语词关系网络、作者合作研究网络、研究主题的交叉网络等都有很深刻的体现。如果我们把每篇文献、每一个词汇、每一位作者、每一个主题等看作是一个网络的节点,并根据关联关系实现两者之间的联系,构成的网络就是一种小世界现象。

小世界理论的世界事物都存在关联的思想,为我们在寻找数据间关联提供了依据,使我们清楚的认识到,数据、信息或知识在关联或传递中不断提升其价值。将数据、知识间的关系有效地组织,将会大大提升知识服务系统的服务效率。因此,我们可以借助小世界理论,建立复杂网络,并通过复杂网络中数据间的关联,进行数据挖掘和深度分析,发现新的知识,提供解决问题的素材、知识和方案。

当然,在图书情报学领域对小世界理论运用还处在初步阶段,在知识组织领域中还需要我们进一步研究。例如,小世界理论只给出了人与人之间的一般联系,并没有强调人与人之间的关系程度,实际上人与人之间的关系强度在人的交往中是非常重要的一个方面,可能决定两人合作事件的走向。这也提示我们,知识间的联系也有强弱关系,这种强弱关系可能会影响我们对知识网络中的知识发现,因此我们可以设定一个阈值屏蔽数据或知识间的一些弱关系,将强关系凸现出来,这也就是要求我们在知识组织方面如何区别关系的强弱问题。

再者,在小世界理论中,只强调人与人之间存在联系链,但人与人之间具体有什么关系并没凸显。例如,一位社会学家为证实小世界现象,进行一项连锁信件实验,让发件人把信件传给其他城市的陌生人,每一位发信人将信件发给自己熟识并认为最有可能认识目标人的人,最终信件经过不到6个人到达了陌生的收信人手中[17] 。这一实验说明小世界现象并没有改变人与人之间的原有关系,传递的信息并没有得到升华。因此,在知识组织研究中我们必须认识到,知识间的关系是普遍存在的,如果欲实现知识升华,在知识服务中发挥更大效能,需要建立知识间语义关系。

小世界现象在知识组织中还有一个方面需要注意,在人的传递网中,忽略了关系链中两人互逆问题。如,某人有两个朋友A和B,分别支撑着此人的前后朋友链,但A、B两人矛盾很深,如果此人将这两个朋友同时引入朋友圈,这条朋友链就可能崩溃。同样的道理在知识组织中也会出现,这就需要我们在知识组织时需要把各知识元间语义关系都要建立起来,尤其是将知识元之间的主要关系建立起来。

4 结语

科学理论是人类智慧的结晶,是高屋建瓴对相应科学领域的总结。严格地说来,科学理论并不像许多人所认为的那样,是完全抽象的东西,实际上它是实实在在的指导着我们开展科学研究、支持着我们进行科学实验。本文通过对系统科学理论的阐释与理解,对这些理论在知识组织研究中指导作用、理论渗透以及应用价值给出了深刻的解答。如分析了系统论对加强知识组织的整体性、关联性、动态平衡性、等级结构性提出了理论依据;控制论为我们加强数据质量控制和知识的生产流程控制提供了科学有效地方法;信息论为我们探索信息的本质、控制信息熵的增长给出了科学的理论解释;耗散结构理论告诉我们,知识组织就是一种耗散结构,它是在有序—无序—有序的转化过程中使知识得到增长;协同论使我们认识到数据需要协同(关联)才能产生新的知识和发现隐藏规律;突变论解释了在知识存量不断增长、知识爆炸的突变环境下,如何有效地进行知识架构和知识组织。此外,文中还对图书情报学相关理论对知识组织研究的渗透进行了科学阐释,探讨了布拉德福定律、齐普夫定律、洛特卡定律、小世界理论对知识组织提供的理论思想和科学方法。

虽然,知识组织研究所涉及的理论与方法远远不止本文所述,但本文所论及的理论和方法对知识组织研究的指导作用和针对性更加显著,对面向知识服务的知识组织理念形成,提升知识服务系统水平都有很大的帮助。我们也期待着更多的学者加入到知识组织理论的研究中,促进和完善知识组织的理论与实践研究,从而提升我国知识服务的水平。

参考文献:

[1]刘植惠. 系统论、控制论和信息论简述及其在情报学研究中的作用[J]. 情报理论与实践,1988,(5):41-43;(6):41-44.

[2]刘植惠. 耗散结构理论、协同论、突变论概述及其在情报学研究中的作用[J].情报理论与实践,1989,(1):45-48;(2):45-47.

[3]王知津. 知识组织理论与方法[M]. 北京:知识产权出版社,2009:1-212.

[4]柯平,王平. 基于知识资源论的图书馆学基础理论体系研究[J]. 中国图书馆学报,2006,(2):9-14.

[5]周文芳. 论知识组织的系统论原理[J].情报资料工作,2007,(6):50-51,61.

[6]李红春. 系统论与知识组织[J]. 现代情报,2010,(6):20-23.

[7]雷会珠,赵慧清. 图书馆信息资源系统的自组织与熵值变化[J]. 图书情报工作,2010,(增刊):251-253,4.

[8]马费成. IRM-KM范式与情报学发展研究[M]. 武汉:武汉大学出版社,2008:341-364.

[9]邱均平.文献计量学[M]. 北京:科学技术文献出版社,1988:109-195.

[10]化柏林. 情报学三动论探析:序化论、转化论与融合论[J]. 情报理论与实践,2009,(11):21-24,41.

[11]董慧等.基于数字图书馆的本体演化和知识管理研究(Ⅱ)——动态知识组织[J]. 情报学报,2009,28(4):483-491.

[12]温有奎,焦玉英. 基于范畴论的知识单元组织与检索研究[J]. 情报学报,2010,29(8):387-392.

[13]Judit Bar-Ilan,Yifat Belous. Children as architects of Web directories: An exploratory study[J]. Journal of the American Society for Information Science and Technology,2007,(6): 895-907.

[14]Alon Friedman. Concept Theory and Semiotics in Knowledge Organization[J]. Journal of Documentation, 2011,67(4):644-674.

[15]Richard P. Idea Collider: From a Theory of Knowledge Organizationto a Theory of Knowledge Interaction[J]. Bulletin of the American Society for Information Sci-ence and TechnologyVolume,2011,37(4):43-47.

[16]中国大百科全书编辑委员会.中国大百科全书(第二版)(第24卷)[M]. 北京:中国大百科全书出版社,2009:24-556.

[17]《中国情报学百科全书》编委会.中国情报学百科全书[M].北京:中国大百科全书出版社,2010:303,78,191,

13,149,308.

[18]中国大百科全书编辑委员会.中国大百科全书(第二版)(第13卷)[M].北京:中国大百科全书出版社,2009:

13-130.

[19]中国大百科全书编辑委员会.中国大百科全书(第二版)(第25卷)[M].北京:中国大百科全书出版社,2009:

25-161.

[20]中国大百科全书编辑委员会.中国大百科全书(第二版)(第22卷)[M].北京:中国大百科全书出版社,2009:

22-350.

[21]王东波,朱丹浩,苏新宁. 洛特卡现象在汉语词汇句法功能分布复杂度中的呈现[J].情报学报,2012,(3):

297-302.

科技信息论文范文第10篇

第一节 学术论文概述 学术论文或称为学术论文,简称为论文。凡以科学、技术为内容,运用概念、判断、 证明和反驳等逻辑思维手段,进行分析、阐明自然科学的原理、定律和科学技术研究中的 各种问题及成果的文章,都属于学术论文的范畴。 学术论文是一种具创新性的科学研究成果的记录,是进行成果推广和交流的手段,也 是考核科技人员业务能力和学术水平的重要指标。它是人类知识宝库的基本单元,或为人 类精神财富的一部份,并能为科学界有效地利用,对经济建设和社会进步起推动作用。 一、学术论文的特点 (一)、学术性 学术性或称为理论性。学术论文可以取材于某一具体产品,或某一抽象的理论,或某 一具体实验,将其研究过程的资料或发现,经过加工、提炼与浓缩的程序,提升为理论性 的叙述。故学术论文侧重理论的辨证,这些理论和技术成果,且都必须在实践中经过反复 探索、研究而成,实践即是学术论文的源泉。而学术论文如果缺乏学术性,也就失去了它 的基本特性。 (二)创造性 创造性是衡量学术论文价值的根本标准。创造性大,论文价值高;反之,论文价值就低 。这里所谓的创造性是指论文中阐述世人尚未谈过的新理论、新方法、新技术或创造性的 模仿。一篇没有创见的文章,可能具有一定的社会经济价值,但它对科学技术发展不起作 用,也无法提供科技领域新的内容。有些科技成果填补了国内空白,但国外已有,严格言 之应无创造性。 学术论文是记录创造性成果的知识载体,是传递新生的科学信息。有些成果不宜作科 学论文,但可以作科技报告发表。 (三)科学性 『科学性这个词在论文中有多重含义: (1)内容的客观性:论文内容必须是客观存在的事实,即要求科学内容真实、成熟、可行, 而且可重复性。 (2)表达的全面性:论文的科学内容,须用语言、文字或图片等方式表达,并且力求文字简 洁、明确及全面性。 (3)结构的逻辑性:文章结构所显现的科学内容必须符合逻辑推理、论证反驳等思维规律, 其逻辑性强。 (4)格式的标准化:论文写作格式已逐渐趋标准化,必须严格遵守其法则。 (四)可读性 论文中之文字应力求平易通顺,切忌生涩难懂,否则大大削弱文章的社会效果。 二、 学术论文的分类 学术论文包括学位论文。学位论文是学位申请者为申请学位而提出的论文。这种论文 是考核申请者能否授予学位的重要依据,可分为学士论文、硕士论文及博士论文等三种, 其水平由浅而深。学士要求达到具有从事科学研究或担负专业技术工作的初步能力;硕士 要求达到具有独立从事科学研究工作的初步能力;博士则要求达到具有独立从事科学研究 工作的能力和在科学或专门技术上做出创造性的成果。由字数来看,学士论文约一万字, 硕士论文约五万字,博士论文则在五万字以上,有时多达十至廿万字。兹分述如下: (一)学士论文 大学本科毕业生运用在校期间学得的基础理论和专业知识,进行分析、解决某一不太 复杂的科研课题所写的毕业论文,顺利通过签辨者,均可授予学士学位。其条件如下: 1.能够较好地掌握本门学科的基础理论、专门知识和基本技能。 2.具有从事科学研究工作或担负专门技术工作的初步能力。 (二)硕士论文 硕士所提之硕士论文应为指导教授指导下,由研究生本人独立完成者,其论文须有自 己的新见解,并在过程中有一定的工作量。一般用于论文工作的时间约一年左右。其基本 要求如下: 1.在本门学科上掌握坚实的基础理论和系统的专门知识。 2.具有从事科学研究工作或独立担负专门技术工作能力。 (三)博士论文 博士论文对本学科的发展有重要的推动作用,对本学科水平提高有重要的突破。其基 本要求如下: 1.在本门学科上掌握坚实宽广的基础理论和系统深入的专门知识, 2.具有独立从事科学研究工作的能力, 3.在学科或专门技术上做出创造性的成果。 (四)一般学术论文 学术论文是论述创新性研究工作成果的书面文件,是某些实验性、或理论性、或观测 性的新知识的科学记录,或是某种已知原理应用于实际中取得新进展的科学总结。 学术论文的内容应该有所发现、有所发明、有所创造、有所进步,而不是简单重复、 纯属模仿或全盘抄袭前人的成果。学术论文应具有新的信息。 学术论文通常在学术会议上宣读、交流、或在学术报刊上发表等。它反映学科最新的 前瞻科学技术水准及其发展动向,体现了科技工作者拥有的成果。 为进一步探讨学术论文写作特点和规律,应从内容性质和结构形式的差别方面将学术 论文分为理论型、实验型、描述型和设计型等四大类。 理论型论文的重点在于理论证明和分析。依研究对象可分两种:一种以抽象的理论问 题为研究对象,其研究方法重于理论推导和运算;另一种则以客观事物和现象的观测数据 以及有关的文献数据为对象,其研究方法是对有关数据进行分析、综合、概括及抽象化, 并通过归纳、演绎、模拟等过程,提出某种新的理论和见解。一般说来,理论型论文正文 结构型式灵活,没有固定格式,可将研究的对象或结果划分为若干有联系的层面,按一定 逻辑逐层进行论述。 实验型论文的重点在于设计实验以及对实验结果的观察和分析。它也可分两种:一种 是介绍实验本身为目的,重在说明实验装置、方法和内容;另一种是通过对实验结果的分 析和讨论,从而认识客观规律。实验型论文的正文结构与理论型论者不同,主要是由实验 报告的结构演化而来,并已形成一定约定俗成的格式,一般有『材料和方法、『结果 和『讨论等三部份。此三部份仍可做适当调整,其重点内容则必须对实验作说明和分析 。 描述型论文的重点是对研究对象进行描述和说明,向读者介绍新发现的某种客观事物 或现象,重在说明事物或现象。描述型论文的结构通常由描述和讨论两大部份构成。如论 述动、微生物新物种,描述新发现的地质现象,新发明仪器等的论文属之。 设计型论文是指对新产品、新工程等最佳方案进行全面论述的书面技术文件,一般由 设计说明和设计图纸组织而成。其内容有理论或实验,也有设计的描述说明(包括图纸)。 建筑工程方面之论文属之。 上述学术论文的『四分法是相对的,理论型论文中也可能有描述,也会引用一些实 验材料,实验型论文中也有必要的理论分析和描述;描述型论文也不是全无理论分析。但 因研究目的手段不同,各有重点。当然,有些论文可能介于上述几类论文中间,这得看其 归类。 第二节 学术论文的选题 一、科研课题、论文题目与主题的关系 课题、论文题目与主题是三个有区别又有一定联系的概念。科研课题是指人们所围绕 进行研究并想得以解决的科学技术问题。课题一般要经过调研、筛选和可行性论证,最后 才能正式确定。 论文题目就是论文的名称。通常在科研课题完成以后,以整个课题的研究成果或某一 部份写成论文。因而,一个课题可以写一篇或数篇论文。但论文的内涵与延伸不能超越课 题的内涵与外延。 论文主题是作者解决科学技术问题的基本观点,也是论文的中心论点,或课题研究的 结论。因此,主题不等于科研课题,也不完全等于论文的题目。有的论文,题目概括表达 主题内容,但也不是题目就等于主题。亦即,题目和主题是两个概念。 二、学术论文选题 科研成果必须以科学的方式进行提练与再创造,才能成为学术论文,而选题不仅关系 到科研的成败,也是形成学术论文的重要步骤。对此,英国科学家贝尔纳认为『评价和选 择课题,便成了战略的起点。实践证明,只有择适当的课题,才能收到较好的科学研究 成果,写出较有价值的论文。因此,一些著名科学家都是十分重视课题的选择。爱因斯坦 认为:『提出一个问题往往比解决一个问题重要,因为解决问题也许仅是一个数学上或实 验上的技能而已。而提出新的问题、新的可能性,从新的角度去看旧的问题,却需要有创 造性想象力,而且标明科学的真正进步。一些著名科学家重视科研选题,又有洞察世界 某个领域的科研方向、提出新的科研课题的能力,往往可获得令人瞩目的成果。 (一)选题原则 选题是科学研究成败的关键,也与学术论文之撰写休戚相关。在确定科研课题时,必 须以正确思想指导,考虑客观条件及主观作用,选题合适,科研工作较能达其预期结果, 也可为学术论文撰写提供良好的素材。 从选题者立场而言,题目有约束性和非约束性两种。一般来说,参与大计划的研究时 ,研究人员无法依个人旨趣和意愿自行选题,而必须遵从总主持人的分配,故这种选题属 约束性方式。研究者若能获得最大自由度,就其兴趣、意愿选择题目,甚至有可能自行调 动人力、物力相配合者,则属非约束性选题。无论那一种选题,都必须共同遵循科学性、 创新性、应用性和可行性原则。兹说明如下: 1.科学原则 研究课题的内容是否科学,尚待研究中去证实,但其选择,应以前人在该领域取得的成 果(理论与事实)为基础。若违背已知的科学理论与技术事实,就会导致科研工作的失败。 2.创新原则 所选课题要以已知科学理论或事实为基础,且不是已知理论或事实的重复,而是在此基 础上的创新,这才是科学研究的价值。因此,选题时,一般应选前人未做过的,或前人做 过而有谬误或不足的课题。当然,这是一种估计和预测,并不是论文的结论。 3.应用原则 研究课题着重于其实际应用,故其成果以能获得实质效益为原则。由于科学技术的迅速 发展,人类知识之伸展度年年倍增。因此,考虑这类课题时,一要注意信息,避免重复; 二要充分估计课题的完成时间,争取尽快得以应用。 4.可行性原则 选题的可行性是课题满足主观和客观条的要求。从理论和主观上可行的课题,事实和客 观上可能无法实现。因此,要选择主观因素占优势的课题,诸如容易发挥业务专长,经过 自己努力可以做出来的题目,其效果较佳。 此外,选题目时还要考虑经费来源、实验条件及环境污染等方面。这些客观条件不具备 ,再好的题目也难以进行。 (二)选题目的方法 在选题原则指导下,注意选题方法,就会迅速选到适当题目。 1.从实际系统中寻找课题 由于科学技术的飞速发展,新的学科分支已达2500种,各学科交错的情况日益增多,各 学科之间形成一个庞大的体系,因此,有些题目也必然是一个系统工程。 在科学研究或生产过程中,常常会遇到因相互作用或相互依赖下构成的大大小小的系统 ,这些『系统又从属于另一个更大的系统。从考察实际系统之后,会发现一些大小不等 的课题,可以供研究者根据主、客观选择研究。 2.在旧理论和新发现的矛盾中寻找课题 在人类认识过程中,新的发现层出不穷。这些新发现的事实,有时难以用已知的理论去 解释。在这种旧理论与新事实矛盾的地方,有可能潜藏着未知的科学领域。选择这种课题 ,容易有新的突破。 3.在学科史上提出的问题、猜想、假设中选题 这类著名课题,难度大,若能解决科学性,其创新性是无疑的。 4.在多学科交叉的『边缘地带找课题 遗传工程亦称基因工程,是在分子遗传学基础上发展起来的一种新兴技术。它是物理学 、化学渗透到传统生物学之中,使生物学的研究推进到分子以下的层次而形成的新学科。 在上述学科的交叉地带找到科研的课题,往往容易出成果。 当今,科学技术正由专业化向综合化阶段转化,新兴学科、交叉学科和边缘学科不断涌 现,有很多新的课题有待研究。 5.计算技术在各学科开发中提出课题 近年来,计算器应用日趋普遍。以计算器为工具,对实际结果作分析,可以使课题深入 ,获得令人满意的效果;有些过去达不到的计算深度,藉助计算器可以实现。其次,利用 计算器直接作为控制手段并与实验装置串连,这系统的本身是一种创造。选择这类课题也 容易获得成果。 第三节 科学论文的信息 一、何谓信息 人类在认识与改造世界的过程中,主观与客观相互交换的内容称为信息。控制论创始 人维纳说:『信息是我们适应外部世界,并且使这种适应为外部世界所感受到的过程中, 同外部世界进行交换的内容名称。那么,主观与客观相互交换的内容是什么呢?具体说, 就是消息、情报、指令、代码及包含有一定科技内容的符号。随着通信技术和控制论的发 展,信息概念在廿世纪中期普遍被认识后,迅速与材料、能源齐名,成为现代科学技术的 三大支柱之一。 二、信息的特性及分类 信息是社会有机体的一个活跃的要素,是教育的基础。信息的特性如下: (1)既依附于某种介质,又具有独立的意义。 (2)既可生产,又可消失。 (3)既可传递,又可封锁。 (4)既可记录,又可存贮。 (5)既可搜集,又可扩散。 (6)既可浓缩,又可延伸。 (7)既可永久,又可失效。 (8)既可共享,又可独占。 (9)既可消费,又可增值。 (10)既可免费使用,又可成为商品。 信息的分类方法很多,按搜集方式分为两大类: (1)直接信息 直接信息是科技研究人员在科学考察或科学实验中直接获取的数据。如:自己观察的试 验记录(或原始实验记录)、观察日记等等。 (2)间接信息 间接信息是科技研究人员收集到各种文献资料,是第二手或第三手的信息(或称一次文 献、二次文献)。例如:前人积累的事实、数据、理论、方法和假说。可以是书面的,也可 以是其它各种存储信息的载体。 三、信息与科研和科技写作的关系 信息是科学研究和科技写作的基础,信息又是科学研究的产物。从信息论角度看,科 技工作者通过感官接受信息,再由大脑加工和处理(去伪存真、去芜存菁),并向外输出新 的信息。这就是写作的过程,也是信息的接收、处理、输出的传递过程。通过实践检验输 出的信息,即构成信息的使用。在使用中,科技工作者还不断收到反馈回来的信息,并用 来不断改善自己的科研成果。因此,科学研究的全部过程应该看作为一个互相联系,互相 制约的可控系统。 科技写作是科技研究过程中,信息传输的最后一个环节,它是研究成果集中的反映,它 要求作者正确,论据充实、有力。但要达到此目的,是与信息搜集与处理密切相关。所以 ,归根究底科技与写作是以信息为基础的。 随着人类文明的进步,传输信息的方式不断改进,人类征服自然、改进自然的信息日益 增多。这给科技写作提出更高的要求,要求人们创造性地劳动,迅速处理大量的信息,以 便及时交流,取长补短,以满足『信息社会中,其后之科学研究与生产发展的需要,把 科学技术不断推向前进。 四、信息的作用 人是信息的活源泉。一定的信息,只有传递给有关人才能使信息活化、增值,以至创 造财富。 在信息、科学研究和写作的关系上,已揭示了信息的功能。专就写作而言,信息的功 能有: (1)通过信息数据可掌握前人科研成果,明白自已作品的『起点。 (2)通过信息数据了解前人在该领域科研上的经验教训,使自己论文少走弯路。 (3)与论文暂时无关的信息保存和传播,也是有一定科学价值。 五、信息的搜集 信息搜集的含义有四层: (1)信息的接收。这又分前人或同行科研成果的接收和信息源作用于感官的接收(指自己直 接实践时)两种。 (2)信息的求索。这是指主动地去搜集数据,主动地在科研或社会实践中去寻找。 (3)信息的累积。这是指信息的储存,可以是剪报、录音、录像等。 (4)信息的处理。这是指信息的初步加工。例如:分类、选择、归纳,而不是指加工成论文 。只有经初步整理后,信息才变活,才能为我所用。 (一)直接信息的搜集 科技工作者要探索未知世界,获取新的知识,就应从研究对象中直接获取最新的信息, 以便推动科研工作。 1.通过实验获取信息 实验是在较理想条件下,使自然现象(或过程)可控制地重演,并给人们获取第一手资 料。实验方法能够强化研究对象,使其处于极端状态,有利于揭示新的规律。利用实验获 取直接信息的常用方法有: (1).观察记录 在实验时,要全神贯注地观察所有实验现象的细节,并作详尽记录所发生现象的客观条 件。任何现象的微小变化可能带有本质性的信息,而产生某种现象的条件也是重要信息。 例如,第二次世界大战时,有一个飞行员信手抓住飞机舷舱旁的一颗子弹,这是在飞机与 子弹相对运动等于零的条件下出现的。杰出数学华罗庚为了推行优选法,到过二十几个县 市,数以千计的工矿、农村。他观察到,优选法可以在不添人员,不添设备,不增加投资 的情况下,收到优质、高产、低耗的效果。 在观察时,需要选择观察时间与观察点。如,观察哈雷慧星,不能选在皓月当空或艳阳 高照的时分,也不是站在任何地方到处乱找,否则会事倍功半或亳无结果。 (2).测量记录 实验中常常要对某些现进行定量测量。实验得到的数据,是反映自然现象的重要信息, 应认真作好记录。为揭示事物的本质特征,有时要重复实验,要记录一连串数字,同时, 要用精密仪器,良好的测试方法等,以便获得更准确的信息。 (二)通过考察获取直接信息 科技工作者在对研究对象不加任何干涉的条件下进行观察的过程就叫考察。考察和实 验不同。它要求选好观察点后细心地观察每一个细节。考察是十分复杂的事,必须紧紧围 绕科研中提出的问题进行深入细致地观察;其次,有用的信息是纷繁的事实中选择出来的 ,然后才可用这些真实的信息说明问题。 考察(特别是野外考察)是异常艰苦的工作,需要有吃大苦,耐大劳的精神,需要有踏 实细致的作风。有人说:「直接的信息渗透着考察者的血汗,这话毫不过分。 (三)间接信息的搜集 科技文献、情报数据及其它存储的科技信息,均叫间接信息。间接信息可分为书面存 储和非书面(包括计算器软件、微缩照相、电视录像、电影等)存储信息两大类。下面简单 介绍书面文献的分类和搜集方法: 1.一次文献的搜集 记录有知识的一切载体称为文献。书面文献可以分一次、二次和三次文献等。一次文 献又叫一级文献。它是直接从事研究的科技工作者所写的文字数据,是新技术、新知识、 新发明等新的科研成果的记载和报导。 一次文献包括:科技专著、论文期刊、科技报告、专利文献(主要指专利说明书)、教 科书、技术标准和其它有一定价值的文献(如学位论文、内部学术报告等)。 一次文献的搜集一般分四步进行: (1)检索准备,即分析研究课题基础,明确检索范围。 (2)选择检索工具。 (3)确定检索途径和选择检索法。 (4)根据文献线索找原始文献。 2.二次文献的搜集 二次文献又称为二级文献。是在一次文献基础上,经过加工、压缩后产生的数据,以 便作为查找一次文献的检索工具。二次文献功能如下: (1)广泛了解科技动态创造条件。当今是信息的社会,要想通过一次文献的阅读来全面了解 本学科或本课题的动向简直不可能。然而,二次文献是经过加工、摘要、提炼的文献资料 ,为科技工作者广泛了解科技动态提供了方便的工具。 (2)为查找一次文献提供线索。通过题录、文摘、索引等二次文献,可以很快找到你需要的 一次文献。 鉴于上述二次文献的功能,世界各国都十分重视二次文献的处理工作,这些文献在一 般图书馆均有收藏,也有建在网络上供人查寻。 3.间接信息的其它搜集方法 (1).采访。除查阅文献数据外,通过采访或专访都可得到有用的书面信息。国外有人出售 信息,国内也有科技咨询机构。 (2).参加会议、展览会,搜集书面信息。专业会议往往信息量大,信息也较集中,参加会 议可以受益非浅。在产品或科技成果展览会、博览会上,都可得到有用的书面信息。 (3).交换、索取。除了数据交换,有时可与其它构相互交换一些信息,以充实自己的『资 讯库。当你从信息流中发现了信息源,正好符合自己的需要,就可写信求索。有时这样 也可得满意的信息。 4.科技信息的利用 一次文献数据在科技信息中占有重要地位,常常散见于图书期刊中。正确利用这些材 料,往往是学术论文写作的关键。 通过文献检索或其它途径获得的文献数据,还必须通过阅读、取舍,才能为己所用。 阅读文献资料,也有决窍。若要取得满意的效果,可按下列步骤进行: (1).又读中文数据,后读外文数据。 (2).先读综合性数据,后读专题性资料。 (3).先读近期数据,后读历史性资料。 (4).先读文摘,后读全文。 (5).先粗读,后精读。 科技信息的搜集需日积月累的进行,经过阅读的文献数据,还要进行鉴别,然后决定 取舍,或用作撰写论文,或作保存,以备后用。随着科学技术的发展,实验测试条件的变 化,文献资料也要更新与发展,人们的疏漏也在所难免。因此,要用科学的方法加以鉴别 ,通常采用比较法分清材料的真伪,判明材料之可用程度。一般所用的比较方法是:把内 容相关的不同国家、机构或作者的数据相比较,把数据本身的论点和论据相比较,把实验 数据与生产数据相比较,把历史数据与近期数据相比较,把一般数据与权威数据(如手册等 )相比较等等。 经过鉴别的材料就可以『据为己有,主要的方法有: 1.卡片法 一次文献散见于书期刊的海洋中,有时查阅总感不便。对常用或已得到的文献资料, 总想自己保存,但日积月累,往成了死材料。为避免混乱,且容易调动材料,应作文献卡 片。然后分门别类放入卡片盒中,以利查用。 2.笔记法 笔记可摘录科技信息的精华。一种整理办法是在笔记本前留几页空白,随时编上笔记 内容的目录或分类索引,在笔记封面写上年月;另一种办法是准备若干本笔记,把自己要 搜集的内容分别记在有关笔记本上,在笔记本封面写上主题内容和起讫年月;第三种方式 是将笔记上内容转录在规格统一的纸上,或将笔记上相关主题之页剪下贴在标准纸上,写 下标题,放在不同纸袋或夹子中,袋面或夹面注明有关主题内容或主要文章篇目。此部份 亦可利用计算机进行登录。 3.科技信息目录 目录有两大类:一是告诉人们阅读什么材料,称为书目;另一是告诉人们什么地方有 什么数据,称藏书目录。除了文献检索用的有关目录外,在自己搜藏的书刊中对你有用的 篇目最好及时地写在图书目录卡上,以便查找。 以上整理工作,看起来很麻烦,但比起你毫无头绪地查找数据是方便多了。而且往往 可利用零散时间进行。 第四节 学术论文的写作格式 在总结前人撰写学术论文共同规律的基础上,人们找到了一种最明确、最容易理解的论文 基本格式,按照这种基本格式写作,便于作者整理材料,便于比较完整地表达研究成果, 也便于读者阅读理解。从国内外情况看,学术论文的基本格式正趋于统一化、规范化和标 准化。当然,在注意基本格式的共同性时,还应照顾到不同学科,不同课题在表达形式上 的差异。 如何撰写论文摘要 冯丁树 一、摘要的定义 ------------------------------------------------------------------------------ -- 1. 美国国家标准定义(ANSI Z39.14, 1979):一篇精确代表文献内容简短文字。 2. 中国国家标准定义(CNS 13152, 1993):一篇精确代表文献内容简短文字,不多加阐释 或评论,也不因撰写摘要的人不同而有差异。 依据上述的定义,显然摘要与论文中由作者所写的摘要略有不同,这种摘要以资 讯性或指示性的成分居多,往往非作者本文所写。在英文中,与摘要有关的英文字有ABST RACT, SUMMARY与 SYNOPSIS等三种,严格而言,ABSTRACT较属摘录性质,在专业性数据库 中查询时用之;SUMMARY则有摘要或概要的意思,真正的定义是指作者再度扼要陈述全文较 突出的发现或结论。SYNOPSIS亦有概要及大意之意,系指作者本文对全文概略描述。故此 处所述之摘要应指以论文作者为主之陈述性质,或为英文所指之SUMMARY,虽然有时仍然混 用。 二、论文摘要的特质 基本上,摘要为独立的单元,通常分中文摘要与英文摘要两部份。两者常出现于每篇 论文题目之后、本文之前(但亦有置于文后者),其顺序是中文摘要在前,英文摘要在后。 摘要是整篇文章的缩影,其内容应能反应整篇文章的精髓。有许多人参考到本文时,首先 接触到的应为摘要部份,计算机之搜寻最终之内容仍为摘要之内容,故摘要所能传达的信息 相当重要。 摘要之内容应以简短的方式述明整个研究之来龙去脉与结果,由为什么做,如何 做到有何发现及所得之结论等等,因此摘要中,不可含有历史背景、前言、老旧信息、标 准方法之细节、未来研究之构想、原始数据数据及与本文无关之意见等。 三、摘要之主要内容 一般人阅读摘要时,所搜寻的指标包括目的与范围、方法、结果或成果、结论及任 何其它支持或的信息。兹就其主要内容分述如下: (1).指出目的与重要性:指出此项研究之特定目的,若标题中已能经清楚表明,则可不必 在摘要内重复说明。 (2).材料与方法:说明研究中所用之材料及品系资料,简短地说明实验设计的模式,必要 时叙述实验的方法、所用条件及所加之限制等。 (3).结果:结果之说明应有选择性。仅就工作中重要的、新的或显著的发现或观点加以挑 明。重要的数据应在此提出作为左证。 (4).结论:结论亦非常具选择性的,仍以重要者为主,但简短说明即可,避免使用毫无新 义之文句,例如:『结果业经充分讨论过,『有关造成此种不正常的原因已在文中列出 ...,『一种以本发现为基础而发展的方法已在文中说明等等。 摘要之内容虽有上面四项之分述,但最好能文简意核,语意流畅。摘要之长度大 部份因期刊之要求而有限制,可参阅各期刊之说明。一般之硕、博士论文,则以一页为度 。其长度视文章长度、主题范围、重要性等而定,依字数而言,中文摘要约150至500字, 英文摘要约在100至300字。内容须完整易于了解,切忌以条列式书写法。中英文摘要之内 容须一致,且于末尾应注明中英文关键词。 四、撰写摘要注意事项 摘要之撰写通常在整篇论文将近完稿期间开始,以期能包括所有之内容。但亦可提 早写作,然后视研究之进度作适当修改。有关论文摘要写作时应注意下列事项: (1).整理你的材料使其能在最小的空间下提供最大的信息面。 (2).用简单而直接的句子。避免使用成语、俗语或不必要的技术性用语。 (3).请多位同僚阅读并就其简洁度与完整性提供意见。 (4).删除无意义的或不必要的字眼。但亦不要矫枉过正,将应有之字眼过份删除,如在英 文中不应删除必要之冠词如a, an, the等。 (5).尽量少用缩写字。在英文的情况较多,量度单位则应使用标准化者。特殊缩写字使用 时应另外加以定义。 (6).不要将在文章中未提过的数据放在摘要中。 (7).不要为扩充版面将不重要的叙述放入摘要中,即使摘要仅能以一两句话概括,就让维 持这样吧,切勿画蛇添足。 (8).不要将文中之所有数据大量地列于摘要中,平均值与标准差或其它统计指标仅列其最 重要的一项即可。 (9).不要置放图或表于摘要之中,尽量采用文字叙述。 五、主键语 为利于计算机数据查询作业,目前已有许多期刊均需加上主键语,论文中亦然。主 键语采用具代表性的词句,可为一组、二组或三组,但请勿超过五组以上。若无法作适当 选择,亦可参考一般索引内之词汇。主键语必须中英文并列,可分别列于各摘要之后,以 『主键语:xxx, xxxx或『 KEYWORDS:xxx, xxx的型式表示。 论文中常用术语 ================================= AN EXPLANATION OF PHRASES COMMONLY USED IN SCIENTIFIC LITERATURE ================================= "IT HAS LONG BEEN KNOWN..." - I didn't look up the original reference. "A DEFINITE TREND IS EVIDENT" - These data are practically meaningless. "WHILE IT HAS NOT BEEN POSSIBLE TO PROVIDE DEFINITE ANSWERS TO THE QUESTIONS ..." - An unsuccessful experiment, but I still hope to get it published. "THREE OF THE SAMPLES WERE CHOSEN FOR DETAILED STUDY" - The other results didn't make any sense. "TYPICAL RESULTS ARE SHOWN" - This is the prettiest graph. "THESE RESULTS WILL BE IN A SUBSEQUENT REPORT" - I might get around to this sometime, if pushed and/or funded. "IN MY EXPERIENCE" - Once. "IN CASE AFTER CASE" - Twice. "IN A SERIES OF CASES" - Thrice. "IT IS BELIEVED THAT" - I think. "IT IS GENERALLY BELIEVED THAT" - A couple of others think so, too. "CORRECT WITHIN AN ORDER OF MAGNITUDE" - Wrong. "ACCORDING TO STATISTICAL ANALYSIS" - Rumor has it. "A STATISTICALLY-ORIENTED PROJECTION OF THE SIGNIFICANCE OF THESE FINDINGS " - A wild guess. "A CAREFUL ANALYSIS OF OBTAINABLE DATA" - Three pages of notes were obliterated when I knocked over a glass of beer. "IT IS CLEAR THAT MUCH ADDITIONAL WORK WILL BE REQUIRED BEFORE A COMPLETE UNDERSTANDING OF THIS PHENOMENON OCCURS" - I don't understand it. "AFTER ADDITIONAL STUDY BY MY COLLEAGUES" - They don't understand it either . "THANKS ARE DUE TO JOE BLOTZ FOR ASSISTANCE WITH THE EXPERIMENT AND TO CINDY ADAMS FOR VALUABLE DISCUSSIONS" - Mr. Blotz did the work and Ms. Adams explaine to me what it meant. "A HIGHLY SIGNIFICANT AREA FOR EXPLORATORY STUDY" - A totally useless topic selected by my committee. "IT IS HOPED THAT THIS STUDY WILL STIMULATE FURTHER INVESTIGATION IN THIS FIELD" - I quit. 文后参考文献着录规则 我国GB 7714—87《文后参考文献着录规则》,规定采用“顺序编码制”和“著者出版年制”两种为我国着录文后参考文献的国家标准。按规定,在科技论文中,凡是引用前人(包括作者自己过去)已发表的文献中的观点、数据和材料等,都要对它们在文中出现的地方予以标明,并在文末列出参考文献表。 1 在正文中引用参考文献 一项科学研究取得的新成果通常是在前人成果的基础上的新进展,它体现着科学科技的继承和发展。如,基于已有的理论、方法、思想、实验手段等,使本研究获得了新进展,有了新发现;或是将一个学科中的方法移植到另一学科中并取得成功;或是对已有方法做了改进。当在论文中叙述研究目的、设计思想、建立的模型、与已有结果进行比较的时候,就要涉及到已有的成果。如果在涉及到前人成果的地方再把已有成果的具体内容抄到论文当中,不但占去论文的篇幅,冲淡论文的主题,而且抄写这些已发表过的、读者可以查找到的内容是毫无意义的。所以,在论文涉及到已有成果的地方,不去重抄已有的成果,而是指出登载这个成果文献(出处),这种做法叫做引用参考文献。引用了参考文献,就要在涉及前人成果的地方做一个标记,见到这个标记,读者就知道在这里引用了参考文献;按照这个标记在参考文献表中就能找到刊登这个成果的详细内容的文章。在正文中引用参考文献的地方加一个标记,称为参考文献的标注。标注的方法称为标注法。 2 参考文献着录的目的和作用 对于一篇完整的学术论文,参考文献的着录是不可缺少的。归纳起来,参考文献着录的目的与作用主要体现在以下5个方面。 1) 着录参考文献可以反映论文作者的科学态度和论文具有真实、广泛的科学依据,也反映出该论文的起点和深度。科学技术以及科学技术研究工作都有继承性,现时的研究都是在过去研究的基础上进行的,今人的研究成果或研究工作一般都是前人研究成果或研究工作的继续和发展;因此,在论文中涉及研究的背景、理由、目的等的阐述,必然要对过去的工作进行评价,着录参考文献即能表明言之有据,并明白交待出该论文的起点和深度。这在一定程度上为论文审阅者、编者和读者评估论文的价值和水平提供了客观依据。 2) 着录参考文献能方便地把论文作者的成果与前人的成果区别开来。论文报道的研究成果虽然是论文作者自己的,但在阐述和论证过程中免不了要引用前人的成果,包括观点、方法、数据和其它资料,若对引用部分加以标注,则他人的成果将表示得十分清楚。这不仅表明了论文作者对他人劳动的尊重,而且也免除了抄袭、剽窃他人成果的嫌疑。 3) 着录参考文献能起索引作用。读者通过着录的参考文献,可方便地检索和查找有关图书资料,以对该论文中的引文有更详尽的了解。 4) 着录参考文献有利于节省论文篇幅。论文中需要表述的某些内容,凡已有文献所载者不必详述,只在相应之处注明见何文献即可。这不仅精练了语言,节省了篇幅,而且避免了一般性表述和资料堆积,使论文容易达到篇幅短、内容精的要求。 5) 着录参考文献有助于科技情报人员进行情报研究和文摘计量学研究。 3 参考文献的着录原则 1) 只着录最必要、最新的文献。着录的文献要精选,仅限于着录作者亲自阅读过并在论文中直接引用的文献,而且,无特殊需要不必罗列众所周知的教科书或某些陈旧史料。 2) 只着录公开发表的文献。公开发表是指在国内外公开发行的报刊或正式出版的图书上发表。在供内部交流的刊物上发表的文章和内部使用的资料,尤其是不宜公开的资料,均不能作为参考文献引用。 3) 引用论点必须准确无误,不能断章取义。 4) 采用规范化的着录格式。关于文后参考文献的着录已有国际标准和国家标准,论文作者和期刊编者都应熟练掌握,严格执行。 5) 参考文献的着录方法。根据GB 7714—87《文后参考文献着录规则》中规定采用“顺序编码制”和“著者出版年制”两种。其中,顺序编码制为我国科技期刊所普遍采用,所以这里作重点绍。 4 顺序编码制 顺序编码制是指作者在论文中所引用的文献按它们在文中出现的先后顺序,用阿拉伯数字加方括号连续编码,视具体情况把序号作为上角或作为语句的组成部分进行标注,并在文后参考文献表中,各条文献按在论文中出现的文献序号顺序依次排列。 4.1 顺序编码制参考文献着录项目 1) 主要责任者。是指对文献的知识内容负主要责任的个人或团体,包括专著作者、论文集主编,学位申请人、专利申请人、报告撰写人、期刊文章作者、析出文章作者等。多个责任者之间以“,”分隔,责任者超过3人时,只着录前3个责任者,其后加“等”字(英文用 et al )。注意在本项数据中不得出现缩写点“.”。主要责任者只列姓名,其后不加“着”、“编”、“合编”等责任说明文字。外文主要责任者用原著,姓名前后应遵重各国的习惯。作者不明时,此顶可省略。 2) 文献名及版本(初版省略)。文献名包括书名、论文题名、专利题名、析出题名等。文献名不加书名号“《 》”。 3) 文献类型及载体类型标识。根据GB 3469—83规定,以英文大写字母方式标识以下各种参考文献类型: 专着[M],论文集[C],报纸文章[N],期刊文章[J],学位论文[D],报告[R],标准[S],专利[P] 对于专着、论文集中的析出文献,其文献类型标识建议采用单字母“A”;对于其它未说明的文章类型,建议采用单字母“Z”。 对于数据库(database)、计算机程序(computer program)及电子公告(electronic bulletin board)等电子文献类型的参考文献,建议下列字母作为标识:数据库[DB],计算机程序[CP],电子公告[EB]。 电子文献的载体类型及其标识。对于非纸张型载体的电子文献,当被引用为参考文献时需在参考文献类型标识中同时标明其载体类型。建议采用以下标识:磁带(magnetic)[MT], 磁盘(disk)[DK], 光盘[CD], 联机网络(online)[OL]。 电子文献类型与载体类型标识基本格式为 [文献类型标识/载体类型标识]例如: [DB/OL]——联机网上数据(database online); [DB/MT]——磁带数据库(database on magnetic tape); [M/CD]——光盘图书(monograph on CDROM); [CP/DK]——磁盘软件(computer program on disk); [J/OL]——网上期刊(serial online); [EB/OL]——网上电子公告(electronic bulletin board online); 以纸张为载体的文献在引做参考文献时不必注明其载体类型。 4) 出版事项(出版地、出版者、出版年、卷期号等)。出版地指出版者的城市名,对于同名异地或不为人们所熟悉的城市,可在其名前附加省名、州名、国名等。对于出版者中包含了地名,出版地不能省略,如,“北京:北京大学出版社”,不能写成“北京大学出版社”。出版者为出版社名,可按来源的形式着录,也可以按公认为的简化形式缩写形式着录。如IRRI(原标识International Rice Research Institute)。出版年采用公元纪年,并用阿拉伯数字着录。如遇其它纪年形式时,可将原有的纪年置于“( )”内,如1705(康熙四十四年)。对于报纸和专利文献,要着录出版日期,其形式为YYYY-MM-DD.对于期刊的出版年份、卷号(期号)着录有以下3种形式:1980,92(2):年,卷(期); 1985(4):年(期); 1987,5:年,卷 5) 文献出处或电子文献可获得地址。 6) 参考文献起止页码。参考文献的最末一项一般为“页码”,指引文所在的位置编码。应着录引文所在的起始页码或起止页码,如为起止页,则在2个数字之间用“-”号(原来用“~”号)连接。如:10-12。若论文中多次引用同一文献上的多处内容,则应依次着录相应的引文所在

上一篇:信息科技论文范文 下一篇:产业技术论文范文

友情链接