数学建模的含义范文

时间:2023-12-25 17:14:39

数学建模的含义

数学建模的含义篇1

关键词:语义对象模型;三维场景建模;面向对象

中图分类号:TP317.4 文献标识码:A文章编号:1007-9599 (2011) 11-0000-02

SOM-Based Three-Dimensional Scene Modeling

Ye Haishan

(School of Computer Science,Guangdong Polytechnic Normal University,Guangzhou510665,China)

Abstract:SOM-based data modeling approach applied to three-dimensional scene modeling,explained its thinking and modeling process modeling,analysis of the advantages of this modeling approach,the final model is given to the building model as an example an instance.

Keywords:Semantic object model;Three-dimensional scene modeling;Object-oriented

一、引言

模型是对现实世界中事物或现象的简化、抽象和模拟,它建立在人们对事物或现象认识的基础之上,同时又是进一步获取客观规律的方法和手段。不同的模型反映了人们不同的认识观念、应用目的和分析方法。

三维场景数据模型是关于三维场景数据组织的概念,反映现实世界中三维场景实体及其相互之间的联系,为三维场景数据组织、场景生成、三维渲染和交互浏览的设计提供基本的概念和方法。三维场景数据模型是三维空间信息可视化系统的核心,对三维场景数据模型认识和理解的正确与否在很大程度上决定着三维空间信息可视化系统研制的成败。

三维空间信息数据模型可分为体元模型、矢量模型、混合模型和分析模型。本文采用基于语义对象的混合型空间数据模型――语义对象模型(Semantic Object Model,SOM)来对三维空间实体进行建模。

二、语义对象模型

(一)数据库建模中的SOM。

SOM的概念来源于数据库设计中的数据建模。传统的E-R模型是面向记录的,很难描述客观实体之间的语义联系。语义数据模型(Semantic Data Model)是一种结合了面向对象思想的模型,具有较强的语义功能。语义的含义是“有意义的”,强调数据对用户的含义。语义对象(Semantic Object)是对问题域中的某些可标识的对象。SO在逻辑上是个三元组,表示为

SO::=

其中,ID是SO的标示符,它唯一地标示一个语义对象;S是SO的语义信息(属性)的集合;O是SO的对象数据(各属性对应的取值)的集合。

基于SOM的建模是以用户数据的含义为中心的一种建模方法。它把SO看作基本出发点,SO是用户世界的原子,是用户要处理的最小可分辨的单元。用SOM建模能模拟真实世界实体,设计出较为实用的数据库结构。

(二)三维建模中的语义对象模型

与数据库设计中数据建模类似,在三维空间信息建模中,三维场景中的语义对象SO是描述一个确切的三维场景实体的属性的命名集合。将场景中的任一实体视为一个语义对象,并对它们进行分类。下面是一种对三维场景语义对象常见的分类法:

1.零维语义对象――包括独立点状地物、纯节点、结点地物,可用来描述独立的点状地物,例如树,公路界碑、路灯等;2.一维语义对象――包括独立弧段、线状地物。线状地物由一条或若干条弧段组成。在电力线,通讯线,管网等设施等可以作为线语义对象描述;3.二维语义对象――包括面状地物,例如宽广的道路、游泳池等等;4.三维语义对象――包括体元和一些较为简单的实体对象,它是由若干低维语义对象构成。例如城市中的建筑物以及构成建筑物的简单几何体元等;5.复杂语义对象――由若干个低维语义对象构成,它作为一个整体带有属性描述信息,但里面包含的低维对象又有自身的属性描述信息。如一个综合大厦包含构成大厦的主体建筑物和附属建筑物以及如供热、供电等管网系统等。

由于SOM是对三维实体的含义来建模的,跟其他三维空间数据模型相比,它更接近于我们对三维实体的理解与认识,可以直接表达层次结构和一对多的对象嵌套关系。它不仅支持变长记录,而且支持对象的集合。

三、基于语义对象模型的三维场景建模

(一)建模思想

基于SOM的三维场景建模采用了面向对象的思想进行建模,其核心思想有以下4个:

1.分类。同类对象的集合,具有相同特征的对象组合在一起形成类,每个对象是该类中的一个实例。如在建筑物建模中,将建筑物分为几类,如三角顶CTrihouse、人字顶CMenhouse等。2.概括。将若干种类型中某些具有公共特征的部分抽象出来,形成一种更一般的超类,如水塔、路灯、烟囱等在表示时都具有点的特征,把它抽象出来形成点状地物。3.组合。将同一类对象的若干个对象组合起来,设立一个更高水平的对象,例如若干栋宿舍组合成一个家属小区。4.聚集。聚集有点类似与组合,不过它是将不同特征的对象组合称一个更高水平的对象。如若干建筑、管网、道路等市政设施构成一个城区。

(二)语法规则与语义规则

语法规则用来从空间信息数据库中提取对象的语义信息,它与具体的空间信息数据库密切相关。建立语法规则是一个需要经过多次反复的过程,必须详细了解和分析空间信息数据的逻辑数据模型和物理数据模型,同时根据所要表达语义对象来建立语法规则。

语义规则用来将语义信息用语义数据来表达。对于任意一种语义对象,SOM建模都必须为其制定一个相应的语义规则来表达。

下面是三维场景语义规则集部分代码:

坐标点CoordPoint={double x,double y}

节点Node={int NodeID,CoordPoint Coord}

弧段Arc={int A rcID,[CoordPoint Coord1,CoordPoint Coord2,…,CoordPoint CoordN],int LeftNodeID,int RightNodeID,int LeftPolyID,int RightPolyID}

实体点EntityPoint={int EntityID,CoordPoint Coord,int UserID}

实体线EntityLine={int EntityID,[int Arc1ID,int Arc2ID,…,int ArcNID],int UserID}

实体面EntityArea={int EntityID,[int Arc1ID,int Arc2ID,…,int ArcNID],int UserID}

复杂实体EntityComplex={int EntityID,[int Object1ID,int Object2ID,int Object3ID],int UserID}

基于上面的规则集,将树用如下语义规则表示:

Tree={int EntityID,CoordPoint Coord,int Type,double Height}

其中,EntityID为该树的标示,用它将该树跟其他对象区分开来;Coord表示该树的几何坐标位置,Type表示树种(如用“1”表示梧桐树、“2”表示榕树),Height表示树高。

这样,我们可以将如下语义数据通过上面的语义规则解释为两棵梧桐数和一颗榕树。

1,34.321,45.784,1,6;

2,98.875,45.897,1,9;

在这个例子中,采用SOM模型的树的语义对象数据表示其数据量非常小,只用40个字符就表示了一颗梧桐树和一颗榕树。对比体模型和矢量模型,其数据量大大降低。

(三)建模过程

基于SOM的三维建模的主要有四步:

1.确定语义对象;2.制定语法、语义规则;3.从空间信息数据库中根据语法规则集提取三维对象的语义信息;4.根据语义规则用语义数据描述三维对象的语义信息。

(四)优点

基于SOM的三维场景建模的主要优点是:

1.用对象的语义数据就可以标识(表示)该实体,大大简化了数据结构,加速了场景的生成。2.有表示和构造复杂对象的能力。它可以模拟复杂的现实世界,即无论怎样复杂的事例都将模型化为一个对象,这样表示更接近于我们对三维实体的理解与认识,易于快速建立三维模型。3.封装性和信息隐蔽技术提供了模块化机制。每个对象包含数据集和操作集,用对象封装技术将它们封装起来,其外部只提供一个抽象接口,看不到实际的细节,具有信息隐藏的功能。4.继承和类层次技术提供了重用机制。例如为所有建筑物建立一个类CHouse对于任何一个建筑物来说,可以通过定义具体的CHouse类或由CHouse类派生得到如三角顶建筑可定义为它的派生类CTri House建筑和建筑之间的语义连接可通过定义几个成员函数来完成。

四、建模实例:基于SOM的建筑物模型

建筑物模型是在三维场景建模研究中重要的数据类型,它的细致程度将决定整个三维场景模型的复杂程度。建筑物的外形各异,对于建筑物的三维重建而言,无法采用一个通用的几何模型来表达各类建筑物。对于复杂建筑物,尽管总体外形特征不同,但是可以分解为多个基本类型结构的组合,这样就可以用多个典型建筑的组合来表示一个复杂建筑。因此,在场景生成时可将建筑物按其外形特征进行分类,划分为若干个基本类型的建筑或建筑单元,然后根据外形特点分别对每一类建筑物采用不同的数据模型。可以将常见的建筑物模型以建筑物屋顶为划分准则,分成以下几种典型建筑模型:平顶建筑、楔形建筑、圆顶建筑、棱锥形尖顶建筑、棱台形建筑和多顶点楔形建筑。

对于典型建筑的语义对象模型,其语法规则可以用3.2小节所示的语法规则来定义,其语义规则可定义为如下:

Building=

{

int ID; //建筑物号

int iType; //建筑物类别:1为平顶建筑,2为楔形建筑,3为圆顶建筑,…

int iVertexNum; //屋顶角点数目

Geometry geo; //屋顶几何结构

string strTexObjectName; //纹理物体号

float fHeight; //建筑物高度

}

从以上语义规则来看,对建筑物的屋顶结构用Geometry语义对象模型来描述,Building模型中其他参数主要用来描述建筑物侧面的几何和纹理信息。因为对于城市中大部分建筑物来说,不管其外形如何复杂,总体上可划分为屋顶和侧面两大结构,屋顶结构复杂,因此采用语义对象模型对其进行描述。对于建筑物的侧面结构而言,它总是铅垂的,因而其描述较为简单。

五、结论

用基于SOM的建模方法来对三维空间实体进行建模,可以在模型生成质量(模型精确度)和模型生成效率(包括传输数据量和渲染速度)之间寻找一个平衡点。我们已经成功将这种建模方法应用于基于Web的房地产建设项目远程可视化管理系统中。实践证明,这种方法特别适用于于远程网络环境下,在客户端能快速地生成三维图形。三维场景建模是一项庞大的系统工程,对各种对象进行有效建模是必要基础,基于SOM的三维场景建模的研究与应用仍在探索之中,有待进一步扩展和完善。

参考文献:

[1]陈昕,高明,宋瀚涛.基于语义对象模型的无结构化数据集成的研究[J].计算机工程与应用,2003,5

[2]李清泉,李德仁.三维地理信息系统中的数据结构[J].武汉科技大学学报,1996,21:2

[3]俞春,陈怀楚,王映雪.基于语义的数据库信息模型[J].清华大学学报,1999

[4]唐中元,吴桂先.基于语义对象模型数据库设计技术的研究与实现[J].计算机工程与应用,2003,9

[5]胡自峰.面向目标的栅格矢量一体化三维数据模型[J].武汉测绘科技大学学报,2004

[6]廖明潮,高洪波,何健.语义对象模型及与E-R模型的比较[J].武汉工业学院学报,2003,22:4

[7]龙可军.语义数据模型概述[J].科技信息,2009,13

数学建模的含义篇2

【关键词】小学数学 “数学建模” 教学模式

【中图分类号】G623.5 【文献标识码】A 【文章编号】2095-3089(2016)09-0121-01

前言:在我国传统的小学数学教学中,数学教师往往较为重视对学生解题能力的培养,这种培养虽然提高了学生的数学分数,但对于学生本身的数学思维能力的提高稍显不足,而如果能够在小学数学教学中较好的应用“数学建模”教学模式,就能够有效提高小学数学的教学效果,切实提高学生的数学素养,对于小学生的未来数学学习有着不俗的推动作用。

一、小学“数学建模”教学模式的内涵

所谓的“数学建模”教学模式,指的是学生在数学教师预设的数学相关教学情境中,通过一定活动建立、解释以及应用数学模型,以此完成具体数学知识学习的过程。在小学“数学建模”的教学模式中,引导学生在这种教学模式下理解新知识、发展新能力以及形成新思想成为了主要目的,所以数学教师需要在应用数学建模这一模式时,创建出“问题-模型-应用-问题”这一循环往复的教学过程,并以此切实提高学生的自主学习意识与问题探究能力。

二、小学“数学建模”的教学模式

数学建模一般由现实问题、假设简化、建立模型、模型求解以及结果检验几个步骤构成。对认知发展水平处于具体运算阶段的小学生而言,建模教学的开展除了遵循以上几个步骤,还在操作形式上需要具备适当的灵活性。

(一)创建数学模型情境

在小学“数学建模”教学模式提出现实问题这一环节中,教师需要根据实际数学教学内容,设计出用于数学建模的数学问题,这一问题需要同时保证贴近学生生活且符合教学内容,在确定问题后,教师就需要结合问题创建数学模型情境。

(二)探索数学模型问题

在小学“数学建模”教学模式假设简化这一环节中,突出了学生的主体地位,只有学生将教师创建出的数学模型情境转化为实际数学问题,才能保证小学“数学建模”教学模式的顺利进行。值得注意的是,如果上一步中教师创建的数学模型情境不能得到学生的正确解读,就无法充分展现这一模式的优势,因此教师需要在此过程中对学生进行不着痕迹的引导。

(三)揭示数学模型本质

学生从数学模型情境中解读出数学问题后,就可以在建立模型这一步骤中通过模型的建立,对刚刚解读出的问题进行解决,这种模型的建立本质上属于一种思维方法,关系着学生在这一教学模式中自身数学思维能力的提升。

(四)理解数学模型含义

在完成上一步骤中的解题模型建立后,学生就可以进行具体的模型求解,以此实现学生真正理解数学模型含义,切实提高自身数学思维能力。这里指的理解数学模型含义,也就是指学生需要切实理解本节课中所涉及的数学知识,切实提高学生的数学知识掌握。

(五)体验数学模型价值

在完成上述一系列步骤后,我们需要对小学“数学建模”教学模式应用后的结果进行检验,在这一过程中,每一次对数学模型的应用都是对这一教学模式的检验,为此教师可以灵活的运用小学“数学建模”教学模式,不必拘泥于流程,这样就能够较好的进行体验数学模型价值检验,切实提高学生的数学思维能力。

三、小学“数学建模”教学模式的应用实例

在小学“数学建模”教学模式中,结合教学实际进行数学建模是这一教学模式最重要的内容,数学中的“相遇问题”就是应用该模式的典型案例:在提出现实问题环节中,教师可以提出“甲、乙两车同时从A、B两地出发相向而行,两车在距离A地80千米处相遇并继续行驶,并在到达A、B两地后返程,最终在距离甲地60千米处再次相遇,求甲乙两地间路程”这一问题,并在假设简化环节中引导学生将这一问题转变为数学模型。在建立模型这一环节中,学生需要设第一次相遇地点距离A地位S1,第二次相遇地点距离A地位S2,这样学生就可以得出AB两地距离为150千米的答案,学生在理解数学模型含义环节中能够总结出■=■=■?圯x=3S1-S2这一解题公式。最后教师可以在结果检验环节中通过提出同类型问题的方式,确定学生的这一知识掌握情况。

结论:在我国当下的小学数学教学中,“数学建模”这一教学模式可以很好地实现教学目标,并有效的提高数学教学效果,在培养学生的数学思维能力方面,也有一定的促进作用。如果该模式能够在小学数学部分教学内容中得到拓展和应用,将有利于小学数学教师教学水平的提高。

参考文献:

[1]陈修臻.数学建模思想在小学数学教学中的应用研究[D].山东师范大学,2015.

数学建模的含义篇3

关键词:语义对象模型;XML Schema ;建模

中图分类号:TP311文献标识码:A文章编号:1009-3044(2008)35-2292-02

Modeling XML Schema From Semantic Object

LIAO Ming-chao1,YE Qing-hong2

(1.Department of Computer and Information Engineering,Wuhan Polytechnic University,Wuhan 430023;2.Zhongnan University of Economics and Law,Wuhan 430074,China)

Abstract: The Semantic-Object model is a method of representing user's requirements with document starting at semantic.It should maintain more semantic information as soon as possible, modeling XML Schema from or translating relational schema to XML Schema using Semantic-Object.This paper presented the basic rules and method of modeling XML schema from semantic object.

Key word: semantic object model;XML schema;modeling

传统关系数据库设计中概念模型的设计是整个设计过程中一个相当重要的步骤,设计者通过对应用系统的领域和数据对象的了解与分析,经过概念建模得到ER或语义对象概念模型,然后再经过模型转换而得到关系模型。该方法和过程也可应用于基于XML数据模型的设计,参照ER模型转化为DTD的方法[1,4],文章提出了从语义对象到XML Schema数据建模的一些基本方法。

1 XML与XML Schema

用于描述 XML 数据结构和内容的文档定义方式主要有 DTD 和 XML Schema,在实际应用中,XML Schema因具有强大的复杂数据类型定义和数据结构描述功能而被广大信息系统的设计者和开发者接受并加以采用。DTD正迅速被XML Schema所取代[2]。

2 语义对象模型

语义对象模型是用来文档化用户需求并建立数据模型的。它把语义看作基本出发点,数据模型中的语义对象是用户认为重要的事物的基本结构的映射,通过确定在用户需求中称之为语义对象的可标识事物,然后确定这些事物的属性来表达语义对象的特征及其之间的联系来建立数据模型。

相比于E-R模型,语义对象模型具有更接近用户和保存有更多语义信息的特点[3-4],而易于为用户所接受。利用语义对象模型来获取XML Schema,或将语义对象模型作为关系数据模型向XML Schema转换的中介,有利于尽可能多地保留数据语义信息。

3 语义对象模型到XML Schema的数据建模

XML Schema有类似于数据库模式的特点,因此,可根据语义对象模型七种类型对象的特点[3-4],可以很方便地实现语义对象模型到XML Schema的数据建模。

3.1 简单对象

简单对象是指只包含单值非对象属性的语义对象。在XML Schema的建模过程时,对简单对象的处理比较简单,只将简单对象转化为同名的XML元素简单对象中的各属性也将作为该元素的子元素或属性;其数据类型根据语义对象模型中的定义;如果简单对象在XML Schema建模时作为其他元素的子元素,其标识符属性将使用“key”键约束或“unique”惟一键约束表明属性的码属性。

3.2组合对象

组合对象是指包含一个或多个多值非对象属性的语义对象。在XML Schema的建模时,可将组合对象中的语义对象S设计为一个同名XML元素S,其中的多值简单属性及属性组将作为元素S的子元素,各子元素中具有唯一性的属性或元素在元素S中利用“key”键约束或“unique”惟一键约束标明;多值简单属性内的其他属性或元素的设计可参考简单对象的建模方法转换成嵌套子元素或属性。

3.3 复合对象

复合对象是指至少包含一个对象属性的对象,两个对象之间的关系包含1对1、1对多和多对多三种类型。复合对象C1和C2互相饱含,二者是1:1关系,在XML Schema时是将元素C2作为元素C1的子元素,并设置子元素C2的“minOccurs”和“maxOccurs”均为“1”,对象C2中的其他属性将作为子元素C2的嵌套子元素或属性,对象C1中的其他属性可参考简单对象和组合对象的转换方法设计为元素C1的子元素或属性;复合对象C3和C4是1:n的关系,其中C3是1方,C4是多方,在XML Schema建模时,设计与对象同名的两个元素,且C4是C3的子元素,注明子元素C4的“maxOccurs”值为“unbounded”; C5和C6是m:n关系的复合对象,在XML Schema建模是将两个对象按去掉对方对象后的简单对象或组合对象构建元素,然后再构建第三个元素C5_C6,C5_C6元素中包含两个“ref”关键字的子元素。

3.4 混合对象

混合对象是指两种类型对象的结合[4]。混合对象的XML Schema建模可以综合使用复合对象和组合对象的建模方法来完成。有两个对象S1和S2,根据混合对象Sl上的成对属性的最大基数不同有四种情形,其XML Schema建模的策略也有所不同。

情形1,一个S2可以在多个不同的S1中出现,但只能在每个S1的一个Gl中出现。XML Schema建模方法是将组属性Gl提取出来看成是一个单独的“对象”,这个对象分别与S1和S2构成复合对象,将对象S1和对象S2及G1设为根节点的子元素,在子元素G1中除包含原对象中的各属性转化得到的子元素外,还设计联系节点的子元素对元素S1和元素S2的引用。

情形2,一个R2可以在多个不同的Rl中出现,且可以在每个Rl的多个不同的Gl中出现。XML Schema建模方法同样是将组属性Gl提取出来看成是一个单独的“对象”,同S1和S2一样设计为根节点的子元素,另外设计一个根节点的子元素S1_S2_G1,通过其联系节点的子元素对三个字元素的引用。

情形3,一个S2只能在一个S1中出现,且只能出现在该S1的一个Gl中。除了一个S2只能关联一个S1的约束外,与情形1的情况相似,其XML Schema建模方法也与情形1的方法相似。

情形4,一个S2只能在一个S1中出现,也可以在该S1的多个不同的Gl中。除了一个S2只能关联一个S1的约束外,与情形2的情况相似,其XML Schema建模方法也与情形1的方法相似。

3.5 关联对象

关联对象是关联两个(或多个)对象并存储特定于这种关系的数据对象。关联对象的XML Schema建模可以为关联对象分别建立元素,然后再设计一个与各关联对象元素同层的元素R,元素R包含多个“ref”关键字的子元素分别引用各关联对象元素。

3.6 父子类型

父子类型对象是将多个(子类型)对象的一些共同属性抽象出来组成一个新的(父类型)对象,或称子类型对象获取或继承它的父类型对象的全部属性。在XML Schema时,可以将父类型对象设计为子类型对象的一个子元素。如果一个对象R被作为多个对象的父对象,则可以为对象构建一个名为R_Type的顶层元素,在为子类型对象构建元素时附加一个名为R、“type="R_Type"”的子元素。

3.7 原型对象

原型对象是产生其它表示原型的版本、修订本或版次的语义对象。这种对象类似于具有1:n关系的复合对象,因此,其XML Schema建模也可参照相关的规则执行。

4 转换实例

图1显示了利用语义对象模型创建的各语义对象。

按照上述语义对象模型到XML Schema数据建模的方法,以下是其中部分XML Schema建模结果。

……

5 结束语

语义对象模型是一种建模能力很强,也是一种很接近用户的数据模型,利用语义对象到XML Schema建模有利于尽可能多地保留数据的语义信息。该文按照七种语义对象的特点分别提出了其XML Schema建模方法,并将这种方法应用于教学检查建模过程中。如果这种建模方法同基于逆向工程的关系数据库向语义对象模型的转化结合起来,将有利于开辟一条数据信息整合的新途径。

参考文献:

[1] Kleiner C, Udo W.Lipeck.Automatic Generation of XML DTDs from Conceptual Database Schemas[DB/OL].dbs.uni-leipzig.de/webdb/wien/015.pdf.

[2] 廖明潮,高洪波.教学检查语义对象模型到数据库设计的转换[J].武汉食品工业学院学报,1999(3):65-71.

[3] 左伟明.即用即查XML数据标记语言参考手册[M].北京:人民邮电出版社,2007.

数学建模的含义篇4

关键词:帐套;工资管理;柔性框架;“公地式”数据存储;B/S

中图分类号:TP319 文献标识码:A 文章编号:16727800(2012)011008104

作者简介:张立新(1975-),男,乌鲁木齐职业大学现代教育技术中心高级实验师,研究方向为计算机网络、Web技术与数据库。

1 系统体系结构

1.1 系统的功能框架

按模块划分的原则,工资管理系统分成以下主要功能模块:人事信息管理、工资信息管理、系统信息管理。本文重点介绍工资信息管理模块的设计与实现。

1.2 工资信息管理模块

工资信息管理模块是工资管理系统的核心部分。根据学校财务需求,该模块应具有以下功能:

(1)有强大的用户自定义功能,能自定义多套工资标准,即工资帐套,为每个工资帐套自定义工资项目,为每个工资项目设计项目计算规则,如基本输入项、公式计算、所得税计算、分组计算等。各工资表可通过登录用户名或身份证号进行关联来互相引用数据,工资自动计算,以满足学校不同类型员工的工资结构不同的需求。

(2)实现用户自定义信息的虚拟数据存储模式,提高系统资源的利用率。

(3)有方便、快捷的公式编辑器,设定工资项的计算公式。

(4)简单、人性化的修改功能。包括个别修改和批量修改。

(5)灵活方便的自定义审核功能。可按部门、角色和个人等流程顺序来审核工资。

(6)快速工资查询。满足个人查询、帐套查询、模糊查询等多种查询方式。

(7)具备柔性系统的特点:自定义功能的设计,剔除量身定做软件的专有性,提高适应性和可移植性;模块化设计、提高扩展性,包括横向和纵向的扩展性,节约人力物力财力。

基于以上分析,工资管理模块主要有:帐套管理、工资表管理、工资汇总、工资审核、月末处理5个子系统,限于篇幅,本文重点介绍帐套管理和工资表管理模块。

1.2.1 帐套管理子系统

工资帐套管理,即工资标准管理。由于学校教职员工分类逐渐细化(包括在职、校内聘用、院聘、临时工、退休、校外聘用等),不同类型员工采用不同工资标准,各部门每月都有几套工资标准,且工资标准并非一成不变,故财务要求可以针对不同类型员工制定不同工资标准,包括工资帐套、工资项目及其计算规则制定。该子系统功能较复杂,实现较难,主要包括以下几项功能:

(1)工资帐套管理:用于新建、编辑和删除工资帐套。可定义帐套的名称、包含的人员及员工类型、审核方式、数据生成与浏览方式、当月上报截止日期等,用于为员工选择工资帐套,后期工资的计算、查询和汇总都依据帐套管理进行处理,这正是工资帐套的意义所在。

(2)工资项目管理:包括新增、修改和删除某一工资帐套的工资项目,其中新增和修改工资项目包括设定和修改工资项目的类型,包括录入项、计算项、所得税项和分组计算项。

1.2.2 工资表管理子系统

工资表管理是工资管理模块的核心部分,实现工资表的生成、查询、修改、打印等功能,包括:

(1)准确生成工资表:根据人事档案的部门和人员信息,结合帐套定义的人员包含信息和自定义的工资项目动态实时地生成空工资表,也可按指定的历史月份数据生成工资数据。

(2)多种方式工资查询:个别查询和帐套查询,满足用户不同的查询需求。

(3)功能丰富的工资表处理方式:工资的单个条目复制、个别修改和批量修改、删除工资条目等。

(4)强大的输出功能:工资条和工资表输出,以不同形式满足用户不同场合的需求。

2 实现柔性的关键技术分析

2.1 “公地式”数据存储模式

为使柔性系统支持多个自定义数据结构,保证低开销,本文采用 “公地式”数据存储模式,使用规则如下:预先设定系统资源分配规则,系统中建立一张或几张公共数据表,为该表建立若干列,并限定字段类型,每个自定义数据结构拥有若干个特征属性,用户自定义数据结构时,系统根据特征属性的数据类型,对应将公用表中若干列的使用权分配给该自定义结构,并记录每个自定义结构的使用权分配情况。取得列使用权的自定义结构在录入数据时,就可将自己的数据存入公用表中对应的列,实现公共表的公用,而不需要为每个用户自定义数据结构再单独新增数据表。

每个自定义数据结构对应一张虚拟数据表。例如,用户按年月自定义了多个工资帐套,每个帐套包含当月的多个工资项目,每个帐套都有数月的工资信息,但所有的工资信息都根据所属帐套和年月按一定的规则存储在公用工资表中,需要调用工资信息时,只需根据规则和分配记录就能读取某个工资帐套某年月的工资信息。例如,定义如下4个工资帐套,来实现相关工资项目计算:

(1)定义一个当月基础工资帐套A,工资项目为:岗位工资、薪级工资、高定工资、绩效工资、应发工资、扣款、实发工资等,其中:A.应发工资=A.岗位工资+A.薪级工资+A.高定工资+ A.绩效工资,A.实发工资=A.应发工资-A.扣款。

(2)定义一个当月部门1课时费工资帐套B,工资项目为:课时数,课时标准,课时费,课时费小计,其中:B.课时费=B.课时数×B.课时标准,B.课时费小计=SUM(B.课时费)。

(3)定义一个当月部门2课时费工资帐套C,工资项目为:课时数,课时标准,课时费,课时费小计,其中:C.课时费=C.课时数×C.课时标准,C.课时费小计=SUM(C.课时费)。

注:一个教师可能在多个部门代课,课时标准在不同部门或部门内部也可能不同。

(4)定义一个当月效益工资帐套D,工资项目为:基础工资,课时费合计,应发工资,所得税,实发工资,其中:D.基础工资=A.实发工资,D.课时费合计=B.课时费小计+ C.课时费小计,D.应发工资=D.基础工资+D.课时费合计,D.所得税按国家标准根据D.应发工资(应纳税所得额)计算所得税,D.实发工资=D.应发工资-D.所得税。

则上述4个工资帐套通过“公地式”数据存储模式存储的效果如图1所示。

2.2 虚拟数据表结构

“公地式”数据存储模式对数据结构设计提出了难题:如何合理设计公用数据表和记录分配规则的数据表结构以保证该数据存储模式顺利应用。为解决这一难题,本文采用一种虚拟数据表结构,即在柔性系统的应用库中设计以下三类数据表:①普通固定表,即固定字段的常规表,包括工资帐套表,不涉及自定义项目;②用户特征表,用于记录用户自定义数据结构的特征信息、公用表的分配规则等,包括工资项目表;③公用表,这类表是预先设计好的,且有足够预留字段供特征表分配和调用,包括各帐套使用的工资表。

增、改、删自定义数据结构、项目及规则体系时,系统将操作信息录入特征表,然后根据特征表以及预先设定的算法动态将分配规则记录于特征表中,每定义一个数据结构,系统将公用表若干列的使用权分配给该数据结构,相当于在系统中实时创建了一张虚拟表。

公用表的同一字段对于不同虚拟表意义不同。虚拟数据表结构的优势在于利用特征表使公用表字段重用和共用,使结构固定的公用表衍生出许多结构不同的虚拟表,从而实现不同数据结构的数据统一存储,并对用户屏蔽复杂的内部联系,对用户而言,自定义数据结构就如同在数据库中建立了一张新数据表,用户可以对虚拟表执行数据的读取(Select)、插入(Insert)、更新(Update)和删除(Delete)等操作。虚拟数据表结构为“公地式”数据存储模式的顺利实现提供了技术支持。具体表结构设计参见第三部分的工资信息管理的数据表设计。

3 数据结构设计

本章将对柔性工资管理系统的数据库设计进行分析,该系统的数据库包括基础参数库和应用数据库,基础库用于存放系统的基础项信息,其结构简单,本文不做详细讨论。应用库用于记录系统应用数据信息,它对实现系统柔性起决定作用,本文将重点分析和研究应用数据库的详细设计。

3.1 工资信息管理模块概念模型

工资管理模块包括帐套管理、工资表管理、工资汇总、工资审核和月末处理5个子系统。该模块功能复杂,包含的实体较多,且彼此相关,主要实体有:工资帐套、工资项目、帐套人员、工资表、工资表状态等。这些实体之间的关系如下:一个帐套包含多张工资表,一张工资表包含多个工资项目,一张工资表有一种状态,一个帐套包含很多帐套人员,一个人员一个时期可属于多个帐套。

3.2 工资信息管理的数据表设计

工资信息管理模块是体现系统柔性的最核心部分,由于涉及大量用户自定义信息的存储,该模块数据表设计较复杂。柔性系统要满足工资管理横向多样性和纵向多变性,需要采用多帐套管理。若采用传统的固定数据表存储工资信息,则给系统的正常运行提出以下难题:①用户设定的帐套数量未知,不可能预先在数据库中创建工资存储表;②各帐套的工资项目数量和具体项目信息未知,无法预先设计工资表结构。为此,系统采用前面介绍的“公地式”数据存储模式,利用虚拟数据表结构设计表。该模式的数据库中包含固定表、公用表、特征表三类数据表,利用特征表(工资项目表),实现公用表(工资表)虚拟结构多样化,以满足多个结构不一的帐套工资存储。本系统将所有的工资信息存于一张公用表中,通过关联字段和特殊字段使该表具有多套虚拟结构,以实现不同帐套、不同年月工资分类存储于一张表,既能满足多帐套需求又能节约系统资源。

该模块包括以下几张数据表:salary_zt、salary_item、salary_data、salary_sds、salary_check。其中salary_item是特征表,salary_data为公用表,其余的都为固定表。下面具体介绍各类表结构。系统使用的大部分数据表是固定表,其中,表salary_zt用于存放帐套信息(如表1所示),表salary_sds存放所得税标准信息,表salary_check存放工资表审核情况信息。

3.2.1 固定表

3.2.2 特征表

本模块中表salary_item是特征表,用于存放用户自定义的工资项目相关信息和记录不同帐套对公用表salary_data的分配,该表除包含工资项目的基本属性字段外还要包含其与公用表的关联字段,其数据结构如表2所示。

柔性工资管理系统为节约系统资源,将所有帐套所有的工资信息都保存在salary_data中,通过帐套号和工资时间来区分不同的工资表,工资信息的各项处理都利用帐套号(ACCOUNT_ID)和时间(ACCOUNT_DATE)。因此字段ACCOUNT_ID和ACCOUNT_DATE是联系公用表salary_data和特征表salary_item的关联字段。字段COLUMN_NAME的作用是记录工资项目在salary_data中存储的位置,即对salary_data的分配依据。可见特征表中的ACCOUNT_ID和COLUMN_NAME以及公用表中的ACCOUNT_ID是实现虚拟数据表结构的关键字段。

3.2.3 公用表

系统定义了一张公用表salary_data用于存放工资信息,不同帐套不同时间的工资信息都存放在该表中,表salary_data (工资表)由于要满足虚拟数据结构,其设计不同于一般的表,一共设置了50个字段,其中10个有具体名称,其余的都以具有一定数量关系的名称命名,具体结构如表3所示。ITEM1X~ITEM40X这40个字段是供特征表salary_item(工资项目表)根据分配原则分配的字段,不是每个帐套都会用到该40个字段,帐套有多少个项目就用到多少个字段,但一个帐套最多能有40个工资项目(当然可根据需要增加)。由此可知,同一个字段对于不同的帐套有不同的意义,如:ITEM2X在帐套A中存储的是薪级工资,在帐套B中存储的是课时标准。待分配字段对于各帐套的具体意义要通过salary_item (工资项目表)的COLUMN_NAME字段给出。

分配原则:ITEM X系列字段名要和特征表中定义的各帐套的工资项目的字段名相同,两表之间通过帐套ID号和核算年月关联。

本模块的业务逻辑较复杂,许多业务处理涉及多表联查,尤其是对工资表信息的处理。系统要新建一张某月某一帐套的工资表时,先把该帐套包含的员工姓名、工资表时间以及帐套号导入salary_data (工资表),然后依据工资项目类型计算每位员工当月的各项工资。

4 柔性工资管理系统的应用实例

限于篇幅,帐套管理子系统里的帐套管理、工资项目管理、计算公式编辑器和所得税管理等模块功能实现及界面不再详述,以下仅简介工资表模块的功能实现及界面。

4.1 功能丰富的工资表处理方式

新建工资表时,系统根据帐套包含人员和工资项目表(特征表),结合历史月份数据在工资表(公用表)中生成当月的工资数据。由于数据不确定,工资信息界面生成也涉及到工资信息动态显示。图2展示了按图1存储结构实现的工资表,各图的手动录入框并非系统预先设计,而是动态控制生成的。在进入该页面时,通过数据动态显示技术,系统先读取该帐套所包含的人员、各类可以手动录入和不能手动录入的工资项目,依据工资项目类型信息通过代码实现动态显示效果。用户仅需手动录入没有规律可循的工资项信息,其他工资信息由系统智能联动计算所得。

在此界面中可实现工资表信息的批量更新、复制、打印和删除等操作。由于系统自动计算的工资项是基于帐套内其它工资项目或帐套外部信息项目,因此一旦有信息更改,就需按下述流程进行批量更新:系统循环读取当月该工资帐套每个用户的工资项目对应的工资数据,动态组建SQL语句,先将用户手动录入项目更新,然后依据计算公式、所得税项、分组计算项来更新不能手动录入的工资项目,实现工资数据的批量自动计算。

5 结语

本文的工作基于《乌鲁木齐职业大学财务管理信息系统》课题项目,在Win2003环境下,采用B/S架构,在学校现有OA系统(Apache+PHP+MySQL组合)基础上进行了二次开发,结合开发柔性工资管理系统的经验,采用“公地式”数据存储模式、虚拟数据表结构和动态数据处理技术等关键技术,建立了基于多帐套管理的柔性WEB开发框架,完成了工资管理信息系统的开发,为快速开发柔性系统提供了一个可行方案。总体来说,柔性开发框架功能还是很有限,为提高系统柔、记忆功能以及协同功能,还需进一步努力才能充分发挥基于多帐套管理的柔性工资系统的优越性。

参考文献:

[1]胡慧慧.基于WEB的柔性工资管理系统的研究与实现[D].合肥:合肥工业大学,2009.

[2]韩承双,程再玲.柔性结构工资管理系统的设计与实现[J].微型电脑应用,2005(11).

数学建模的含义篇5

迄今为止人类已经发现了元素周期表上110种元素中的90种元素在自然界存在,正是这90种元素构成了地球上的一切生命与非生命,包括动物、植物和矿物。因此,对地壳中所有元素精确含量和分布的探测,对于了解地球演化、生命起源、解决人类所面临的资源和环境问题具有重大意义。

要实现对地壳物质成分的探测,首先需要解决探测技术问题:高精度地壳化学成分分析技术地壳深部物质成分的地球化学示踪技术盆地穿透性地球化学探测技术海量地球化学数据库管理与图形显示技术。其次,对地壳化学元素的精确探测,需要一套基准参考数据作为探测数据可靠性的标尺,这就要求我们必须建立一个覆盖全国的地球化学基准网,按照地球化学基准网格,建立中国各主要大地构造单元不同时代地层、侵入岩和疏松物的76种元素基准值,制作元素含量基准地球化学图,为全面地壳物质成分精确探测提供基准参考数据和图件。在上述技术研制和基准参考值建立基础上,通过选择穿越不同大地构造单元和重要成矿区带的3个走廊带的试验与示范,精确探测走廊带内地壳的元素含量和时空变化,构建走廊带上不同大地构造单元的地壳地球化学模型,揭示不同大地构造单元物质成分演化历史和大型矿集区的成矿物质背景。最终成果表达需要一套搜索和检索软件,能对地球上化学成分信息(海量数据、图像、空间坐标等)在全球不同尺度的分布进行快速检索和图形化显示。类似于GoogleEarth软件。我们暂且称其为“化学地球”(GeochemicalEarth)。

1地壳全元素探测的国内外研究现状

1.地壳化学元素组成、丰度、分布和基准值研究现状

科学家经历了一个多世纪的努力,对地壳物质成分的研究已取得很大进展。迄今为止人类已经发现了元素周期表上110种元素中的90种元素在地壳中的存在(其他为人工合成的)尽管地球化学家对地壳元素的丰度的研究已取得很大进展(Clarke18891908;Clarke&Washington,1924;Goldschmidt1933;Taylor,1964;黎彤和倪守斌,1990;Taylor&McLennan,1995;Rudnick&Fountain,1995;WedepohL1995;Gaoetal.,1998;鄢明才和迟清华1997)但人类至今对这90种元素在地球的分布知之甚少(王学求等,2006)。这里所说的分布包括在地壳表层的分布和地壳不同层圈的分布。

地球化学家一直在探索使用具有均一化的代表性样品来研究元素在地壳表层的分布,并用地球化学图来刻画元素的空间分布。这种刻画化学元素在空间上分布的地球化学图为资源和环境问题的解决发挥了巨大作用(谢学锦,2008a2008b;Garretetal.,2008)。全球地球化学基准计划(GlobalGeochemicalBaselineIGCP360)(Darnleyetal.,1995)目的就是为了尽快获得化学元素在全球尺度的分布,并为研究全球变化提供参考基准。在全球部署5000个基准网格覆盖整个地球陆地面积,每个格子大小为160kmX160km,落在中国的网格约500个(包括边界不完整网格)。具有均一化特点的泛滥平原沉积物或河漫滩沉积物被广泛接受作为全球基准值计划采样介质(Bolviken,1986;Darnleyetal.,1995;Xieetal.,1997;Salminen,2005)。这种次生均一化介质可以反映化学元素的空间变化特征,但它的缺陷是无法反映具有时间特性的地质演化特征。因此,要满足对化学元素在全球时空分布和演化的了解,就需要能反映时间尺度的原生介质一岩石。

从平面上研究化学元素的空间分布在技术层面比较容易实现,而对于垂向上的分布就要构建地壳参考模型才能实现。Staudigel等(1998)提出了地球的地球化学参考模型GERM(GeochemicalEarthReferenceModel)这一模型为我们研究包括大陆地壳在内的地球不同圈层及地球化学储库的化学性质提供有力的参考依据。张本仁等(19942003)构筑了东秦岭地区华北陆块南缘、北秦岭、南秦岭和扬子陆块北缘4个构造单元的地壳结构一岩石组成一地球化学模型,RudnickandGao

    2总结了大陆地壳物质组成和演化方面的研究成果。

地壳化学成分和分布的探测存在的问题主要有:①对元素周期表上所有元素含量的精确测定还存在困难;②对化学元素的含量的了解较多,但对其分布了解非常有限,如中国区域化探扫面计划,只分析了39种元素,覆盖的面积也只有6X106km2(Xieetal.,1997);③对元素分布的了解还仅限于使用次生的水系沉积物介质,这种介质是表生均一化以后的分布情况,还缺少对化学元素在各个时代地层和侵入岩中时空分布的了解,迫切需要能反映时间属性的原生介质来研究化学成分在中国大陆的演化历史和成矿的物质背景;④地球化学基准参考值还没有建立起来,也就缺少衡量元素分布和研究未来变化的标尺;⑤对中下地壳化学成分的认识还缺少有针对性的地壳地球化学模型和实测数据。

1,大规模成矿物质背景一元素的巨量聚集研究现状

大规模成矿作用的必要和充分条件是必须有巨量成矿元素的聚集。地球化学省或地球化学块体就是巨量兀素聚集的体现。Hawkes和Webb(1962)将地球化学省定义为:较大的地壳单元,其化学组分与平均值有很大差异。地球化学省是进行矿产资源的区域评价的有效方法。人们对地球化学省的认识大多是从矿床分布的密集程度以及有限的岩石和矿物分析数据而提出来的,如Peru和Chile的铜省、加拿大Abitibi带的金省、东南亚的锡省、东格陵兰的锶省等。20世纪70年代以后,许多国家范围的大规模的地球化学勘查计划覆盖了越来越大的地区,特别是中国区域化探全国扫面的全面开展,覆盖面积的不断扩大,从而使许多地球化学省,甚至更大的地球化学模式被发现(Xie&Yin1993)。

Doe(1991)提出地球化学块体(geochemicalblock)的概念,将其解释为“具有某种或某些元素高含量的大岩块,能够为矿床的形成提供物质源'但他并没有说明如何圈定这种块体。谢学锦院士提出利用区域化探扫面数据圈定地球化学块体,并将地球化学块体定义为面积大于1000km2以上的地球化学异常(Xie,1995;谢学锦和向运川,1999)。地球化学块体实际上是大规模立体地球化学异常,即在平面上具有一系列套合的地球化学异常结构,在垂向上具有一定的深度,也就是说具有较大规模立体异常的地壳物质体(王学求和谢学锦,2000)。

地球化学省与成矿省是密不可分的,地球化学省或地球化学块体在资源评价中能较早的圈定出 来,而成矿省或矿集区直到发现大量矿床才能确定,二者的关系更像是因果关系,地球化学省可以作为确定成矿省的地球化学依据,地球化学块体可以作为确定矿集区的依据(王学求等,2007)。过去在使用水系沉积物圈定地球化学省,进而发现矿床起了巨大作用,但水系沉积物这种表生均一化介质,无法确定矿源层,也无法给出地球化学块体的厚度,因此使用原生介质圈定地球化学省或地球化学块体,追踪矿源层和进行资源量预测将更为科学。这就给我们提出了一个问题:如何去圈定这种立体的地球化学块体,更为科学地预测资源量?对全国元素分布的了解还仅限于使用水系沉积物或泛滥平原沉积物做为采样介质,这种介质是表生均一化以后的分布情况。尽管对找矿发挥了巨大作用,但对深入研究中国大陆元素的时间演化历史就无能为力。也无法知道地球化学异常源是来自于那个时代,那个地层。对地球化学省、地球化学块体的圈定用于资源评价都是使用的表生介质,要真正圈定立体的地球化学块体,追索矿源层还需要利用原生介质,目前利用原生介质圈定地球化学省或地球化学块体还是空白。1.3千米深度穿透性地球化学研究现状

人类所赖以生存的地球资源都集中在地表及不超过几千米深度之内,因此对地壳千米深度的物质组成和时空分布的探测具有重要的现实意义。澳大利亚的“玻璃地球计划(GlassEarth)”主要目的是查明1km以内的金属矿产资源。对金属矿而言,中国约占1/2的陆地已被盆地和各种覆盖层所掩盖,成为找矿的“处女地”或“甚低工作区”。据统计我国500m深覆盖区面积约50X104~80X104km2,相当于我国已调查、勘探的陆地面积的1/5,是一片极具潜力的金属矿产的新区或“找矿新空间”。因此对能探测这一深度的矿产资源直接信息的地球化学勘查技术的要求已迫在眉睫。

自上个世纪70年代开始,国际找矿界都在致力于研究能探测更大深度的地球化学找矿方法,统称为‘深穿透地球化学”(王学求,1998;谢学锦和王学求,2003)。这些深穿透地球化学方法包括电地球化学方法(CHIM)(Ryss&Goldberg1973),地气法(GEOGAS)(Kristiansson&Malmqvist,1982);酶提取法(ENZYMELEACH)(Clark,1993),活动态金属离子法(MMI)(Mannetal.,1995)金属元素活动态提取方法(MOMEO)(Wang,1998)和动态地球气纳微金属测量法(NAMEG)(Wangetal.,

地下水化学测量和活动金属离子测量列入探测技术研究内容。

目前国内外深穿透地球化学技术的发展趋势是:①建立覆盖区元素从深层向表层传输和分散的三维地球化学模型,为覆盖区地球化学勘查提供理论支撑;②将探测技术扩展到盆地地球化学调查和几百米覆盖区;③发展专用提取试剂和技术的标准化与可操作化;④建立能适应各种复杂景观、各种比例尺和各种矿种的技术系列。

2地壳全元素探测的关键技术

要实现对地壳物质成分的探测,必须重点突破地壳物质成分探测的4项关键技术,包括①地壳全元素精确分析技术;②深部物质成分识别技术;③盆地穿透性地球化学探测技术;④多层次海量地球化学数据管理与图形显示技术。

2.1地壳全元素精确分析技术

要实现对地壳成分的精确了解,发展能分析地壳中所有元素(约80个)的分析技术是关键。建立81个指标(含78种元素)配套分析方案和难分析样品的精确分析技术重点是突破含碳质岩石和有机物土壤的贵金属(金、铂族)元素精确分析技术。配套分析方案是以现代先进的大型分析仪器等离子体质谱仪(ICP-MS),等离子体光学发射光谱仪(ICP-OES)和X射线荧光光谱仪(XRF)为主,配合其他多种专用分析仪器及技术而组成的方法体系(表1),所有元素的检出限、报出率、准确度、精密度等指标均已达到国际领先水平。

2.2中下地壳物质成分识别技术

深部地壳物质组成研究的现有方法主要包括:①根据因构造运动抬升出露到地表的深部物质(如麻粒岩、榴辉岩、角闪岩等)②根据产于火山岩中的深部地壳包体如麻粒岩包体;③根据地球物理测深与深部岩石物理性质的高温高压实验测定结果之间的拟合;④壳源岩浆岩源区地球化学示踪法。由于以上4种深部地壳物质成分组成研究方法均存在不确定性,因此对深部地壳研究最好是各种方法相互结合,互为补充。

根据中国大陆地壳特点,不同构造单元出露的岩石类型,初步构建地学断面的岩石组成模型;不同构造单元内各类岩石的地震波速高温高压实验室测试;将实验获得的岩石地震波速数据与实测地震波速数据进行拟合,完善地学断面的地壳结构一岩石

球化学示踪研究成果,综合限定和进一步约束区域地壳结构一岩石组成模型;根据获得的不同岩石单点样的地球化学数据,计算每类岩石单位的平均成分;在所建立的地壳结构一岩石组成模型基础上,按照有关的每类岩石单位在地壳每个结构层中所占的比例,进行面积加权平均计算地壳每个结构层的元素丰度;按照每个有关结构层在整个地壳中所占体积比例,通过体积加权平均计算出地壳总体的元素丰度;根据其他学科研究的最新成果,检验深部地壳物质成分计算结果的合理性。

图1是Wedepohl所构建的大陆地壳岩石组成模型(Wedepohl,1995),根据其代表性岩石组成,就可以获得元素的含量,构建地球化学模型。张本仁等(2003)、路风香等(2006)以东秦岭造山带各类岩石实验测定的v,,值与地震测深获得的秦岭地壳v,,观察值的相互拟合为主,配合岩石变质相、深部岩石包体、壳源岩浆源区等研究,构筑了东秦岭地区华北陆块南缘、北秦岭、南秦岭和扬子陆块北缘4个构造单元的地壳结构一岩石组成一地球化学模型。

1.盆地穿透性地球化学探测技术

盆地及其周边蕴涵着重要的战略性资源,如盆地中的地浸型砂岩型铀矿、石油等,盆地边缘的大型金属矿。但盆地及周边被认为区域化探扫面禁区,覆盖物的影响、技术条件不具备和获取指标的单一,难以满足对盆地及周边资源潜力的全面了解。发展能探测盆地矿产资源直接信息的穿透性地球化学技术,将地表采样与钻探取样相结合,建立立体地球化学分散模式,为盆地及周边覆盖区深部矿产资源调查提供有效方法。

对盆地千米深度探测有两种途径:一是利用深穿透地球化学技术,在地表快速获取深部信息;二是利用钻探手段,直接获取深部样品。

深穿透地球化学(Deejrpenetrationgeochemistry)是探测深部隐伏矿或地质体发出的直接信息的勘查地球化学理论与方法(王学求,1998)。矿床本身及其围岩中的成矿元素或伴生元素,可以在某种或某几种营力作用下(地下水、地球流、离子扩散、蒸发作用、电化学剃度),被迁移至地表,在地下水和地表土壤介质中形成异常含量,使用水化学测量技术、地球气测量技术、元素活动态提取技术和电化学测量技术可有效发现深部隐伏矿信息。

深穿透地球化学方法有以下几类:①物理分离提取技术;②电化学测量技术;③活动态提取技术(MOMEO);④气体和地气测量技术;⑤水化学测量技术;⑥生物测量技术。澳大利亚的“玻璃地球计划(GlassEarth)”在地球化学技术上使用地下水化学测

即使少部分地区进行了区域化探扫面工作,但由于量和活动金属离子测量技术中国的盆地深穿透地

球化学探测拟使用4种技术:①细粒级采样与分离技术;②金属活动态测量技术;③ICP-MS地下水化学测量技术等;④空气动力返循环钻探粉末取样技术。图2是使用穿透性地球化学技术在吐哈盆地对砂岩型铀矿的探测试验,可以有效探测300m埋深的砂岩型铀矿(王学求等,2002;Wangetd.,2007)。

3全国地球化学基准网的建立

对地壳化学元素的精确探测,需要一套基准参考数据作为探测数据可靠性的标尺,这就要求我们必须建立一个覆盖全国的地球化学基准网,按照地球化学基准网格,建立中国各主要大地构造单元不同时代地层、侵入岩和疏松物沉积物的76种元素基准值,制作元素含量基准地球化学图,为全面地壳物质成分精确探测提供基准参考数据和图件。地球化学基准值的建立,对我国基础地质、理论地球化学、勘查地球化学、矿产资源潜力预测、大地构造划分、地球动力学、生态与环境、农业、卫生与健康等研究领域提供准确可靠的基础地球化学数据,对中国大陆化学元素的时学基准值研究体系,对全球地球化学基准值的建立和最终建立‘化学地球”具有重要奠基性意义。

地球化学基准值(GeochemicalBaselines)的概念来源于全球地球化学基准值计划(GlobalGeochemicalBaselinesProjectIGCP360)它的原意是用系统的全球网格化采样,获得全球地球化学基线图,作为未来衡量全球化学元素含量变化的参照标尺。从它的原创性含义不难看出:地球化学基准值不仅以数据的形式表述含量特征(abundance),而且还以图件的形式表述空间分布特征(distribution),它是用一组数据来刻画元素含量的总体变化水平。这种刻画比采用单一的丰度值能更为客观地反映地质体或某一区域元素的含量值分布。可以是系统采集均一化介质的土壤、水系沉积物、泛滥平原沉积物等来刻画元素的总体分布,也可以是采集不同时代的典型岩石来刻画元素在某一特定地质体中的分布值。基准值既可以作为“点”上某种物质成分含量的基准参考值,又可以作为“面”上元素含量变化的基准地球化学图,用于衡量元素在空分布和演化历史的研宄’对创建全新的中国地球化自然界含量和分布的标尺。克拉克值和元素丰度不

考虑空间分布,只用数值来表达,而地球化学基准值要考虑空间分布,可以制作出基准地球化学图,因此它既可以以数值来表达,也可以以图件的形式来表达。克拉克值和元素丰度表述的是含量特征,而地球化学基准值不仅表述含量特征,而且还表述空间样品地质年代表述时间属性,因此地球化学基准值具有时空分布特征。

根据上述特点,笔者将地球化学基准值定义为:按照统一的基准网系统采集有代表性的样品,在严格标准监控下实测元素含量,以一组数据和图件形尺,即它不仅表示元素含量,还表示元素分布。

“全球地球化学基准计划”(GlobalGeochemicalBaselines)部署5000个基准网格覆盖整个地球陆地面积(Darnleyetal.,1995)。全球基准参考网网格(GlobalReferenceNetworkGrid,GRN)大小为160kmX160km,全球共有约5000个网格。落在中国的网格约500个,完整格子300个左右(图3)。此次全国地球化学基准值的建立将遵循国家基准值数据密度应高于全球数据密度的原则,将每个全球地球化学基准网格划分成4个子网格作为中国基准网格,每个网格大小相当于1个1:20万图幅,因此根据中国的实际和便于岩石样品的采集以及地质解释需要,将采用1:20万图幅作为中国的地球化学基准网格。中国大约有1500个1:20万图幅,也就是布设1500个基准网格。在每个1:20万基准网格内系统采集有代表性的不同时代沉积岩、火成岩、变质岩和疏松沉积物组合样品,总样品量约18000件,精确分析元素的含量,建立中国大陆地球化学基准值,制作化学元素时空分布基准地球化学图。为下一步地壳物质探测提供基础参考数据,并为研究元素在中国大陆的时空分布奠定基础。

4地球化学走廊带试验与示范

地球化学走廊带是指沿着穿越不同大地构造单元和重要成矿区带的地质剖面,并跨越一定的宽度,构建一条化学元素的含量和时空变化走廊。国内外尚无可借鉴的现成技术和经验。将“地壳全元素探测技术与实验示范”项目的其他3个课题所发展的技术(全元素分析技术、深穿透地球化学技术、地壳地球化学模型构建技术和图形显示技术)进行地球化学走廊带探测试验,为下一步地壳探测奠定技术基础,并起到示范作用。

选择穿越不同大地构造单元和重要成矿区带的3条地球化学走廊带进行试验与示范(图4)。3条

走廊带总长度3300km,每条走廊带宽度100km,

预计样品数约14000件。通过常量元素分析、微量元素分析和同位素分析,精确探测走廊带内沉积盖层与结晶基底,不同时代岩浆岩、沉积岩和变质岩76种元素的含量和变化,构建地球化学模型,揭示大型矿集区形成的物质背景和地球化学标志。编制3条走廊带元素时空分布地球化学图,提供给社会使用。

4.1华北陆块一兴冡造山带走廊带

华北陆块一兴蒙造山带地球化学走廊带(约1500km)精确探测地球化学走廊带内76种元素含量和变化,构建走廊带地壳地球化学模型,研究华北陆块北缘和大兴安岭大型矿集区地球化学特征和找矿标志。东海县大陆科学钻为起点,穿过郯庐断裂、胜利油田、燕山造山带、兴蒙造山带。该走廊带具有重要科学意义和找矿意义。如跨越两大地质单家16个油田中金含量最高的油田,石油中金含量可达0.132~1.06g/1(林清等,1993)。Wang(1998)发现沿郯庐断裂存在巨大金异常带,同时在胜利油田上方和胶东金矿上方出现Au高含量浓集中心。胜利油田金来源与胶东金矿金来源有什么关系?是因为胶东隆起剥蚀的物源沉积到渤海湾盆地带来的高含量金,还是金是来自于深部(油金同源)?

4.2华南造山带一扬子陆块东南缘走廊带

华南造山带一扬子陆块东南缘(武夷山一南岭一扬子陆块东南缘)走廊带(约1000km)穿过武夷山成矿带和南岭成矿带,精确探测地球化学走廊带内76种元素含量和变化,构建走廊带地壳地球化学模型,提供大型矿集区成矿的地球化学背景和找矿标志。

4.3西秦岭一阿拉善走廊带

西秦岭一阿拉善走廊带(约800km)穿过西元和两盆两山盆地有胜利油田,胜利油田是我们国秦岭金矿、白银厂多金属矿和金川铜镍矿区,研究不考虑空间分布,只用数值来表达,而地球化学基准值要考虑空间分布,可以制作出基准地球化学图,因此它既可以以数值来表达,也可以以图件的形式来表达。克拉克值和元素丰度表述的是含量特征,而地球化学基准值不仅表述含量特征,而且还表述空间样品地质年代表述时间属性,因此地球化学基准值具有时空分布特征。

数学建模的含义篇6

关键词:番禺油田;一体化研究;地质统计学反演;理想油藏模型

Abstract: In the Panyu oilfield, the relationship of the petrophysical property and the elastic modulus was analyzed to search the physical significance of acoustic logging and seismic elastic response. Then the reservoir top structural map was interpreted accurately. Meanwhile, the geological statistic inversion was achieved by considering the research results from geology, sedimentation ad petrophysics, to construct the reservoir model. Finally, the ideal reservoir model was confirmed through the verification and filter based on the dynamic production data. The integrated reservoir study was realized through this systematic process involving the multi-discipline knowledge from logging, seismic, geology, reservoir etc. Then, the oil-bearing trap will be confirmed more certainly. The estimation of reservoir heterogeneity and remaining oil will be more accurate.

KeywordS: Panyu oilfield; Integrated study; geological statistic inversion; ideal reservoir model

1 概r

番禺油田位于南海珠江口盆地。油层主要分布在韩江组下段、珠江组和珠海组上段,为三角洲前缘沉积,高孔高渗的砂岩储层。油品性质由下往上依次为轻质、中质和重质。含油层段有砂岩、泥岩和钙质胶结砂岩三种岩性。地震分辨率λ/4为15.5米,砂层厚度一般为11-22米,地震资料基本上能够识别这些砂层。

常规的研究流程是用地震资料解释搭建构造格架,井约束进行地质统计学建模,进而得到地质模型。而常规模型存在的问题是:油藏模型中计算含水始终高于实际含水,模型中的剩余油已经基本接近残余油饱和度,但实际生产动态依然较好;在静态地质模型中如何描述储层及物性的非均质性变化,从而得到合理的储量,及准确评估剩余油分布。通过分析原有模型,发现主要问题是在建模过程中测井、地震、地质、油藏都相对独立,于是各个学科揭示的规律即使存在矛盾也未能解决。由于海上井位的分布不均一,已钻井无法有效代表区域构造及储层的分布,因此三维地震资料的应用,多学科集成和交叉的分析,对建模至关重要。

2 技术方法

工区包括40平方公里三维地震资料,33口开发井,其中9口井有纵波,1口井有横波。为了达到研究目标,建立了一套可迭代的一体化研究流程。首先分析研究工区的岩石物理规律,找出测井声波与地震弹性响应代表的物理意义,正确解释储层顶面构造,并通过地质分析、沉积研究及岩石物理分析成果来进行地质统计学反演,建立储层油藏模型,以动态生产数据为校验筛选模型,得到最理想的油藏模型(图1)。当油藏动态数据验证模型尚不完善的时候,流程中的相关步骤需重新迭代,如构造解释及地质统计学反演。

2.1 石油地质特征研究

番禺油田主要储集层为渐新世-中中新世沉积的珠江组碎屑岩。本次研究的目标就是这套海侵体系域三角洲前缘亚相地层。在构造主体,自然伽玛测井曲线呈现为漏斗形与近箱形的复合韵律,为水下分流河道微相;向东测井曲线为多个漏斗形与钟形的叠加组合,逐渐过渡到河口坝微相。从沉积特征来看,在油田主体20平方公里内储层分布相对稳定,自西向东钙质胶结砂岩明显增加,储层孔隙度、渗透率物性逐渐变差。

2.2 岩石物理特征

岩石物理分析的目的是:(1)为测井评价和地震综合研究提供

单井质量可靠、多井趋势合理的测井曲线。(2)建立测井响应、地震弹性响应与岩性、物性和流体之间的物理联系,为多学科相结合的储层研究建立合理的技术流程。

本次研究建立了具有地质含义的单井曲线质量评价和多井标准化处理技术体系,并得到多井评价后趋势合理的测井曲线。同时,基于“测井特征相关分析”技术和“微分等效介质”理论,建立了研究区的测井弹性正演模型,明确储层物性、流体与纵波时差、Vp/Vs等岩石弹性的关系,建立孔隙度、饱和度与弹性响应关系模板,为地震储层模型的定量解释奠定基础。在模板中,砂岩表现为孔隙度增加,纵波阻抗减小,Vp/Vs相对较低;泥岩具有高阻抗、高Vp/Vs的特征;当钙质胶结含量增加后纵波阻抗也随之增加,纵横波速度比也随之增高。

2.3 正演模型分析反射系数

地震数据表明东部砂岩顶界面消失,这一现象是由于砂体尖灭还是其他原因引起,构造解释方案以波谷为准还是以波峰或其他为标准,存在不确定性,这将直接导致圈闭面积及储量的变化;同时,圈闭面积及储量的变化必然直接影响油藏抵的D獾慕峁。因此,需要在充分理解本区的岩石物理响应特征后,以真测井曲线为基础,建立正演初始阻抗模型,分析地震揭示的反射系数特征。

2.4 地质统计学反演

地质统计学反演构建一个概率密度函数(PDF)来表征在已知地质、地震、测井等信息的条件下储层的概率,并利用贝叶斯推论将上述各种信息源的概率密度函数综合起来求解,获得表示储层岩性与属性的后验概率密度函数,然后利用马尔科夫链-蒙特卡洛算法对后验概率密度函数抽样,从而获得所需的各种属性体。此方法即体现了地质统计学的连续性又考虑了岩性沉积的间断性与多样性,尤其是能够把从子波得到的合成记录与地震数据相关联。在番禺油田内,统计学反演输出的模型表明无井控制区域含钙增多,这与地质、测井及正演研究的假设一致。

2.5 油藏模型和剩余油分布研究

常规模型筛选带来的修改工作量很大,研究过程不易于重复,无法在建模过程中进行迭代,模型很难更新。本文采用一体化研究流程进行模型的筛选和动态校验,其关键在于流程的可迭代性。通过对地质统计学反演得到的每一组实现在精细网格上进行历史拟合,对多个油藏模型进行多轮次历史拟合,每次迭代都进行拟合误差分析。如果所有拟合结果与实际开发数据均不吻合,就返回构造研究或地质统计学反演,优化反演参数,进行新一轮反演,之后重新进行动态模拟筛选模型,直至历史拟合结果与实际产油趋势吻合较好,此时的模型即是最优的油藏模型。

经过几轮次的迭代,若不考虑东部钙质胶结砂岩和构造形态的影响,含水率的历史拟合较好,但是井底流压的变化明显与实际生产情况不吻合;若考虑东部钙质胶结砂岩对储层的影响,井底流压相对上一种情况变化稳定些,但与生产历史的匹配度仍不够高;在地质统计学反演过程中,同时考虑东部钙质胶结砂岩和构造解释方案的调整,油藏模型的历史拟合程度非常高,液量和井底流压与实际生产情况吻合很好。通过动态筛选出的最优模型,代表了岩石物理、地质、构造、地震及油藏动态信息等多学科相结合的地质统计学反演结果,可以精细描述最符合地下实际情况的原状地层模型。应用这个地质模型进行数值模拟,得到流线模型,表现流体流动特征、注采关系及水驱前缘,并落实剩余油分布。流线模型中压力变化为十几巴,压力足够稳定,与生产实际情况相符;油藏原始含油饱和度0.66,剩余油饱和度均值为0.52,东南方向及构造鞍部的剩余油未被生产井波及,为下步布井的甜点区。

3 结束语

数学建模的含义篇7

一、减数分裂过程中相关数量变化的模型分析

1.模型构建的程序

首先,认识基本概念是建模的基础,这里面涉及很多概念,如同源染色体、染色单体、联会、四分体等,理解这些概念之间的相互关系是学习减数分裂的基础;其次,学习和认识减数分裂的过程,尤其是此过程中染色体的数量和行为变化;第三,再以人体精卵细胞的形成过程为例构建数学模型,这种数学模型可以以表格的形式表示减数分裂过程中染色体、染色单体、DNA等数量变化规律,也可以以曲线图的形式描述其数量变化规律,表格模型可以让学生在教师的指导下独立完成,曲线模型可以指导学生尝试构建;第四,构建人体性原细胞减数分裂过程中染色体、染色单体、DNA等数量变化规律的模型。模型如下:2.模型要点

根据构建模型的顺序和要求得到如上模型(模型分析一)。要点如下:

(1)N和2N的含义;

(2)人体生殖细胞形成过程中染色体、染色单体及DNA的数量变化的表格模型;

(3)染色体、染色单体及DNA变化的曲线模型;

(4)人体生殖细胞形成过程中染色体、染色单体及DNA的数量变化的物理模型。

3.模型分析

掌握染色体的行为和数量变化才能掌握减数分裂的实质。由于染色体是遗传物质DNA的载体,通过模型分析我们就能更好地认识遗传物质在世代中的传递方式。数学模型虽然让我们直观地认识有关量的变化规律,但解决具体问题时仍比较棘手,尤其是涉及人体细胞的减数分裂时。所以以人体细胞减数分裂为例构建物理模型能更加具体地帮助我们认识染色体等的变化规律,在此基础上更深刻地认识减数分裂的过程实质。

数学模型有利于我们认识染色体、DNA等的变化趋势和规律;而物理模型更加突出染色体的行为变化,并有助于理解染色体行为变化和遗传物质DNA数量变化的关系,所以能使学生更好地在染色体的水平上认识DNA在有性生殖过程中的传递方式。不同模型的结合从不同的角度认识减数分裂的过程和实质,帮助学生更加深刻地理解有性生殖的实质,能取得理想的教学效果。

二、有丝分裂过程中相关数量变化的模型分析

1.模型构建的程序

首先,认识染色体和DNA的关系是建构模型的基础;其次,认识有丝分裂的过程,尤其是熟悉染色体在有丝分裂过程中的行为变化;第三,再以人体精卵细胞的形成过程为例构建数学模型,通过数学模型反映有丝分裂过程中染色体、染色单体、DNA等数量变化规律,模型可以以表格的形式表示,也可以以曲线图的形式描述;第四,以人体精卵细胞的形成过程为例构建物理模型。模型如下:

2.模型要点

(1)N和2N的含义;

(2)人体体细胞分裂过程中染色体、染色单体及DNA的数量变化的表格模型;

(3)染色体、染色单体及DNA变化的曲线模型;

(4)人体体细胞分裂过程中染色体、染色单体及DNA的数量变化的物理模型。

3.模型分析

掌握有丝分裂过程中染色体、DNA等行为变化和数量变化规律才能理解有丝分裂的实质,才能理解有丝分裂在个体的生长、发育以及遗传和变异等生命活动过程中的意义。

以人体细胞的分裂为例,通过不同模型的结合从不同的角度直观地再现和分析染色体等相关数量变化规律,借助数学模型可直观地分析各种量的变化趋势,借助物理模型可直观地分析染色体的行为变化,由此能帮助学生更好地理解如何通过染色体的分离把复制的两个DNA分配到两个子细胞当中去。

在教学中,教师应构建物理模型分析染色体行为的具体变化,指导学生尝试构建曲线模型,培养学生思维转换能力和建模能力。

三、利用模型解决相关试题

【例1】某动物的精原细胞在减数分裂过程中形成4个四分体,则次级精母后期细胞中染色体数、染色单体数和DNA分子数为()。

A.4、8、8B.2、4、8C.8、16、16D.8、0、8

解析:4个四分体有8条染色体,减数第一次分裂结束,染色体数减半。减数第二次分裂后期着丝点分裂,染色体暂时加倍,为8条,DNA也为8个,染色单体降为0。可以根据染色体、DNA的变化曲线直接判断,曲线初始染色体、DNA为8,也可以通过物理模型直接判断。答案为D。

【例2】某真核生物的体细胞有丝分裂后期染色体数为8,那么该细胞有丝分裂前期染色体、染色单体及DNA数分别是()。

A.4、4、8B.8、4、8C.4、8、8D.4、8、4

数学建模的含义篇8

关键词:隐含语义索引;吉林省;农业知识;问答系统

中图分类号:TP391文献标识码:A文章编号:0439-8114(2011)13-2740-03

Application of Latent Semantic Index in Agricultural Knowledge Question Answering System of Jilin Province

XIAO Yan-hua,WANG Qing-lan,BI Ye-li,WAN Fa-ren

(Agricultural Economy and Information Service Center, Jilin Academy of Agricultural Sciences, Changchun 130124, China)

Abstract: The latent semantic index technology was applied to solve some problems with the existing function and in the professional process in agricultural knowledge question answering system. This technology could enhance or reduce the influence of words on the semantic in the document and it also could make the semantic relationships more clear, thereby realized the natural language search to a certain extent. The interference from identity and poly semantics was eliminated and better search results obtained.

Key words: latent semantic index; Jilin province; agricultural knowledge; question answering system

农业作为基础产业,是社会信息化不可或缺的一部分,所以农业必然会受到以计算机网络技术、多媒体技术和智能技术为特征的信息化浪潮的洗礼。目前农业科技人员和农民经常借助各种搜索引擎进行农业信息搜索。由于搜索引擎不是为农业领域设计的,多数搜索的结果往往不能满足他们的需求,农业知识问答系统正是在这种情况下发展起来的。

从大量农业信息中迅速而准确地获取最需要的信息是农业知识问答系统发展的困难之一。如何使现有的吉林省农业信息资源得到充分有效地利用,提高吉林省农业信息化服务的质量,已经成为农业科研人员研究的一个热点。隐含语义索引(LSI)是近年来逐渐兴起的不同于关键词检索的搜索引擎解决方案,其检索结果的实际效果更接近于人的自然语言,在一定程度上提高了检索结果的相关性,目前已被逐渐地应用到图书馆、数据库和搜索引擎的算法当中。隐含语义索引通过对原文档库的词-文档所建立的矩阵的奇异值分解计算,进而取其前k个最大的奇异值,然后用对应的奇异矢量构成一个新矩阵,用其近似地表示原来文档库的词-文档矩阵。因为新的矩阵消减了词和文档之间语义关系的模糊度,所以这种方法更有利于信息检索。

1隐含语义索引的基本原理

因为文本和词汇之间存在着一定的相关性,所以若干篇文本和若干个词汇由他们之间的相关性构成语义模型;使用数学的算法和计算机技术,分析此模型并对其进行计算和处理,保留文本与词汇间最主要的相关性,去除其他冗余、次要的影响因素,于是得到了优化后的模型;最终构成的语义结构和原始的文本、词汇的相关结构进行比较,规模要小很多,并且还保留了其中主要的相关性,用此模型挖掘文本和词汇的隐含关系;在即将进行的检索中,用该语义结构作为基础,统计出词汇与文本间的隐含相关度[1]。

在向量空间中,每个文档都可以表示成词的向量空间矢量Di=(wi1,wi2,…,wim)(T1,T2,…,Tm)T,这样每个词条也就可以表示为文档空间的矢量Tj=(w1j,w2j,…,wnj)(D1,D2,…,Dn)T,词条和词条之间的相似性用向量夹角余弦来计算。

在隐含语义索引算法中,一个文档库可以被表示成一个m×n的词-文档大矩阵A。其中n表示库中的文档数,m表示库中包含的所有不同的词的个数。即矩阵A的每一行对应一个不同的词,矩阵A的每一列对应一个文档。A表示为:

A=[aij],1≤i≤m;1≤j≤n

矩阵中的元素aij是文档Dj中的特征项Ti出现的频度或其权重。实际应用中,因为词与文档的数量可能会很大,词在单个文档中出现又非常有限,所以A一般是高阶的稀疏矩阵。

这时利用向量代数的相关知识证明得知,可以把矩阵A分解成三个矩阵的乘积,即:

A=UΣVT

式中,矩阵Σ表示对角线矩阵,矩阵A的奇异值是对角线上的元素。矩阵U和V的列向量都是正交归一化的。U是m×r的“左奇异值向量矩阵”;V是r×n的“右奇异值向量矩阵”,r是矩阵A的秩,并且有:

U=VTV=In(In为n阶单位矩阵)

矩阵A的分解过程[4]如图1所示。

前k个列构成A的近似矩阵Ak,其秩为K。这样就可以得到一个新的近似分解矩阵Ak:

Ak=Uk×Σk×VTk

矩阵Uk与矩阵Vk的列向量都是正交的向量。所以我们就可以用Ak近似地表示原词、文档矩阵A,矩阵Uk和矩阵Vk中的行向量分别表示词和文档,在此分解方法的基础上,再进行农业知识相关的文档检索或其他各种文档处理。这就是基于隐含语义索引的吉林省农业知识问答系统的基本思想。

尽管隐含语义索引是用文档中包含的词来表示文档的语义内容,但是隐含语义索引算法中文档概念的可靠性并不能完全用文档中的词来表示。因为文本中词的多样性,在很大程度上掩盖了词和文档之间的关系,隐含语义索引则通过对原文档的向量矩阵的奇异值进行分解,取分解后的k阶近似矩阵,这样做一是消减了原词、文档矩阵中所包含的“噪声”[2],例如同义词,使词和文档之间的语义关系更加凸出;二是使得词、文档的向量空间维数大大减少,进而可以提高有关农业知识文档的检索效率。

2基于隐含语义索引的中文文本检索系统

本系统主要由抽取系统和问答系统两个模块组成。抽取系统是问答系统的后台支撑,主要是每天定时抽取大量关于农业技术的问答信息,对这些问题进行过滤并存入数据库,最终生成索引数据库。问答系统是解决用户问题的核心,主要有问题分析、语义计算、答案生成3个模块。问题分析模块主要是对用户提出的问题进行分析。将分析结果提交给语义计算模块、分词之后,经过计算权重,生成对应向量。答案生成模块主要是通过把问题向量映射到数据库中的备选问题组成的词-句子向量空间完成答案的选取。总体系统框架如图2所示。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

基于隐含语义索引的农业技术问答系统检索的主要步骤分为5个,即:

1)词、文档向量矩阵A的建立。利用无词典分词算法,对库中的文本进行词条的切分和词频的统计,建立文档库的词、文档向量矩阵A,并对其进行归一化处理[3]。

2)奇异值分解。对建立的矩阵A按前面所述方法进行奇异值分解,得到一个矩阵Vk,矩阵Vk中的每一行对应库中的所有文档。

3)查询向量的投影。把查询向量投影到变换后得到的等价的k阶词、文档矩阵中,即为矩阵Vk中的一行向量。

4)相似性计算和度量。利用向量距离公式或向量夹角余弦公式计算相似度,根据向量间的相似性度,查找与查询结果最相似的集合,按相似度的值从大到小排列,并将相似度大于某值的文档返回[4]。

5)反复查找,直到结果满意。根据查询结果的满意程度,如果不满意则用上一次的查询结果来改修正查询,重新查找最相似的文档,这种过程可以循环进行,直到满意为止。

2.1问题分析模块

问题分析模块的主要任务是分析出用户的意图。首先根据用户所提的问题(如:请问如何种植黄瓜?),去掉一些和礼貌用语有关的词,及一些语气词(如,请问、吗、吧等),分析出名词、副词、形容词等主关键词集合(如何、种植、黄瓜),同时还要进行同义词扩展,然后把分析出的关键词提交给语义计算模块。

2.2语义计算模块

语义计算模块是对问题进行权重计算,生成特征向量和进行语句相似度计算。权重计算与生成特征向量是语句相似度计算的基础[5]。语义计算模块主要是进行语句相似度计算。

2.3答案生成模块

答案生成模块根据相似度计算结果和用户提问句式,生成答案列表和选取答案。

采取的策略:首先根据用户所提问题判断其句式。句式确定之后,从相似度大于一定阈值的答案中选取句式最吻合的5个问题的答案作为用户所提问题的答案。

试验数据为数据库中的2 000个问题和其对应的答案,经过预处理生成2 123×2 000词-句子矩阵,对隐含语义索引技术和常用的分类技术的准确率进行对比(图3),试验结果表明,前者要明显好于后者,这是因为隐含语义的模型在一定程度上减弱了或者排除了每个类中的噪声词汇。但隐含语义索引技术目前还不能处理文本的全面语义,这样在某些应用中的表现不如常用的分类算法,因此还需要对语义算法更深入地研究。对于整体文本分类而言,隐含语义索引技术克服了传统模型中的许多不足,在应用中已取得了很好的效果。

3小结

农业知识问答系统是一个综合的、复杂的系统,涉及到许多信息处理的技术问题。由于农业知识的复杂性和特殊性,以往的信息检索技术很难解决信息中的同义性和多义性问题。本文通过把新型的信息检索方法――LSI引入到农业知识问答系统中,为农业知识问答系统检索技术提出一种新的思路及流程。试验证明该技术表现出明显的性能优势,有效地解决了噪声数据对分类带来的负影响,提高了问答系统解答问题的准确率。

参考文献:

[1] 戚涌,徐永红,刘凤玉.基于潜在语义标引的WEB文档自动分类[J].计算机工程与应用, 2004,40(22):28-31.

[2] 余正涛,樊孝忠,郭剑毅,等.基于潜在语义分析的汉语问答系统答案提取[J].计算机学报,2006,29(10):1890-1892.

[3] 周文,龚礼明,蒋岚.隐含语义检索及中文样本分析实例[J].计算机应用,2004,24(Z1):273-276.

[4] 魏保子,王儒敬.隐含语义索引在农业技术问答系统中的应用[J]. 微电子学与计算机,2008(7):48-51.

[5] 王春红,张 敏. 隐含语义索引模型的分析与研究[J]. 计算机应用,2007(5):1283-1288.

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文

上一篇:电力网络安全的重要性范文 下一篇:外语学科核心素养范文