中原文化的基本特征范文

时间:2023-12-22 11:29:48

中原文化的基本特征

中原文化的基本特征篇1

关键词:统计特征;模糊C-均值聚类;图像二值化;权值

中图分类号:TP391.4文献标识码:B

文章编号:1004-373X(2009)12-099-04

Fuzzy Clustering Method and Its Application Based on Statistical Characteristics Weighting

YE Haijun

(China Academy of Electronic and Information Technology,Beijing,100041,China)

Abstract:A weighting fuzzy C-means clustering method based on statistical characteristics and the weighting value′s calculation method based on statistical characteristics are proposed,which sets out from the traditional target function clustering method.The two kinds of weighting fuzzy clustering method are applied to image binarizatation by utilizing one-dimensional gray characteristic of image and one-dimensional gray statistical characteristic which is weighting value,two-dimensional gray characteristic of image and two-dimensional gray statistical characteristics which are weighting value.The paper shows result comparison of image binarizatation with other image binarizatation methods detailedly.The application examples show that the method can realize image binarizatation availably.

Keywords:statistical characteristics;fuzzy C-means clustering;image binarizatation;weight

0 引 言

模糊聚类分析是多元统计分析的一种,也是无监督模式识别的一个重要分支。模糊聚类分析被广泛应用于模式识别、图像处理、知识发现、计算机视觉和模糊控制等许多领域。模糊聚类分析已有很多方法,在基于目标函数的聚类方法中最具有代表性的是模糊C-均值聚类方法(Fuzzy C-means,FCM)[1,2],最初又称ISODATA聚类方法,它是由Dunn[3]从硬C-均值聚类方法(Hard C-means,HCM) [4]引出的,后又经过Bezdek归纳并加以完善。FCM方法是通过对目标函数的迭代优化实现对给定有限样本集的划分[4]。在当前基于目标函数的模糊聚类分析方法研究中,都是基于这一基本思想而提出的算法。

这里从分析给定样本集合中样本点本身、样本点与聚类中心距离、样本点隶属度和样本点统计特征出发,提出了基于统计特征加权的模糊C-均值聚类方法(Weighting Fuzzy C-means,WFCM),并将该方法应用于灰度图像的二值化。

1 模糊C-均值聚类方法(FCM)

对于给定的有限样本集X={x1,x2,…,xk,…,xn},xk(k=1,2,…,n)是第k个样本的特征向量。假如X被分成C类,则X的模糊划分空间Ef可表示为:

Ef={μik|μik∈[0,1]};对任意k,∑ci=1μik=1;对任意i,0

式中:μik表示样本集X中第k个样本点xk隶属于第i类的隶属程度,即对于X中的任意样本点xk,其隶属于第i类的隶属度在区间[0,1],并且X中每个样本点xk隶属于C类的隶属度之和为1。设pi(i=1,2,…,c)表示样本集中第i类的聚类中心,pi=(pi1,pi2,…,pis)∈Rc,则可定义FCM方法的目标函数为:

Jm (U,P) = ∑ci = 1∑nk = 1μmik (dik )2

s.t.U∈Ef,m∈[1,+∞)(1)

式中:U=[μik]c×n是隶属度矩阵;P是聚类中心矩阵;m是模糊加权指数,又称平滑参数,用以控制模糊聚类的模糊程度。m越大,模糊程度越大;m越小,模糊程度越小。由于m用来控制隶属度在各类之间共享的程度,所以m越大,模糊性就越大。引入模糊加权指数m的含义是:如果不对隶属度进行加权,则从硬聚类目标函数扩展到模糊聚类目标函数就没有什么实际意义。目标函数Jm(U,P)的值反映了某种差异性定义下的类内紧致性,Jm(U,P)越小,聚类越紧致。dik是一种距离范数,表示样本元素xk与第i类的聚类中心pi之间的距离dik,是元素点与聚类中心的相似程度,一般可以表述为:

d2ik=xk -pi A=(xk-pi)TA(xk-pi)(2)

式中:A是s×s阶的对称正定矩阵;用I表示单位矩阵,当A=I时,dik表示欧氏距离(Euclid);当A≠I时,dik表示马氏距离(Mahalanobis)。

为了使得模糊聚类的目标函数达到最优解,可取聚类的准则,即在极值∑ci=1μik=1的约束条件下,使得min[Jm(U,P)]。因此,该问题可以理解为带约束条件的最优化问题,即在隶属度∑ci=1μik=1的约束条件下,使得min[∑ci=1Wk(μik)m(dik)2]。依据最优化计算方法,可以运用拉格朗日乘数法求解上述最优化问题,即得到U和P。首先利用目标函数Jm(U,P)和隶属度约束条件来构造拉格朗函数:

Y = ∑ci = 1(μmik )(dik )2 + λ(∑ci = 1μik -1)(3)

由Jm(U,P)/Pi=0,即可得到聚类中心:

Pi=∑nk = 1(μmik )xk/∑nk = 1(μmik )(4)

由Y/郸ik=0,即可得到隶属度:

μik=1/∑cj=1(dik/djk)2m-1(5)

根据聚类中心、隶属度和目标函数之间的迭代运算,即可求得样本集的聚类中心值和各样本点的隶属度值。依据上文叙述,FCM方法的具体步骤如下:

(1)初始化:取模糊加权指数m,聚类的类别数c(2≤c≤n),n为数据样本点的个数,迭代停止阈值ε为一小正数,初始的隶属度值U(0),以及迭代次数l=0;选择任一距离内积范数•;

(2)由初始化值,根据公式P(l)i =∑nk = 1(μmik )(l)xk /∑nk = 1(μmik)(l)可得到聚类中心P(l)i ;

(3)由聚类中心P(l)i 可得到隶属度U(l+1);

(4)当|Jm(U,P)(l+1)-Jm(U,P)(l)|≤ε时,迭代停止;否则l=l+1,重复步骤(2)和步骤(3)。

2 基于特征加权的模糊C-均值聚类方法(WFCM)

本文提出的基于特征加权的FCM方法,其加权的目标函数主要考虑了4个重要因素:样本点本身的特性、样本与聚类中心的模糊关系、样本点与聚类中心的距离、样本统计特性对模糊聚类的影响程度。现定义加权的FCM目标函数为:

Jm (U,P,W) = ∑ci = 1∑nk = 1Wk μmik (dik )2

s.t.U∈Ef,m∈[1,+∞](6)

式中:Wk为样本元素xk的权系数,主要作用在于将聚类中心向权值大的样本调整;∑nk=1Wk=1,当Wk=1/n时,WFCM变为FCM,即每个样本对任意聚类中心的作用相同。根据FCM方法的求解原理,其WFCM方法的具体步骤如下:

(1)初始化:取模糊加权指数m,聚类的类别数c(2≤c≤n),n为数据样本点的个数,迭代停止阈值ε为一小正数,初始的隶属度值U(0),以及迭代次数l=0;选择任一距离内积范数•;

(2)由初始化值,根据公式:

P(l)i =∑nk = 1W(l)k(μmik)(l)xk/∑nk = 1W(l)k(μmik)(l)

可得到聚类中心P(l)i;

(3)由聚类中心P(l)i可得到隶属度U(l+1);

(4)当|Jm(U,P,W)(l+1)-Jm(U,P,W)(l)|≤ε时,迭代停止;否则l=l+1,重复步骤(2)和(3)。

3 基于统计特征的权值计算方法

对于给定的有限特征样本集X={x1,x2,…,xk,…,xn},xk=(xk1,xk2,…,xkt,…,xkm) (k=1,2,…,n)是描述第k个样本的m维特征向量。由于样本集中样本点本身的特征向量个数与特征样本点总数之比反映了该样本点在特征样本集合中的统计分布情况,所以基于统计特征的权值计算方法为:

Wk=特征向量等于xk的样本数样本点总数n(7)

式(7)中:Wk值的大小表示特征样本点xk对特征样本集的重要程度。

4 WFCM方法在灰度图像二值化中的应用

文献[5-7]给出了基于灰度直方图的图像模糊聚类分割方法。这里依据上文提出方法的思想,分别给出一维灰度统计特征和二维灰度统计特征两种情况下的加权模糊C-均值聚类算法的图像二值化结果。

4.1 基于一维灰度统计特征加权的WFCM方法应用

设原灰度图像I(i,j),其图像大小为M×N(i=1,2,…,M;j=1,2,…,N),则一维灰度统计特征可定义为:

H(i)=n(i)/(M×N),i=0,1,2,…,255(8)

式中:n(i)是灰度值为i的像素在图像I(i,j)中出现的次数;H(i)为概率。此时的权值定义为:Wi=H(i)(i=0,1,2,…,255)。这时输入算法的特征就是原图像I(i,j)的一维灰度值,即xk=(xk1,0),xk1=I(i,j),k=1,2,…,M×N。

4.2 基于二维灰度统计特征加权的WFCM方法应用

由于图像每点像素值与其邻域空间的像素值有很大的相关性,因此可利用图像的这一特点构建二维灰度统计特性。对原灰度图像I(i,j),J(i,j)是I(i,j)经过二维中值滤波器滤波以后得到的图像。因为中值滤波对干扰脉冲或点状噪声等有良好的抑制作用,所以利用该滤波器对原图像滤波能取得好的平滑去噪作用。设一个滤波器窗口为A,尺寸为N=(2k+1)(2k+1),则对于图像{Iij,(i,j)∈Z2}(这里(i,j)为取遍Z2的某子集)的二维中值滤波器有以下定义:

Jij=med{Ii+r,j+s,(r,s)∈A}

在此,中值滤波所采用的窗口大小为3×3或5×5,即以输入图像I(i,j)各点为中心的3×3或5×5邻域的中值作为输出图像J(i,j)该点处的像素值,则[I(i,j),J(i,j)]就组成了一个二元特征向量组。此时,即可定义二维灰度统计特征权值H(s,t),s是原始图像I(i,j)的灰度值;t是I(i,j)经过二维中值滤波以后的灰度图像J(i,j)的灰度值。由此二维灰度统计特征就可定义为:

H(s,t)=n(s,t)M×N, s=0,1,2,…,255;

t=0,1,2,…,255(9)

式中:n(s,t)表示灰度值分别为s和t的像素在图像I(i,j)和图像J(i,j)中出现的次数;H(s,t)为概率。可令带分类样本组成的二元组Ni=(s,t),(i=0,1,2,…,256×256-1)。此时权值可定义为Wi=H(s,t) (i=0,1,2,…,256×256-1),此时输入算法的特征就是原图像I(i,j)灰度值和滤波以后的图像J(i,j)灰度值,共二维灰度值,即xk=(xk1,xk2),xk1=I(i,j),xk2=J(i,j),k=1,2,…,M×N。

4.3 实验结果与比较

在提出的算法中,取m=2,ε=0.01,距离范数•为欧式内积。由于是对灰度图像进行二值化分割(即为2类),则c=2。灰度图像的二值化可以看成灰度图像聚成两类[8],再将两类的中心点值变为{0,255}。其FCM和WFCM算法收敛后的图像二值化处理过程是先设定隶属度阈值ζ(0.5≤ζ

xk1=255,若μ1k≥ζ

0,若μ1k

式中:μ1k≥ζ表示第k个象素点隶属于第一类的隶属度大于ζ,则取第k个像素点的灰度值为255,否则取该点的灰度值为0。

图1是一幅洪水的合成孔径雷达灰度图像及其8种二值化方法处理结果。其原图中含有土地域、水域和浸润域(土地域与水域的公共域)共计3个区域单元。下面将本文提出的方法与其他经典二值化方法[9-11]的结果进行比较,图1(b)是otsu方法二值化结果,图1(c)是最大交叉熵方法二值化结果;图1(d)是最小交叉熵方法二值化结果;图1(e)是最大模糊散度方法二值化结果;图1(f)是最小模糊散度方法二值化结果;图1(g)是FCM方法二值化结果;图1(h)是一维统计特征加权WFCM方法二值化结果和图1(i)是二维统计特征加权WFCM方法二值化结果。

图1 原灰度图像和8种二值化方法处理结果图

从以上二值化方法的结果图中可以看出,采用最大交叉熵方法和最大模糊散度方法不能将原灰度图像中的土地域与水域分割。这与其算法本身以及与原图像中的灰度统计特征分布有关。采用ostu方法以及最大方差方法、最小交叉熵方法、最小模糊散度方法和FCM方法进行图像二值化,基本上能将土地域与水域分割,但浸润域仍然存在模糊性。采用一维灰度统计特征和二维灰度统计特征加权的WFCM方法能将土地域与水域分割,三个区域单元的纹理和交界处都能很好的区分,并保持了三个区域中内部的连通性和一致性。

上述8种二值化方法所确定的最优分割阈值如表1所示。

表1 8种二值化方法的最优分割阈值表

二值化方法otsu方法最大交叉熵方法最小交叉熵方法最大模糊散度方法最小模糊散度方法FCM方法一维统计特征加权WFCM方法二维统计特征加权WFCM方法

最优化阈值111225107152111中心点:

89.701 4

128.635 8 中心点:

89.623 0

101.663 8中心点:

88.704 5

101.574 3

从表1可以看出,给出的两种WFCM方法收敛后所得的聚类中心能较正确地定位聚类中心以及确定每个像素点所属的类别;而其他6种二值化方法所得的最佳阈值不能很好地分割原图像。

从提出的两种方法可以看出,利用二维灰度统计特征作为权值聚类时,相当于增加了一维灰度特征,也就是说利用了图像的两维灰度特征(原图像的灰度和原图像平滑后的图像灰度);利用一维灰度统计特征作为权值,相当于只利用了图像的一维灰度特征(原图像的灰度)。在原图像背景较复杂情况下,由于图像各区域之间的交界不明显,存在模糊性,这时采用二维灰度统计特征加权的WFCM算法能取得很好的二值化分割。在背景较简洁时,直接采用一维灰度统计特征加权的WFCM算法较方便,而且一维比二维的实时性要好。

5 结 语

在利用样本点的统计特征,提出了两种基于统计特征加权的模糊C-均值聚类方法,并将其应用于图像二值化处理中。在用于图像二值化时,可以利用图像的一维灰度统计特征和图像的二维灰度统计特征作为权值的WFCM方法。由于在对灰度图像二值化时,既考虑图像灰度分布,又考虑邻域相关信息,因而可以很好地保证图像各区域内部的连通性和一致性。此外,本文给出的利用一维灰度统计特征和二维灰度统计特征作为权值进行样本集聚类,这种思想可以拓展到多维情况。本文提出的算法思想可与合成孔径雷达成像算法相结合用于合成孔径雷达的目标定位、检测和识别。

参考文献

[1]Fan Jiulun,Zhen Wenzhi,Xie Weixin.Suppressed Fuzzy C-means Clustering Algorithm[J].Pattern Recognition Letters,2003,24:1 607-1 612.

[2]Duda R O,Hart P E,Stork D G.Pattern Classification[M].2版.北京:机械工业出版社,2004.

[3]张爱华.基于模糊聚类分析的图像分割技术研究[D].武汉:华中科技大学,2004.

[4]高新波.模糊聚类分析及其应用研究[M].西安:西安电子科技大学出版社,2004.

[5]刘健庄.基于二维直方图的图像模糊聚类分割方法[J].电子学报,1992,20(9):40-46.

[6]高新波,李洁,姬红兵.基于加权模糊C均值聚类与统计检测指导的多阈值图像自动分割算法[J].电子学报,2004,32(4):661-664.

[7]甄文智.抑制式模糊聚类算法及其应用[D].西安:西安电子科技大学,2003.

[8]丁震,胡钟山.FCM算法用于灰度图像分割的研究[J].电子学报,1997,25(5):39-43.

[9]赵勇,吴成茂.基于Itakura Saito散度的图像阈值法[J].现代电子技术,2006,29(15):88-91.

[10]章毓晋,图像分割[M].北京:科学出版社,2001.

[11]王向阳,王春花.基于特征散度的自适应FCM图像分割算法[J].中国图形图像学报,2008,13(5):906-910.

中原文化的基本特征篇2

作者简介:王成语(1984-),女,重庆人,硕士研究生,主要研究方向:图像处理、模式识别; 李伟红(1962-),女,四川自贡人,副教授,博士,主要研究方向:机器学习、模式识别。

文章编号:1001-9081(2011)08-02115-04doi:10.3724/SP.J.1087.2011.02115

(重庆大学 光电技术及系统教育部重点实验室,重庆400030)

()

摘 要:基于超完备字典的人脸稀疏表示方法的难点是其字典构成。针对此问题,首先采用双密度双树复小波变换(DD-DT CWT)提取人脸图像不同尺度的高频子带,然后根据能量平均分布最大原则选择能量较大的部分子带构成对应尺度的超完备字典。同时,将测试样本相应的人脸DD-DT CWT子带特征看成超完备字典中原子的线性组合,并组合多字典上的稀疏表示进行识别。在AR人脸图像库上进行了实验,结果表明该方法是一种有效的人脸特征表示及分类方法。

关键词:超完备字典;稀疏表示;双密度双树复小波变换;特征提取;多尺度

中图分类号: TP391.413文献标志码:A

Sparse representation of face feature recognition based on

multiple dictionaries of double-density dual-tree complex wavelet transform

WANG Cheng-yu, LI Wei-hong

(Key Laboratory for Opto-electronic Technology and System of Ministry of Education, Chongqing University, Chongqing 400030, China)

Abstract: The difficulty in sparse representation of facial images based on over-complete dictionary is the dictionary generation. This paper first introduced the Double-Density Dual-Tree Complex Wavelet Transform (DD-DT CWT) for filtering the high-frequency sub-bands and the principle of energy distribution for selecting some sub-bands as the feature of a facial image to form multi-scale dictionaries, then viewed the similar feature of a test sample as the linear combination of some atoms in the overcomplete dictionary, finally got the recognition results via ensembling sparse representations on these dictionaries. The experimental results on AR face database demonstrate the efficiency of the proposed algorithm.

Key words: overcomplete dictionary; sparse representation; Double-Density Dual-Tree Complex Wavelet Transform (DD-DT CWT); feature extraction; multi-scale

0 引言

由于人脸识别在国家安全、军事安全和公共安全领域的重要地位[1-3],使人脸识别技术研究受到各国研究人员的高度重视,近年来提出的各种研究方法各具特色,最典型的有主成分分析(Principal Component Analysis, PCA)[4]2、线性鉴别分析(Linear Discriminant Analysis, LDA)[4]3以及局部保持投影(Locality Preserving Projection, LPP)[4]3、局部二元模式(Local Binary Pattern, LBP)[5]等方法。研究表明,人脸识别的核心是人脸特征的表示(提取)问题。基于超完备字典的图像稀疏表示是去除图像冗余的一种有效方法[6],适于描述人脸这种具有非高斯(non-Gaussian)分布的图像集合。与传统的基于子空间的方法相比,提取得到的人脸稀疏特征更能体现人脸的分类特性。

基于调和分析的图像表示的基本思想[7]8,图像可以表示成有限(或无限)项基函数gm的加权和。即:

S∑M-1i1cmgm(1)

其中:S表示离散化的图像信号;cm为表示系数;gm为基函数也称为调和函数,常用的有傅里叶变换、余弦变换和小波变换等。但以上的正交基函数没有考虑到实际信号时频变化范围大或者图像的各种几何正则性,造成表示的不稀疏性。

基于超完备字典的图像稀疏表示方法采用超完备的冗余函数代替传统的正交基函数,组合成超完备字典,也称为冗余字典,或简称字典。对于每个输入的图像,只有少数几个基函数具有较大的响应输出,而其他基函数的输出近于零。和PCA不同的是,图像稀疏表示的基函数没有主次之分,要使输入图像得到最稀疏的表示,即有效地提取出足以描述图像特征的信息,超完备字典的选择很重要,需要尽可能地符合被逼近的图像的结构[7]10。字典中的基函数被称作原子。一般可以利用贪婪算法或者自适应追踪算法,从字典中找到具有最佳线性组合的很少的几项原子来表示这个图像。字典可以由任意函数集或者其变化构成,但应根据实际应用选取。目前常用的超完备字典构成方法有各种多尺度几何分析方法如脊波(Ridgelet)变换[8]、曲线波(Curvelet)变换[9]、轮廓波(Contourlet)变换[10]等。此类方法均是采用基波函数及其变化作为原子,用于表示具有不同几何特征的信号或图像,适用于重构、去噪等。

由于上述方法在对图像进行表示时,自适应地根据图像结构信息选取基函数,不同图像由不同的基函数及其变化线性组合得到,不能体现图像之间的关系,不适用于分类。本文提出基于样本双密度双树复小波变换(Double-Density Dual-Tree Complex Wavelet Transform, DD-DT CWT)特征的超完备字典,将待识别图像相应的特征描述为这些图像特征的稀疏线性组合,并组合多组稀疏表示(ensemble of sparse-representation)进行决策,得到识别结果。

1 基于稀疏表示的人脸识别方法

基于稀疏表示的人脸识别方法基本思想[11]是,将给定的第i类的ni个灰度人脸图像(训练样本)或者其特征作为稀疏表示模型中过完备字典中的列向量,由这些列向量构成过完备字典。对一个属于训练样本中的某一类的测试样本,经过与训练样本相同的预处理后,计算其在字典上的稀疏表示,理想情况下,稀疏表示中只有其所属类别上的系数非0,从而可以很容易将它归为该类。但实际情况中,由于噪声和模型误差等原因,在其他类别上也有数值较小的非0系数,此时可以将其归为最大系数所属类或者系数中最能线性表示测试样本的那一类。这即是基于稀疏表示的分类(Sparse-Representation Classifier, SRC)方法的思想,其实现流程如下所示。

1)输入:k类训练样本或者其特征的集合A[A1,A2,…,Ak]∈Rm×n,形成冗余字典,测试样本或其特征y∈Rm。

2)对A的每一列以及y同时进行归一化,使其2范数为1。

3)通过解如下问题求出测试样本的稀疏表示:

1arg minxx1

s.t. Axy

4)计算残差:ri(y)y-Aδi(1)2; i1,2,…,k。

5)输出:识别结果y所属类别。

identityarg mini ri(y)

可以看到,SRC方法中,针对不同的分类识别对象,其冗余字典的构成十分重要。SRC方法的提出者Wright等人[11]认为当字典中原子维数较大时,各种字典构成方法如传统子空间、下采样、随机映射方法下的识别率趋于一致,但文献[11]中的方法没有考虑到人脸图像的结构特性,造成表示的稀疏性不够。为此,本文采用双密度双树复小波,它具有类似人眼视觉特性的局部性、方向性、带通性,是一种类Gabor的小波,在本文的实验部分与Gabor也进行了比较。

2 基于双密度双树复小波变换的人脸特征字典

2.1 双密度双树复小波变换

2004年Selesnick提出的双密度双树复小波变换[12]综合了双密度小波和双树小波的优点,即具有平移不变性和抗混叠特性、基2冗余且不随尺度变化、更加近似连续小波变换和良好的方向性等特点,在图像去噪、图像增强、图像分割和运动目标估计中具有较大优势。

双密度小波变换[13]基于一个尺度函数和两个不同的小波函数,其中一个小波是另一个小波的偏移(偏移量为0.5),在实现过程中用过采样代替临界采样,由于双密度小波有两个小波函数,这样在同一个尺度内相邻小波间的频带间隔更小,因此与传统小波变换相比,具有近似的平移不变性。把满足希尔伯特变换关系的两个离散小波变换(Discrete Wavelet Transform, DWT)并联组成双树复小波变换。双密度小波变换和双树复小波变换组合到一起便得到DD-DT CWT。其迭代滤波器组如图1所示。

双密度双树复小波是类似于Gabor的方向性小波基。具有近似的平移不变性、有限冗余(4∶1)、优良的方向性(16个)等,满足作为一种好的图像表示方法应该具有的五个特征:多尺度、局域性、临界采样、方向性、各向异性。对人脸图像进行双密度双树复小波多层(多尺度)分解变换,多层分解是对低频部分不断分解以完成特定层数的分解,每层都得到4个低频子带和32个方向的高频子带。由于多层分解后低频子带信息已经丢失很多,得到的特征各个人脸图像趋于相似,对识别意义不大,而且图的边缘以及眼睛、鼻子、嘴、耳朵等细节信息被分配到各个高频子带图像中,所以该文选取高频子带作为人脸特征。

图1 双密度双树复小波的迭代滤波器组

2.2 基于DD-DT CWT的人脸特征构成策略

过完备字典对于原子维数与原子个数的大小要求:设A{gr,r∈Γ}为用于进行图像稀疏分解的过完备原子库即字典,gr为原子。由库的过完备性可知,原子个数r应远远大于原子的大小,即若用LA表示过完备库A中原子的个数,则LA应远远大于原子大小(维数)N。

双密度双树复小波高频子带在每个方向上有两个子带,取模变换得到16个小波系数幅值特征。为了满足过完备库对于原子维数的要求,本文提出按照子带平均能量的大小排列,选择平均能量较大的几个子带向量合成为人脸特征向量,作为原子组成稀疏表示中的冗余字典。

平均能量定义在某一尺度下,所有样本对应的子带上的小波系数的平方和取平均:

Ej∑ni1Eji∑ni1aji2; j1,2,…,16(2)

其中n为样本的总数。式(2)描述了各个人脸样本在进行多尺度分解后,在某一尺度上的各个子带上的能量分布。基于双密度双树复小波变换的子带平均能量体现了人脸的频带方向特征的分布。

基于DD-DT CWT的人脸特征向量构成框架如图2所示。

图2 基于DD-DT CWT的人脸特征向量构成框架

3 基于DD-DT CWT多字典人脸特征稀疏分类

根据DD-DT CWT高频子带的特性,不同尺度的子带分别包含人脸图像的不同特征,它反映了人脸图像不同的细节信息或整体信息。从人脸识别的角度,人脸的局部信息和整体信息对于人脸分类起着不同的作用,将这些具有不同鉴别信息的特征组合起来作为人脸特征的稀疏表示,从理论上将优于用单一尺度的子带表征人脸特征。

图3为该文提出的基于DD-DT CWT的多字典人脸稀疏特征构成及识别方法的构成框架。该文实验采用AR图像库子集,尺寸预处理为128×128像素,为此,DD-DT CWT分解需要进行3层以上分解实现降维,以满足库的过完备要求。而3层以上分解后,图像的能量大部分集中在3层和4层子带图像上,5层以上鉴别信息很少,该层分解得到的系数能量约为4层的1/4,约为3层的1/20,分析结果如图4所示。为此,该文分别采用DD-DT CWT的3层和4层分解得到的高频子带生成多字典(1,2),然后组合测试样本在字典1,2上的稀疏表示用于识别。

图3 DD-DT CWT多字典构成人脸特征稀疏表示及识别框架

图4 DD-DT CWT不同尺度分解得到的子带及其能量分布

图4中,图(b)、(d)、(f)的横坐标表示分解得到的16个高频子带,纵坐标表示双密度双树复小波的子带平均能量值,由式(2)计算得到。

4 实验与分析

实验采用AR人脸图像库,该库包含126人,每人26幅在不同光照,不同表情和不同遮挡的条件下采集的正面人脸图像。该文采用AR库的无遮挡图像子集进行实验。该子集包括119人,每人14幅正面无遮挡的图像,具有不同光照、表情变化。实验图像均以人眼中心点为基准对齐,裁剪到大小为128×128像素。随机选择7幅作为训练样本,其余7幅作为测试样本。图5给出该子集中一个人的所有样本。

图5 实验所用AR库子集中训练样本示例

实验1 与几种常见的典型的人脸特征表示方法比较。

实验包括PCA、LDA、LBP、LPP、单尺度Gabor(S-Gabor)(此处的Gabor[14]采用的类视皮层的HMAX模型,取其单尺度,最佳参数设置见参考文献)。

表1给出在AR库上进行的11组随机实验的平均结果,除LDA、LPP(样本种类数-1维)外,其他方法取与DD-DT CWT4层分解相近的维数(约为512维)下进行对比。SRC方法与最近邻(Nearest Neighbor, NN)分类相似,均以度量距离最近作为分类依据。不同的是SRC将待识别样本归类到与其最相近的类所属的类别,NN将待识别样本归类到与其最相近的样本所属的类别。表1也同时给出SRC与NN分类的实验比较结果。

表1 AR库上不同方法的识别率对比

%

图6为11组随机实验结果。从图6可以看出该文提出的基于DD-DT CWT多字典人脸特征稀疏表示方法明显优于传统的几种方法,且具有很好的稳定性。

图6 本文方法与典型的人脸特征提取方法的识别率比较

实验2 与DD-DT CWT单字典人脸特征稀疏表示方法比较。

SRC方法求取的系数向量中,最大分量代表与测试样本最相近的训练样本。本文中所有训练样本和测试样本均是经过中心化和归一化操作,系数最大分量越大,说明测试样本与训练样本的某一个更相似,理想情况为1,即测试样本可以由一个训练样本表示,这时各个原子之间差异最大,同时在其他样本上的系数越小,说明生成字典的方法最好。图7、8随机选取两个样本的系数向量进行对比。

图7、8中,横坐标表示字典中原子的序号,对应训练样本的序号。图7、8显示了单尺度双密度双树复小波特征构成字典用于基于稀疏表示的识别时,与Gabor类似,能较好地提取每个人脸样本的特征,从而使得分解得到的系数向量中最大值比其他方法更接近1,且系数向量的其他分量更接近0。

图7 第15人各种方法的字典对应的系数图

图8 第72人各种方法的字典对应的系数图

实验3 在具有平移的训练样本和测试样本下,与其他几种方法的比较。

SRC用于识别在应用中本身有两个制约条件:一是为满足过完备条件需样本较多;二是要求训练样本和测试样本较好地对齐。双密度双树复小波方法相对于传统的子空间方法在样本发生小像素平移时受到的影响相对较小,图9给出在AR库上的平移效果。

图9 各种方法在AR库上的图像平移像素数与识别结果关系

图9中,横坐标表示图像发生平移时,平移的像素数,纵坐标表示各种字典生成方法在图像发生平移时的识别率。从图中可以看出图像未对齐(发生平移变化)时,图像发生不同方向的平移变化对于识别的影响是不一致的,各个方向上双密度双树复小波方法的识别率均高于其他几种方法。

5 结语

相比于传统方法生成的字典,在基于人脸图像双密度双树复小波特征的单尺度字典上能得到对人脸图像的更为简洁的表示,其效果与模拟视觉机制的Gabor滤波器类似,同时多字典上进行分解挖掘图像的各个频率带的细节特征,对其进行组合识别,改善了识别效果。实验结果显示该方法在图像有平移时优于其他几种对比方法。

参考文献:

[1] 辜小花,龚卫国,杨利平,等.核保局鉴别分析人脸识别算法[J].仪器仪表学报,2010,31(9):2016-2021.

[2] 李伟红,陈伟民,龚卫国.一种人脸特征选择新方法的研究[J].电子测量与仪器学报,2006,20(2):16-20.

[3] 龚卫国.《人脸识别技术》专题文章导读[J].光学精密工程,2008,16(8):1452-1452.

[4] CAI D, HE X F, HU Y X, et al. Learning a spatially smooth subspace for face recognition [C]// 2007 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2007: 1-7.

[5] OJALA T, PIETIKAINEN M, HARWOOD D. A comparative study of texture measures with classification based on feature distributions [J]. Pattern Recognition, 1996, 29(1): 51-59.

[6] OLSHAUSEN B A, FIELD D J. Sparse coding with an overcomplete basis set: A strategy employed by V1? [J]. Vision Research, 1997, 37(23): 3311-3325.

[7] 邓承志.图像稀疏表示理论及其应用研究[D].武汉:华中科技大学,2008.

[8] CANDES E J. Ridgelets: Theory and applications [D]. Stanford, CA: Stanford University, 1998.

[9] CANDES E J, DONOHO D L. Curvelets: A surprisingly effective nonadaptive representation for objects with edges [R]. Stanford, CA: Stanford University, 1999.

[10] DO M N, VETTERLI M. The contourlet transform: An efficient directional multiresolution image representation [J]. IEEE Transactions on Image Processing, 2005, 14(12): 2091-2106.

[11] WRIGHT J, YANG Y, GANESH A, et al. Robust face recognition via sparse representation [J]. Pattern Analysis and Machine Intelligence, 2009, 31(2): 210-227.

[12] SELESNICK I W. The double-density dual-tree DWT [J]. IEEE Transactions on Signal Processing, 2004, 52(5): 1304-1314.

[13] JAYAWARDENA A. Design of double density wavelet filter banks [C]// Proceedings of the 7th International Symposium on Signal Processing and Its Applications. Piscataway, NJ: IEEE Press, 2003: 463-466.

中原文化的基本特征篇3

【关键词】机电一体化;系统;方案生成;模型

一、变换功能特征模型

系统的变换功能表达了为满足用户基本需求必须实现的过程对象从输入到输出的变换。物料、信号、能量、时间都可以做为过程对象,具有过程对象的成分、状态、种类及其它广义物理特征是其所具有的主要特征,在一般情况下,我们运用广义物理量来理解它。通过对当前功能表达模型怛7J的分析与研究,最后得出变换功能特征模型。过程对象性态特征和过程对象性态变换特征是变换功能的两大特征。

1.过程对象性态特征

过程对象输出性态特征和过程对象输入性态特征是过程对象性态特征的两大特征。在这个方案设计中,过程对象的输入、输出流是作为已知条件的,而系统则是一未知数,除了考察与外界对象的作用之外,其他的结构则不在考虑范围内。

2.对象性态变换特征

量变特征和质变特征是对象性态变换的特征。正负相关、正相关和负相关属于量变特征;成分、种类及其它方面的转换是属于质变特征。

二、目的功能(效应)特征模型

支持某一变换或技术过程是任何技术系统所要达的目的。而通过系统和操作者间的交互使交换过程对象(数据、能量、原料等)所需的物理效应进行传递。

通过科学效应的显现来表达目的功能所具有的功能。通过把效应作用在原理解的基础上抽象化,以此来分析出变换功能的基本机理。该功能具有两个特征,分别是:

1.效应生成方式特征

效应生成者与过程对象有直接的物理接触的叫做直接生成;效应生成者通过“垂直因果链”的方式向技术系统传递物理效应的叫做外部传入。

2.效应生成者特征

效应的生成方式是多样的,可以通过技术系统和操作者直接生成,也可以通过协同来生成。部件(定性)和原理参数(定量)则是技术系统中创造所需物理效应的主动要素。动态特征和静态特征是部件的输入和输出(能量,物料/信号)性态特征的两个基本类弄。输入量输出量的增大、减小和改变等量变特征是通过动态特征来表达的。输入、输出量本身的特征则是通过静态特征来表达的。输入、输出性态的变换则可以使作用原理解实现相应的功能。比如:输入、输出量本身的静态特征转换是压电元件装置的主要功能,也就是通过压力变换为电压而实现相应的功能;输入、输出量的动态特征则是气泡减阻装置的主要功能,也就是说,摩擦阻力等输出量的量变是通过流体运动粘度系数、流体密度系数和流体成分等输入量的量变来实现的。

三、机电一体化系统方案生成推理策略

机电一体化系统方案生成推理进程分为三个阶段。基于变换功能拓展的技术推理为第一阶段;基于技术的变换功能向目的功能的推理为第二阶段;目的功能向作用原理的推理为第三阶段。

1.基于变换功能拓展的技术推理

“技术”是指在某一功能变换过程中各子过程的类型和执行,以及过程对象和变换所需效应间在时间、空间上的相互作用。作为变换发生的方式,作用原理中的核心知识,技术具有重要的地位。如通过磨削和刀削技术可以使铅笔变得锋利。可以说,变换过程中的任何一个子过程都是通过相应的技术来完成和实现的。因此,变换功能域的方案解也可称为是一个技术结构。由操作者和技术系统构成的人/机系统通过技术面来达到功能变换的目的。比如:在书写时,人们运用铅笔这一技术系统,来实现铅笔书写的技术。也就是说,“技术”是联系变换功能和目的功能的一条纽带。

过程对象(名词)和功能动词(动词)可以和用来表达变换功能。因此,在对表达模型进行变换功能的拓展时我们可以利用这一功能。而基于过程对象的变换功能向技术的推理和基本于能动词的变换功能向技术推理是变换功能向技术推理的两种基本类型。同时,基于功能动词和过程对象的推理则是上述两种基本推理的综合。

2.目的功能向作用原理的推理

定性效应生成者(部件)和效应生成者是技术系统内部的两种效应生成者。因此,效应间的关系分为定量关系和定性关系两类。如果要采用作用原理的定量推理或定性推理,则需要设计要求功能的过程对象性态变换特征(名词)是量变,也就是将作用原理解为原理参数;而通过部件性态的变换来取得相应的功能的则是定性推理,也就是把作用原理解为部件。

3.机电一体化系统方案生成推理进程模型

功构映射观点和域间映射观点是单一功能求解的方案生成推理进程中所存在的两种观点。从功能到结构的推理映射序列是功构映射观点中应加以注意的一点。因为在进行单一功能求解时,只有明确实现所需要功能时所选用的技术,才能根据这一技术分析研究出最佳的作用原理解。也就是按照“功能——技术——作用原理”的步骤逐步推理和找出原理方案解。

方案生成在求解问题中是一个较明显的不良定义。从可操作性方面来看,由于方案生成初期阶段的系统功能信息都不够完整。如果仅仅依靠抽象的功能层分解,想得到完备的功能结构的可能性不大。其实,功能结构的生成和功能求解是互为因果、交替进行的。而在机电一体化系统方案生成进程中,三类映射模式,十二种映射关系是与系统功能求解的三个分过程中相对应的。下面,我们分别来看看:

①分解映射模式,解决变换功能、技术和目的功能的分解问题,也就是先可以通过进行分解映身来降低那些有待求解的比较抽象、复杂而难于直接求解的问题,使后续求解映射问题得到顺利的解答。

②求解映射模式。运用变换功能——技术——目的功能——作用原理的方式逐层或跨层映射来解决功能求解问题,最后使我们获取求变换功能的技术解、目的功能解和作用原理解。

③衍生映射模式,解决分功能解组合不匹配问题。在技术层、目的功能层和作用原理层时,关联分功能解进行组合形成总功能解的时候容易出现接口冲突的情况。在这种情况下,如果在接口冲突处衍生出附加分功能便可消除这种冲突。另外,整体作用原理解也是在生成合理完整的功能结构的过程中派生出来的。

参考文献

[1]PAHLG,BEITZW.Engineerring design:a systemtic pmcess(2nd edi-tion)[M].London:Springier,1994.

[2]牛占文,徐燕申,林岳等.实现产品创新的关键技术—计算机辅助创新技术[J].机械工程学报,2000.36(1):11.14.

中原文化的基本特征篇4

关键词: 高考地理试题 区域地理 复习

区域地理是自然地理和人文地理的“出发点和归宿”。许多自然地理和人文地理的案例都离不开区域地理的具体地理事物或地理现象,它们的分布、特征、成因、变化等,都是自然地理或人文地理的最好“注解”或“说明”。近年来高考试题有很多以区域地理内容为载体,考查学生的空间定位能力、提取有效信息能力、逻辑推理能力、综合分析能力、文字表述能力等。如2009年全国高考文综卷Ⅰ第36题、卷Ⅱ第36题,广东单科高考第33题,北京文综高考卷第36题,安徽文综高考卷第33题等。这就提示我们:在复习备考过程中,一定要重视对区域地理的掌握。区域地理的内容是复习地理知识的基础,许多图像判读技能的训练、基本概念的理解、地理要素间的联系、地理事物的分布、空间概念的建立、地理基本观点的树立等,都应在区域地理学习中完成。复习中应以高考考试大纲为依据,以高中自然地理和人文地理知识为指导,重视对知识的加工、整理、重组和联系,建立知识框架与体系,并巩固在图像或图表中。下面我谈谈在区域地理复习方面的几点做法和体会。

一、突出区域定位,建立空间概念

高考地理试题一般多运用有注记的经纬网地图、局部政区图、含有特殊地理事物注记(如湖泊、河流等)的地图、地理图表、资料、文字说明等为背景,在此基础上进行设问,提出选择和问答的相应要求。在解答试题中,区域定位往往是解开试题的第一道门槛,在此前提下再进一步考查学生对该区域重要原理和规律的理解程度及应用能力。为使学生越过这个门槛,在平时教学中教师要始终做到运用地图,“认识”区域。通过读、填、绘图训练,把地理知识落实在相应图形,努力做到“心中有地图”。训练中要注意区域定位训练。

1.经纬网定位。

经纬网是人们为了确定地理事物而创设的一个球面坐标体系,通过经纬网能十分准确地确定地理区域的位置,从而为正确解题打下扎实的基础。学生不可能把所有经纬度都记牢,因此掌握几条关键的经纬线和主要区域、国家的经纬度范围再由此推出大致的地理位置不失为一个好办法。

(1)经线:根据东西半球的界线20°W、160°E就可确定是东半球(亚、非、欧、大洋洲)还是西半球(南、北美洲),除此以外,还需掌握其它几条较具代表性的经线,如0°经线、30°E、60°E、90°E、120°E、150°E、180°、150°W、120°W、90°W、60°W、30°W通过的地形区、国家(行政区)、河流、海洋、城市等地理事物。如30°E:穿过欧洲中部、非洲东部;主要的地理事物有摩尔曼斯克(东侧)、莫斯科(东侧)、东欧平原和波德平原交界处、黑海、小亚细亚半岛(西侧)、地中海、开罗、尼罗河、东非高原(西侧)、南非高原(东侧)等;主要的气候有苔原气候、温带大陆性气候、地中海气候、热带沙漠气候、热带草原气候。

(2)纬线:赤道、南北回归线、30°N、60°N、30°S纬线通过的地形区、国家(行政区)、河流、海洋、城市等地理事物。如赤道:穿过非洲中部、东南亚、南美洲北部;主要的地理事物有刚果盆地、东非高原、维多利亚湖、马来群岛、亚马逊平原;主要气候有热带雨林气候和热带草原气候。

(3)主要区域、国家的经纬度范围:如南亚大致在60°E―90°E附近、10°N―30°N附近,中亚大致在50°E―80°E附近、40°N―50°N附近,日本大致在130°E―145°E附近、30°N―45°N附近,等等。

(4)重要(特殊)地理事物的经纬度:如北京(40°N,116°E)、巴拿马运河(10°N,80°W)、非洲的控制性经纬线(20°E、0)、秦岭(32°N―34°N附近)。

2.轮廓定位。

包括海陆、行政区、地形区等形状特点来确定相应地理位置。不同地区的行政区域,海陆轮廓、地形单元的形状千差万别,各有特色,对各种类型的轮廓进行对比分析,找出重要轮廓的鲜明特点就能快速、有效地判定其所在的地理位置。轮廓定位既可以根据面状地理事物的轮廓形状特征,又可以根据线状地理事物的分布特征(如山脉、河流、交通线、行政区划界线、海岸线等分布状况)和点状地理事物的相关位置(如城市、矿产、山峰等)分析定位。根据轮廓形状判断区域时首先要识别各种行政轮廓,侧重识别中国34个省级行政区轮廓和世界主要国家轮廓,其次要识别海陆轮廓,主要指大洲、大洋的轮廓,对一些著名的湖泊(如五大湖、贝加尔湖、里海等)、海峡、河流、山脉等也要关注。

3.特征定位。

根据自然地理特征、人文地理特征、文字资料、图例、注记等进行区域定位。

二、理清复习思路,构建知识体系

区域地理复习有规律可循,即通常所说的“地理八股”。区域地理特征往往从自然地理特征到人文地理特征。其中自然地理特征主要包括位置、地形、气候、河湖、生物、资源等;人文地理特征主要包括农业、工业、商业、旅游业、交通、人口、城市等。在此基础上运用高中自然地理、人文地理的相关知识进行整合、综合。掌握知识的层次、脉络及相互关系,绘出知识系统图或列出系统联系表,是复习的重要环节。如日本:

三、突出区域特征,类比区域差异

分析区域特征,比较区域差异是区域地理复习的重点,是解决区域问题的基础。区域地理涉及的内容繁杂,区域之间缺少必然的联系,复习时不要死记硬背。区域特征首先要抓住影响区域的主导因素,归纳出区域最具特色的特征。如干旱是我国西北地区最突出的区域特征,深居大陆内部是形成这一特征的主导因素;高寒的气候是青藏高原的主要特征,海拔高是形成这一特征的主导因素;欧洲西部地区,海洋性气候特征显著是本区最突出的区域特征,位于温带大陆西部是形成这一特征的主导因素;气候南北对称分布是非洲最突出的区域特征,赤道横贯大陆中部,气压带、风带在非洲大陆南北对称分布是形成这一特征的主导因素。其次要理清知识头绪,抓住知识联系,形成知识网络。抓住各地理要素之间联系,是地理学科学习最重要的方法之一。在复习中要弄清每一个区域各种自然要素之间、自然要素与经济发展之间的因果关系和制约关系,这样才能真正理解整个区域特征形成的前因后果,形成有利于记忆的知识结构和知识网络。如青藏地区的知识网络:

又如复习西亚和北非,有两条主线:①纬度位置副热带高气压带、信风带气候特点(高温干旱)农业生产特点(畜牧业和灌溉农业);②自然资源(石油)石油生产石油运输线路。

一个具体地区形成了其区域特征,而不同的区域之间其特征存在着差异性或相似性。两个不同区域间其特征的差异性和相似性一般是通过比较得出来的。“区域对比”是目前高考能力考查的一种重要模式。对比分析、抓区域差异还可以提高复习效率与效果,进一步巩固各区域的区域特征。区域比较的着眼点是区域的差异,主要表现在气候、地形、水文、植被上,也表现在对资源开发、区域发展和人地关系的影响上。在复习时进行区域对比应注重以下方面。

1.轮廓相似区域的比较。如智利和越南,非洲和南美洲,巴西和印度,英吉利海峡和马六甲海峡。

2.地表形态相似区域的比较。如阿尔卑斯山和喜马拉雅山,南美洲地形和北美洲地形。

3.气候特征及自然带相似区域的比较。如欧洲的温带海洋性气候与北美洲温带海洋性气候的比较,中亚与撒哈拉沙漠气候的比较。

4.区域综合特征相似区域的比较。如长江三角洲与珠江三角洲,日本与英国的比较等。

5.相邻区域的比较。如日本与蒙古气候的比较。

6.特殊线路连接的两个区域的比较。如亚欧大陆桥东西桥头堡的比较。西气东输起点与终点的比较。

7.区域特征有明显差异的两个区域的比较。如我国南方与北方地区的比较,西欧与北非的比较等。

四、运用高中地理原理,整合高初中地理知识,提高地理综合分析能力

从近年的地理高考题可以看出,区域地理所占比重较大,但区域地理主要是作为命题背景和切入口,对于地理事实往往要求利用高中地理的原理加以解释和分析。因此在区域地理复习中首先要在具体的区域地图的基础上,逐步学会运用高中地理的地理原理探究地理过程、地理成因及地理规律。例如,用南亚季风的高中地理知识解释南亚西南季风进退对南亚农业的影响。因此,在复习东南亚地理位置时,一定要结合板块知识,巩固东南亚火山、地震、滑坡、海啸多发的原因。用风带、气压带的高中地理知识,解释地中海气候在欧洲南部分布广泛的原因等。其次要注重区域地理的地理事实与高中地理原理之间的有效结合,整合高初中地理知识,突出地理主干知识和主干思维方式,提高地理综合分析能力。如西北地区的整合。

1.区域定位。

由西北地区的经纬度位置(大部分在40°N以北和120°E以西),得出西北地区为我国内陆地区。

2.区域特征。

3.区域问题及其原因、危害分析。

西北地区的自然环境以“干旱”为主要特征,在“干旱”的环境下,加上人类的不合理活动,很容易出现的土地荒漠化问题,再从自然和人为方面分析荒漠化产生的原因及其危害。

4.国土整治措施。

根据西北地区荒漠化产生的原因,以“人地协调”为核心,以“因地制宜”为原则等提出防治荒漠化的主要措施。

通过这一过程的学习,学生会对西北地区的区域位置、区域特征、区域问题等有全面认识,既能掌握西北地区相关的地理主干知识,又能培养和训练学习区域地理的思路和方法,提高地理综合分析能力。

五、理论联系实际,重视区域发展

发现区域发展问题、提出区域发展对策是研究区域地理的目的,也是近年高考关注的热点和焦点。复习中首先要重视区域问题,如南美洲热带雨林的破坏、中东的水资源问题、欧洲的人口老龄化问题、我国北方草原区的草场退化沙化、黄土高原和南方山区的水土流失问题等。其次要注意引导学生用可持续发展的观点对区域发展作出合理评价,并制定正确的发展策略,这是决定区域地理考题得分的关键。从近几年的高考情况看,尤其要重视中国区域地理的复习。在熟练掌握中国行政区划、人口、地形、气候、河流、铁路干线、自然资源等知识的基础上,要会分析典型地区如新疆、青藏、东北、黄土高原、四川盆地、云贵高原、沿海四个工业基地、台湾等区域的区域发展问题及发展策略等。如南方山区的水土流失问题:

六、精选练习,加强解题训练

在区域地理复习过程中,要适当做些与内容相关的练习题。所选题目应该立意明确,考察目标清晰。试题的情境设置和设问角度巧妙、科学、合理、恰当。题目使用的材料、数据准确;题目涉及的地图、图表规范,注记清晰;题目的答案准确,表述规范。训练时要以近年典型的高考试题为样本,一要通过实战训练,巩固所学知识原理;二要深刻体会命题意图和正确的解题思路,及时对错误进行诊断和纠正;三要注重审题、信息获取及解读、正确使用地理术语规范答题等解题方法训练。

如(2007北京卷36题)读图,完成下列问题。

(1)描述图示地区年降水量分布状况。

(2)说明图中河流特征及其原因。

(3)简述导致塔里木河流域荒漠化发展的人为原因。

(4)说明图中城市分布特点,概括城市化过程中需要关注的问题。

(5)简述途经乌鲁木齐的铁路在国际贸易中的作用。

解析:本题属于在既定区域微观图背景下的综合考查,区域识别的难度不大,较为关注区域特征的描述和人类活动带来的影响。利用题目提供的地理要素进行设题,解读区域图中显性和隐性信息进行解题,成为高考36题的基本思路。在分析问题的思路上着力,在描述问题的质量上着眼,关注学习细节和思维品质。

第(1)问:受地形的影响形成山地降水,本题根据图中等值线规律及降水量图例的显示特征,容易对区域年降水量的分布特征进行整体描述(自天山山脉向南北两侧递减)。

第(2)问:说明河流特征和原因,考查学生对地理概念的理解。首先要明确说明的对象是区域内的河流,很明显是内流区河流特征的描述,河流特征包括水系、水文特征。多内流河和时令河(河流类型描述),河流短小(长度属于水系特征),流量季节变化大(流量属于水文特征),有结冰期(水文特征)。然后对河流特征的成因进行逐一分析,形成一一对应,回归区域特征。

第(3)问:突出人类活动与环境不和谐的一面,荒漠化是西北地区主要生态问题,其成因分析是解决问题的出发点。过樵、过垦、过牧,以及水资源利用不当,是荒漠化产生的人类原因。

第(4)问:说明图中城市分布特点,首先在图中找到城市的位置,然后观察其分布特点,不难回答城市是沿河或铁路分布的。概括城市化过程中需要关注的问题,实质上是对教材知识的迁移,注意表述的全面性。

中原文化的基本特征篇5

针对许可回收规则征项和阈值的选取缺少定量分析的模型和方法的问题,本文在形式化定义参数模型的基础上,综合使用差分编码、信息熵和相关矩阵等统计分析方法描述特征敏感性和相关性,并提出了敏感突出、代价最小化、趋零一致性和翻倍稳定原则,以筛选特征项、界定阈值。根据用户使用企业级软件的数据,该方法能够从多个候选项中,选定CPU利用率作为许可回收规则唯一的特征项,并设定阈值为8%,判定时间间隔为1136s。实验结果表明,该方法简单有效,而且易于编程实现。

关键词:

特征选择;统计分析;规则定义;熵;相关系数

企业中的专业软件许可是一种价格昂贵且数量有限的重要资源,因此如何有效监控、回收“占而不用”的许可资源,降低许可应用成本,成为企业必须面对的一个现实问题。传统的软件许可管理是基于Flexnet软件的集中式管理方法[1-2],最近几年,一种许可证动态控制技术[3-4]逐渐在企业级软件的应用环境中部署使用。它通过在客户端安装插件,定时采集、分析CPU、网络IO、键盘/鼠标动作等特征,基于预定义的回收规则,判断许可的使用状态,主动释放“占而不用”的许可,能够有效减少管理员的参与。其逻辑处理流程如图1所示。此外,随着云计算、网格计算的应用实践不断深入,许可证的授权管理机制[5-6]和云环境中软件许可的管理[7-8]也逐渐成为研究的热点。

但是,文献[1-2]采用的方法管理员无法获知用户的实际使用状态,在许可不够用时,只能人工强制回收许可。文献[3-4]缺少对回收规则定义的定量规定,需要管理员根据经验设置;而且这种方式没有考虑特征项的显著性,以及特征项之间的相关性,所以会导致采集数据的大量冗余,进而影响分析的性能。因此,研究回收规则征项和阈值定义方法的重要性就日益凸显。本文在形式化定义参数模型的基础上,综合使用差分编码、信息熵和相关矩阵等统计分析方法,描述特征的敏感性和相关性,并提出了“敏感突出原则”、“代价最小化原则”、“趋零一致性原则”和“翻倍稳定原则”,用于特征项筛选和阈值界定。

1参数建模

定量统计分析方法的基础是建立形式化的参数模型。下面依次给出了假设、参数形式化和数据预处理的形式化定义,并说明了其实际含义。

1、1假设设定假设条件有利于降低建模复杂度,是形式化建模、分析的基础。四条基本的假设为:(1)企业级应用软件占用的本地硬件资源,会随着软件的运行而变化;(2)用户可随机使用软件;(3)采样间隔为8s,能够准确反映特征值的变化;(4)统计分析间隔是采样间隔的整数倍,记为N倍。假设(1)是根据客户端硬件资源使用情况,判断许可使用状态的最基本的前提条件;假设(2)指出了用户操作之间的独立性,进而可以推导出采样点之间,以及统计分析点之间是独立的;假设(3)、(4)简化了采样、统计的计算,使程序易于实现。因此,根据一个统计分析点,就可以确定出许可的当前状态。

1、2参数形式化定义根据前面的假设,对涉及的概念进行了抽象,给出了形式化的定义:

1、3预处理针对连续型数值,比如:网络IO,由于统计流量不可避免的误差,需要定义一个误差区间,这里选取波动范围是±0.5。经过区间限定,连续型数值退化为离散型数值。

2特征统计分析

2、1特征敏感性分析本文借鉴了差分编码和信息熵[10-12]的思想,通过信息熵衡量特征项的变化程度。特征敏感性分析包括三步:首先记录相邻采样点的特征值的绝对变化。最后,根据“敏感突出原则”,选择H(D(i))的候选特征项。根据假设(1),特征项应该对应用软件运行状态的变化反应快速,而且差异显著。根据实践经验,这里选择H(D(i))的阈值为1。“敏感突出原则”正是基于该条件,对候选特征项进行过滤。

2、2特征相关性分析特征项之间的相关性分析是降维的一个基本方法,本文采用Pearson相关性分析方法[13-16],衡量特征项之间线性相关性的强弱。值得注意的是,奇异点对相关性影响很大[17]。因此,首先要过滤奇异点,这里奇异点集合简单定义。如果P(V(i)=0|V(j)=0)>0.6,表示cfi,cfj在零值处的变化具有很强的一致性。根据假设(1),如果特征值为0,也就意味着该硬件资源空闲,用户没有与应用软件交互。所以,即使cfi,cfj在相关性上表现不强,只要二者具有趋零的特性,仍然可以认为cfi,cfj在判断空闲状态上,具有较强的“相关性”。

2、3阈值选择在统计分析间隔时间内,如果存在特征值大于下限,那么回收规则判断该软件状态为“活跃”,这意味着有交互或者后台任务;否则判定为“空闲”状态。

3实验验证

为了验证2中的统计分析方法,本文对单一用户一天中(10:04:35~17:34:38)的工作状态进行监控。该用户通过Xmanager软件远程登录应用服务器,操作GeoFrame企业版软件。实验选取4个典型的候选特征项,见表1。需要注意的是如果用户直接使用本地的应用软件,则需要监控本地磁盘IO,而不是网络IO。根据21中描述的方法,首先计算候选特征的信息熵,然后根据“敏感突出原则”,选择H(D(i))>1的候选特征,结果见表2。根据22中描述的方法,首先计算cf1,cf3,cf4之间两两的Pearson相关系数,并验证双尾显著性,结果见表3。显然,cf3,cf4具有显著相关性,并且前者的统计数值偏小易于计算,根据“代价最小化原则”,选择cf3。而cf1,cf3虽然线性相关系数不高,但是,P(V(3)=0|V(1)=0)=0.868,也就是说在CPU利用率为0时,上行网络IO也趋于零。根据“趋零一致性原则”,二者的相关性是有价值的,进而可以使用“代价最小化原则”,选择cf1作为回收规则中的特征项,因为从本地获取CPU信息比循环中断计算上行网络IO更廉价。根据23中描述的方法,计算得到N=142,即统计分析间隔1136s,近19min;因为选的是阈值下限,所以对应的W=8。至此,可以将精炼后的许可回收规则描述为:如果在1136s的142次采样结果中,Xmanager的CPU占用率都低于8%,则判定软件应用空闲,需要释放占用的许可资源。从图2中,可以比较直观地看到cf1,cf3,cf4在时间轴上特征值的变化趋势。虚线表示W=8的CPU阈值,实线表示CPU利用率的变化,细点线表示IO_up的变化,顿点间隔线表示内存的变化,许可回收规则判定为软件应用忙碌的时间点由三角形标记。可以看出以上判定规则对空闲发现是有效的,候选特征和阈值的选择过程清晰易懂,而且算法简单,易于编程实现。

4结语

实验证明,许可回收规则定义时,基于统计分析的方法能够通过定量的计算,明确候选特征项的敏感性和相关性,而本文提出的“敏感突出原则”、“代价最小化原则”、“趋零一致性原则”和“翻倍稳定原则”综合运用后,能够有效筛选特征项,并确定阈值。从另一方面来看,CPU、内存和IO仅仅反映了软件自身的运行状态,没有考虑用户与软件的交互行为。下一步的研究可能需要结合用户点击键盘、鼠标的操作行为,运用统计学原理,进一步充实回收规则。但是,植入钩子(hook)[18]采集用户行为,不仅CPU资源开销巨大,可能影响正常的软件使用,而且用户会有安全性的担忧。

参考文献:

[1]史明宏,唐浩FlexNetManager在大庆油田研究院软件集中管理中的应用[J]办公自动化,2013(4):28-30

[2]邓莉,范德军,孙胤航大型专业软件集中管控技术探索与实践[J]中国管理信息化,2014(22):93-94

[3]上海莱曼特信息科技有限公司莱曼特软件许可证动态释放软件LMTlicRecycler:中国,2013SR005134[P]2013-01-16

[4]无锡云科软件科技有限公司许可证动态控制器[EB/OL](2012-08-02)[2014-08-02]

[5]陈智聪基于浮动授权管理的许可证使用报表系统的研究与实现[D]广州:华南理工大学,2011

[6]李美蓉软件许可证授权管理系统的设计与实现[D]成都:电子科技大学,2011

[7]侯正雄,周兴社,王云岚,等网格环境中面向按需服务的软件license管理方法[J]。华中科技大学学报:自然科学版,2007,35(s2):140-143

[8]王寅峰,董小社,郭华,等网格环境中软件共享系统的License管理器[J]华中科技大学学报:自然科学版,2006,34(s1):5-8

[9]KIMM,CHENH,MUNSONJ,etalManagementbasedlicensediscoveryforthecloud[M]//ServiceOrientedComputingBerlin:Springer,2012:499-506

[10]周炯?,庞沁华,续大我,等通信原理[M],北京:北京邮电大学出版社,2005:67

[11]SHANNONCE,WEAVERWThemathematicaltheoryofcommunication[M]Urbana:UniversityofIllinoisPress,1971:1-10

[12]崔颖差分编码关键技术研究[D]北京:北京邮电大学,2013

[13]李秀敏,江卫华相关系数与相关性度量[J]数学的实践与认识:2006,36(12):188-192

[14]张宇镭,党琰,贺平安利用Pearson相关系数定量分析生物亲缘关系[J],计算机工程与应用,2005(33):79-82

[15]丁剑洁相关性分析技术在软件度量中的应用[J]陕西教育学院学报,2008,24(1):100-103

[16]STIGLERSMFrancisGalton'saccountoftheinventionofcorrelation[J]StatisticalScience,1989,4(2):7379

[17]NEYMANJOnthetwodifferentaspectsoftherepresentativemethod:Themethodofstratifiedsamplingandthemethodofpurposiveselection[M]//BreakthroughtsinStatisticsNewYork:Springer,1992:123-150

[18]倪步喜Windows的钩子技术及实现[J]计算机与现代化,2007(1):28-30

中原文化的基本特征篇6

[关键词]本体视图 特征项提取 智能检索

[分类号]TP391

随着Internet海量信息与用户专一需求之间的矛盾日益突显,寻找有效快捷的信息查询方法已成为In-ternet应用的当务之急。目前,主流的查询方法是以浅层统计模型(如向量空间模型)为核心的文本过滤方法。此方法虽然便于实现且不依赖具体领域和语言,但由于缺乏对文档的语义分析,因而无法挖掘文本深层次主题信息,更无法保证以此为核心的系统性能。为了更好实现对用户需求及Internet信息的语义理解,基于语义网的智能检索方法孕育而生。其中,基于知网的中文信息结构提取方法最为成熟,此方法可提取中文文本的结构信息及特征项,并根据用户需求对特征项进行计算,还可设定检索程序得到检索结果。但是,此方法在同类文本特征项提取方面存在缺陷,这使所构建的知识库在应对多个相关检索需求时显得分散而孤立。为解决这一问题,本文引入一种基于本体视图的特征项提取方法,此方法在已有领域本体的支持下构造本体视图,并以此视图为基础完成同类文本的特征项提取。此方法能有效改进原智能检索框架中的特征项提取环节,并能更好地理解非结构化数据源信息,提高智能检索的准确率和效率。

1 本体视图的概念

本体视图是从一个或几个本体提取出来的属性集。与数据库中视图相对应,本体库中只存放本体视图的定义,当本体中某个概念或属性发生变化时,本体视图也要随之改变。

本体视图的形式化表示为:OnAttr={a1,a2,…,an},本体有n个属性,OnAttr为本体的属性集。On-View=是一个视图,bj∈OnAttr,那么,由OnAttr可构造的本体视图集为OnViewSet={|bi∈OnAttr,m∈N},进一步扩展,得到OnView=,其中,ti∈T,T={string,float,int,date,time,curren-cy…},T为数据类型集。

例如:一个学术会议征文本体,其属性有:截稿时间、论文修改时间、汇款时间、会议召开时间、会议地点、联系方式、征文范围、会议名称、主办单位。从这个本体,我们可以创建如下视图:ovl:=;ov2:=,等。

2 半自动化智能检索流程

半自动化智能检索中,特定主题是根据用户的需求、根据经验抽象出来的。例如,有如下检索需求:“2007年的软件工程方向的征文信息”,可以根据经验得出这是一个关于“学术会议征文”的检索需求,则特定主题可以抽象为“学术会议征文”。由于这是一个人工处理过程,所以称之为半自动化智能检索,具体过程如下:首先通过网络蜘蛛(Web Spider)搜索特定主题,得到原始网页集(IWPS),IWPS通过富文本解析(RTP)后得到原始纯文本(IPTS)。同时,对于相关本体,构造本体视图;对于原始需求,通过需求分解,得到需求集。然后对IPTS,结合本体视图进行特征项提取和类型映射,得到可计算的特征项集。最后,对特征项集和需求集应用检索算法,得到最终的符合用户搜索主题的检索结果。如图1所示:

3 基于本体视图的特征项提取算法

3.1 算法步骤

・文本表示成向量T=(T1,T2,…,Tn),Ti为中文信息结构分量。

・计算本体视图的原象,即f-1(OnView),其中f-1()是f的反函数,f:T-OnView,记Dom=f-1(On-View),其中,Dom={X|X∈T∧V x∈x,f(x)=OVA∧OVA∈OnView}。

・利用中文信息提取器,从文本T中提取Dom相关信息,得到特征矩阵FVM。

其中,n为OnView的维数,m是Dom中元素的最大特征数(称为本体视图属性的最大维)。每一列对应本体视图某一属性的相关信息,列中维数不足者补0。若f(X1)=OVA,|X1|=m为本体视图属性最大维;f(X2)=OVA2,|X2|=n,且n

・对特征矩阵的每一列进行概念消重、合并,得到特征向量E=(,,…,),其中Vi是(Vi1,Vi2,…,Vin)消重、合并后的值。

・类型映射f:E-ME,ME是特征项集。ME={},其中,Oid表示本体视图标识,Aid表示该视图的属性标识,Type表示该属性的数据类型,Value是可参与计算的值。四元组称为一个特征项。例如,特征向量E中的一个分量e=,则f(e)=。

其中,OV1表示本体视图1,A1表示属性1,date表示日期类型。

3.2 算法举例

为了使读者更清楚地了解这一过程,下面通过一个实例来简单说明。

以“第四届中国软件工程大会征文通知”的文字片段为纯文本源,片段内容如下:“由浙江省信息产业厅主办,浙江省软件行业协会、希赛顾问团(CSAI)承办的第四届(2007)中国软件工程大会暨首届“天堂硅谷”中国软件产业高层人才论坛将于2007年6月16日至17日在美丽的西子湖畔召开……主办单位:浙江省信息产业厅、希赛顾问团(CSAI);承办单位:浙江省软件行业协会、希赛网;协办单位:《计算机教育》杂志社、浙江大学、杭州电子科技大学、杭州国家软件产业基地、湖南师范大学…时间:2007年6月16日至17日;地址:浙江省人民大会堂”。

・文本表示成向量T=(浙江省信息产业厅,主办,浙江省软件行业协会…,承办,…,2007年6月16日至17日,西子湖畔,召开,…,主办单位,协办单位,承办单位)。

・针对会议征文本体,取一个本体视图OnViewl=(,,):f-1(举办单位)={主办,承办,协办,主办单位,承办单位,协办单位};f-1(会议召开时间)={时间,于$(date)召开};f-1(会议地点)={地址,在$(address)召开};Dom=f-1(OnViewl):{{主办,承办,协办,主办单位,承办单位,协办单位},{时间,于$(date)召开},{地址,在$(address)召开}}。

・利用中文信息提取器,得到特征矩阵如下:

・对特征矩阵进行消重、合并。对第一列的“主办、承办、协办”进行合并,对第二列的“时间,于$(date)召开”进行消重,对第三列的“地址,在$(ad-dress)召开”进行消重合并,得到特征向量如下:E=(,,)。

・类型映射f:E-ME。ME={,

}。

4 实验

根据以上方法,我们实现了一个基于本体视图的半自动化智能检索程序模块。对检索结果评价,最好是将程序得到的结果与实际的相关信息进行比较,观察不同的本体视图和检索算法对检索结果的影响。这需要一个完整的应用系统。由于是半自动化智能检索,所以,我们采用人工判别的方法,对检索结果进行比较分析。本文选取“中国学术会议网”关于2007年的会议征文中的211条计算机科学类会议信息中的征文通知进行实验。其中,doc文档有27篇,PDF文档有9篇,部分会议没有征文通知,部分会议的征文通知是英文的,这些信息不在文本源选取范围内。按照半自动化智能检索流程,我们采用会议征文本体,其部分属性为A:论文截稿时间,B:会议召开时间,c:主办单位,D:会议地点,E:会议名称。针对会议征文本体,建立了如下的本体视图:本体视图OnViewl=;本体视图OnView2=。通过分解原始需求,得到如下需求集:检索需求Q1:2007年4月份的会议;检索需求Q2:2007年4月份在杭州召开的会议。说明:Q∈OnAttr,Q是需求集,OnAttr是本体属性集。当Q的需求超出当前本体属性集,则可通过扩展本体,得到OnAttr+,使Q∈OnAttr+。定义一个相关系数r,r=信息条数/检出信息条数,r越大,表明检索越准确,检出信息越接近目标。

OnViewl对应Q1,OnView2对应Q2。需求分解算法和检索算法在其他文章里讨论,这里不详细给出其细节,只利用需求分解算法和检索算法进行知识处理。利用半自动化智能检索程序,得到结果如下:

通过对征文通知进行分析,发现在一个征文通知中有如下信息“征文截止日期:2007年3月15日,修改稿截止日期:2007年4月5日”,由于本体视图的属性A是论文截稿时间,且映射为f-1(截止时间)=论文截稿时间,在特征项提取时得到的特征项为“征文截止时间”和“修改稿截止时间”的并集,这导致了误差的出现。

5 结语

中原文化的基本特征篇7

关键词:陕北民歌 原生态 民歌唱法 继承和保护

陕北民歌的保护和继承是一个老生常谈的话题,随着我国对非物质文化遗产的不断重视,我国逐渐加大了原生态文化保护的相关政策和经济投入,为很多的文化保护提供了良好的政策环境和氛围。今天的陕北民歌并不算当今的产物,而是经历了不同历史层次的发展和堆积形成的,陕北民歌经历了几个重要的历史发展时期,尽管内容有所变化,但是在发展中仍然保留了其基本的唱法技巧和艺术特征,为此我们将详细的分析和整理陕北民歌原生态特征,并提出具体的保护措施。

一、 陕北“原生态”民歌唱法的基本特征

传统意义上的陕北民歌是指广泛地流传于陕西榆林、延安等地的一种民族歌曲,其种类繁多,主要有信天游、小调、酒歌、榆林小曲等,是黄土文化的精华,陕北民歌有着强烈的地域特色,是我国西北地区最为典型的文化符号。陕北民歌最为常见也最为特殊的音调特征是在五声或者七声的基础上由调式主音以及上下五度音构成的双四度重叠音调,其唱法相当程度上和这种调式有关,即大量的应用了双四度重叠的音调架构,使得陕北民歌中有着大量的四、五、七、调音,因此其唱法并不总是语言声调的细微变化,宽阔的音域也让其唱法有种粗犷的美感,节奏和旋律非常简洁,有着鲜明的粗犷、洒脱的演唱感。由于陕北民歌有着明显的地域特点,因此在演唱陕北民歌的时候不仅仅要掌握其音调的特色和语言发音,更加要熟悉其唱法的艺术特点,研究其唱法特征也是实现其原生态民歌文化保护的重要途径。

二、 陕北“原生态”民歌唱法整理

(一)陕北民歌唱法的影响因素

优秀的历史文化赋予了陕北民歌深厚的文化底蕴,特殊的历史文化背景造就了其粗犷、率真、洒脱的艺术风格。研究陕北民歌的唱法不仅仅对典型的唱法进行归类和总结,更加需要注意陕北民歌独特的地域文化。首先是其方言特征,陕北方言最大的特点是有着非常多叠字和叠词,大量叠词的使用也体现在歌曲中,生动而且充满活力的叠词也给陕北民歌增添了独特的艺术魅力,因此必须注重陕北民歌的演唱的发音。不仅如此,陕北地区的语言特点也造就了民歌中衬字、衬腔的延长特点,浓烈的地方语言文化的音调和唱腔也是其民歌独具特色的主要原因,其中很多衬词的使用不仅让歌曲更加的口语化,而且也让歌曲的演唱呈现出一定的连贯性和完整性,同时也有利于演唱者抒发自己的情感。其次是句式结构,在陕北民歌形成的初期很多人都是不识字的,导致其歌词相对来说简单,而且句式结构也多以二段式居多。二句式和四句式是其主要的句式结构,但有的时候为了完成抒情和叙事的需求,会采取重复或者增加句式的方式,演唱者要充分的了解这种句式结构,对于不同的句式结构和特点要采取不同的延长方式和情感,达到最佳的表演效果。最后是调式特点,典型的陕北民歌是在五声的基础上有调式主音和上下五度构成的,这也是旋律构成的主要特点,即通过一个纯四度为主要特征的方式实现了对音调和其他非四度音调的完美融合,构成了其基本的音调结构和特征。

(二)陕北民歌的唱法汇总

1.平腔唱法,这种唱法是以真嗓演唱或者以真嗓演唱为主的方式,演唱的特点是高亢嘹亮,是最为主要的唱法。这种唱法决定了其音乐的流畅度和旋律线的大起大落,尤其是很多的中长音的处理中均采用这种平腔唱法,是陕北民歌的代表性唱法。

2.断腔唱法,断腔实际上就是运用断腔和断音的方式使得演唱过程富有弹性,一般这种唱法出现在很多题材比较悲伤和哀怨的曲目中,甚至有的时候会出现一字数断、一腔数断的方式,演唱者需要结合演唱内容和情感将每一个音符都唱的清楚,将每一词每一句都讲清楚。

3.衬词衬腔,衬词和衬腔是基于语言特征的带着明显感彩的一种唱法,特点是演唱的轻巧。除了一些基本的叹词和助词来保证上下的连贯和整体性外,还有很多传承和沿袭下来的很多衬词。一般这种衬词和衬腔的使用都有着特殊的用法,演唱时注意衬词与正词部分的连贯性,注重衬词的发音。

4.滑音唱法,即在演唱中加入上滑音、大滑音、打腔等来体现出作品中的种类、力度和方式,滑音的唱法要结合方言的发音,突出咬唱的棱角感,突出民歌演唱细腻以及多样化的情感表达,演唱时注意发音的圆润自然。

三、 陕北“原生态”民歌唱法的保护和传承

(一)注重原生态民歌唱法歌手的培养

民歌原生态的唱法和艺术特征是其艺术的灵魂,这种内在的东西与陕北民歌的曲谱和内容无关,更加是一种文化的高度浓缩和凝练。可以说是依托在充满特色的陕北黄土文化中的,没有口口相传的传授,也就不会出现这样充满艺术特征的民歌类型,而人是民歌传播和继承的主题,因此必须加强对陕北民歌传统唱法歌手的培养工作。陕北民歌的形成有着广泛的群众基础,对于歌手的培训并没有形成规模的系统,历来都是口耳相传,言传身教的继承。但是随着科技的发展,陕北人民的生活也发生了翻天覆地的变化,很多的年轻人纷纷离开自己的故乡外出打工,陕北民歌遭受到了时代的冷落。后继无人让陕北民歌这种原生态的唱法遇到了很大的问题,因此必须加大政策和经济投入,培养更多的原生态唱法的歌手,保证陕北民歌原生态的文化魅力。

(二)做好民歌的搜集和保护

其原生态的唱法是依托在民歌的基础之上的,尤其是很多典型的唱腔对应了一定的曲目,因此要想完整的保护原生态的唱法必须加强对曲目的搜集和保护工作。民歌的保护工作有以下两个工作的重点:首先是歌曲本身不能随意的篡改,保证其曲目的内容、形式、唱法的纯正,必须尊重当地的特色文化,保持曲目的原汁原味;其次是保护好歌曲的地方特色,民歌的韵味时期艺术的灵魂,民歌的韵味和歌声的唱腔有着直接的关系,例如山西口音就唱不出陕北的那种韵味来,对民歌的保护有必要也有责任尽可能真实的还原民歌的韵味,近两年对于陕北民歌的保护成为了一个热门话题,必须重视陕北民歌不能受到商业运作的影响。

(三)陕北基层文化教育部门的扶持

陕北民歌的传统唱法是一种非物质文化遗产,对于文化的保护离不开有关文化部门的支持。因此必须开展陕北民歌相关的活动,在丰富民众娱乐文化的同时,也为陕北民歌的保护营造一个良好的群众基础,在广大人民群众之中保护传统唱法的继承也有着一定的优势,因为他们世世代代扎根在这里,能够保存原始的陕北民歌文化。除此之外基层文化工作者们还可以积极地调动民间艺术团的力量,从民间选拔传统唱法的歌手,然后再回归到民间去演出,形成一种良性循环。值得一提的是当前很多主唱陕北民歌的民间文化团体都是扎根在基层的,他们发挥着重大的作用,例如榆林市民间艺术团、志丹县民间艺术团等,不仅仅坚持原始的传统唱法还经常下乡表演,贴近群众,对于民歌以及其独特的唱法的保护起到了无可替代的作用。

(四)重视学校教育的作用

学校教育在民歌唱法的保护和继承中体现着重要的作用,通过学校音乐专业对民族声乐的教育可以从理论上完成对民歌的深入研究,让原生态的民族音乐知识得以系统化和科学化,不仅仅有着重要的文化价值也有着重要的教育意义。通过学校途径加强对原生态民族唱法的保护主要有以下几个重要的方式:(1)教材的编写。要想实现这种原生态民族唱法的保护和传承,必须得到相关教育部门和文化部门的重视,调动研究民乐的专家、学者等从基层发掘原汁原味的民族唱法,通过当面接受他们的指导,也可以通过录像、录音等手段对这些原始的唱法进行搜集和整理,特别是对于很多年龄较高的老艺人身上去发掘他们原生态的演唱方式和特点。当然了在注重范围和数量的同时,也注重精品化的道路,注重搜集精品化的特色唱腔和曲目。然后对其艺术审美特征以及文化价值进行理论上的研究和分析,并结合曲目的简介、演唱技巧等完成教材的编写工作,并将教材付诸于实际的教学过程,给陕北民歌的唱法提供一套完整的理论和系统;(2)注重师资力量的建设,借助学校教育来保护这种原生态的唱法必须重视师资力量的建设。任何教学的战略和方针都是通过教师来开展的,因此必须重视教师对原生态演唱技巧以及艺术特征的理解,不仅仅具备过硬的理论技术基础,更加重视起艺术修养。想要将原汁原味的陕北民歌的唱法发扬和继承下去,我们也可以让学校很多声乐教师跟随当地著名的老艺人进行学习,学习原生态的民歌唱法;(3)授课对象和方式,授课的过程一定要因材施教,挑选一些嗓音条件较好的学生进行教育。授课方式要按照教材来进行规划,授课过程一定要注重民间文化和历史文化的影响,并开设基础的文化课程让学生了解陕北民族文化的内涵,采取主修课、辅修课等灵活的形式完成授课,并积极的组织学生深入民间,了解原始的民歌的唱法。

四、 结语

陕北民歌的演唱技法有着多样化的演唱技巧和独特的音调旋律,以及浓郁的地方特色,要想实现对陕北民歌原生态唱法的传承和保护,不仅需要了解其基本的演唱技巧、音调运用,更加需要了解陕北的文化,我们总结和归纳了原生态唱法的特点,并提出了一定的保护措施,希望能够对原生态唱法的保护起到一定的参考作用。

基金项目:

本文为陕西省社科界2015年度重大理论与现实问题研究项目《“原生态”民歌唱法的“非遗”保护与传承研究》,立项号:2015Z086。

参考文献:

[1]方顺利.从音乐教育视角看《民歌・中国》栏目对原生态民歌传承与传播的作用[D].开封:河南大学,2008年.

[2]刘海霞.现代传媒对原生态民歌传承与保护的两面性[J].作家,2011,(20).

[3]卫素霞.原生态民歌的传承与保护[J].石家庄学院学报,2009,(05).

[4]蒋文娟.论原生态民歌的传承与保护――以湖北省长阳土家族自治县为例[J].黄河之声,2011,(04).

[5]齐晓芳,吴素芹.原生态民歌的传承与保护[J].广播歌选,2008,(05).

[6]胡恩.浅谈民间团体对原生态民歌的传承与保护――以柏杨龙船调民间艺术团为例[J].课程教育研究,2015,(01).

中原文化的基本特征篇8

关键词:网络文本;信息过滤;

1.引 言

随着因特网不断普及和发展,一方面,因特网上的海量信息远远超过人们的想象;另一方面,面对如此海量的信息,人们往往感到束手无策,力不从心。如何帮助人们有效地选择和利用所感兴趣的信息,尽量剔除人们不感兴趣的信息,使之真正做到“各取所需”,已成为信息技术领域的热点问题。

2.信息过滤系统基本原理

一个最简单的过滤系统包括四个基本组成部分:信源、过滤器、用户、用户需求模板。图2.1是信息过滤系统的一个简单结构图。信源向过滤器提供信息,信息过滤器处于信源与用户之间,通过用户需求模板获取用户的兴趣信息,并据此检验信源中的信息,将其中与用户兴趣相关的信息递送给用户。反过来,用户也可以向信息过滤器发送反馈信息以说明哪些信息的确符合他们的信息需求,通过这种交互行为使得过滤器不断进行学习,调整自身的过滤操作,进而能在以后提供更多更好满足用户兴趣的信息。

图2.1信息过滤系统基本原理

3.信息过滤关键技术

3.1文本分类

文本分类是指依据文本的内容,由计算机根据某种自动分类算法,把文本判分为预先定义好的类别。文本分类是信息处理的一个重要分支,在信息发现领域中有着重要的用途,特别是在网络技术飞速发展的时代,对网络上的海量网页文本进行过滤和分类可使用户快速发现真正有用的文本。国外当前流行的文本分类算法有决策树、Rochcoi、K近邻(KNN)、朴素贝叶斯、Bayes法、支持向量机(SVM)等方法。而对中文文本分类的研究相对较少,国内外的研究基本上是在英文文本分类研究的基础上采取相应策略,结合中文文本的特定知识,用于中文之上。

3.2中文自动分词

中文自动分词方法有多种,一般来说大致可归结为以下三大类:基于词典的分词方法、基于统计的分词方法、基于规则和基于统计相结合的分词方法。

1.基于词典的分词方法

其基本思想是:事先建立词库,其中包含所有可能出现的词。对于给定的待分词的汉字串S,按照某种确定的原则切取S的子串,若该子串与词库中的某词条相匹配,则该子串是词,继续分割其余的部分,直到剩余部分为空;否则,该子串不是词,转上重新切取S的子串进行匹配。实际使用的分词系统,常常把基于词典的分词方法用于初步切分,配合其他方法的使用提高分词准确性。

2.基于统计的分词方法

基于统计的分词方法,根据字串出现的频率来判断这个字串是否是词。该方法对于大的语料,分全率还可以,但是对于小的语料分全率就比较低。

3.基于规则和基于统计相结合的分词方法

该方法首先运用最大匹配作初步切分,然后对切分的边界处进行歧义探测,发现歧义。最后运用统计和规则相结合的方法来判断正确的切分,运用不同的规则解决人名、地名、机构名识别,运用词法结构规则来生成复合词和衍生词。目前这种方法可以解决汉语中最常见的歧义类型:单字交集型歧义。并对人名、地名、机构名、后缀、动词/形容词重叠、衍生词等词法结构进行识别处理,基本解决了分词所面临的最关键的问题。

3.3文本预处理

预处理通常包括以下几种类型:

1.网页清洗。过滤系统预处理的第一步是进行网页清洗,去除web页中无用信息,从中抽取出页面文件的主要内容并且将其转化为纯文本。

2.词还原。词还原的主要目的是把一些变形词复原为该词原来的表示形式。

3.词性标注。词性标注是给文档中的每个词选择一个最有可能的词类。

4.去除停用词。停用词是指介词、冠词等语义内容很少的词,也指在文档集中的每个文档中都可能出现的高频词。停用词由于出现在很多文档中,因此对区分文档的内容作用不大,通常在预处理阶段被去掉。

3.4特征选择

特征选择(Feature Selection)的基本思想通常是构造一个评价函数,对特征集的每个特征进行评估。这样每个特征都获得一个评估分,然后对所有的特征按照其评估分的大小进行排序,选取预定数目的最佳特征作为结果的特征子集。选择的准则是经特征选择后能有效提高文本准确率。选择没有改变原始特征空间的性质,组成一个新的低维空间。特征选择具有降低向量空间维数、简化计算、防止过分拟合以及去除噪声等作用,特征提取的好坏将直接影响着文本过滤的准确率。 常用的特征选择方法有:文档频率、信息增益、互信息、χ2统计、交叉熵、期望交叉熵、特征频度、文本证据权和几率比等。

3.5用户需求模板的表示

用户建模方法主要分为显式和隐式两种。显式用户建模是一种简单而直接的做法,由用户提供某些关键字的集合作为其初始兴趣偏好描述。因为一个词往往具备多个含义,反过来同一个概念也可用几个不同的词来描述,依靠这种方法建立用户兴趣模板显然是不可靠的。这就要求系统必须把语义信息和上下文信息考虑进来,比如过去用户读过哪些文章、用户工作在什么组织内、用户订购了哪些书籍等。与前者相比隐式用户建模要实际得多。通过对用户的行为进行跟踪,隐式建模推测用户可能的喜好。用户的行为表现为查询、浏览页面和文章、标记书签、点击鼠标、拖动滚动条、前进、后退等。研究表明,简单的动作不能有效揭示用户兴趣,比如点击鼠标,而浏览页面和拖动滚动条的时间以及用户查询页面、访问页面、标记书签等行为则可有效揭示用户兴趣趋向。

3.6特征项权重计算

特征项权重计算有两种方法。一种是由专家或用户根据自己的经验与所掌握的领域知识,人为地将特征项赋上权重。这种方法随意性大、效率低,不适于处理大规模真实文本。另一种方法是利用文本的统计信息来计算项的权重,如词频、词之间的同现频率等。面目前被广泛采用的权重评价函数有布尔函数、开根号函数、TFIDF函数、WIDF函数等。

4. 结束语

本文分析探讨了网络文本信息过滤的关键技术。目前,国内关于基于内容的网络信息过滤技术的介绍还不多,希望本文系统化的介绍和分析能够对网络信息监控和管理工作提供有用的参考。

上一篇:电子合同流程范文 下一篇:电影产业的发展范文