基于多网页信息隐藏算法研究

时间:2022-03-11 02:32:12

基于多网页信息隐藏算法研究

摘要:利用网页来传递秘密信息,为了保护信息不被攻击,针对现有的网页信息隐藏技术隐藏量较少、鲁棒性差和隐蔽性差等缺陷,本文提出了一种新的结合多网页隐藏信息的方法,将隐藏信息以二值图像应用于网页隐藏中。实验证明,该方法较好的隐藏性和安全性,具有较高的使用价值。

Abstract: For keeping information from attack, the article aims at defects of existing web page information hiding technology such as small hidden information capacity, poor robustness, and poor elusive. The article put forward a new method of hiding information based on many web pages, it hided the information in web pages by binary image. This method has good hidden and safe performances and higher applied value as proved by the experiments.

关键词:信息隐藏;网页;HTML;标记

Key words: information hiding;pages;HTML;tags

中图分类号:TP39文献标识码:A 文章编号:1006-4311(2011)23-0129-02

1信息隐藏

信息隐藏是把信息以不可见的方式隐藏在普通的通信载体中,让第三方在主观上难以察觉秘密信息的存在,不同于传统的加密,信息隐藏技术必须考虑正常的信息操作所造成的威胁,也就是正常的数据操作对隐藏信息不能造成破坏。目前信息隐藏技术已成为信息安全和多媒体版权保护的一个研究热点。根据信息隐藏的目的不同和技术要求,信息隐藏技术具有如下:①不可感知性:加密的信息经过一系列隐藏处理,利用人类视觉系统或人类听觉系统属性使目标数据没有明显的降质现象,而隐藏的数据却无法被看见或者听见。②安全性:隐藏加密后的数据载体能够承受一定程度的人为攻击,而隐蔽信息不会被破坏,具有较强的抗攻击能力。③不可检测性:指隐蔽载体与原始载体具有一致的特性,使非法拦截者无法判断是否有隐藏信息。④通用性:好的信息隐藏方法适用于多种文件格式和媒体格式。⑤鲁棒性:对目标数据添加或者删除某一部分信息,不会导致隐藏信息丢失的能力。⑥自恢复性:由于经过一些操作或变换后,可能会使嵌入的信息有较大的破坏,如果只从片段的数据,仍能恢复隐藏信息,而且恢复过程不需要原始信息的参与,这就是自恢复性。⑦无歧义性:恢复出的信息或信息判决的结果应该能够确定地表明所有权,不会发生多重所有权的纠纷。

2网页结构

网页是通过网络浏览器看到的网站页面,网页的本质是一个计算机文件,描述网页的HTML是一种超文本标记语言,HTML的结构包括头部(head)、主体(body)两大部分。HTML文档的基本结构如图1所示。

HTML文档标记由 “”三部分组成。标记名中的字母不区分大小写。大部分标记是成对出现的,例如,和分别是开始标记和结束标记。HTML的多数标记在使用时需要提供一些参数,以进一步明确标记的功能。在标记中使用的参数称为标记的属性。例如,网页信息安全表示设置这段文字是红色,大小6号字,字体隶书。网页中的元素包括文字、图形、动画、声音、表格、链接等,HTML命令使用HTML规定的标签来标识这些文档元素。

3网页信息隐藏模型

网页文件与文本文件相比,由于网页用超文本标识语言,实现了数据信息之间、文件之间的超级链接,使网页具有更丰富的多媒体内容和效果,并且信息量与其他格式的文档文件相比又相对较小,由于网速的加快,使得网上传递多媒体信息十分方便。为了保证信息的安全性,如何利用网页安全传递重要信息和验证网页完整性成为网页信息安全的重要问题。

网页信息隐藏技术是将网页作为载体的信息隐藏,把需要隐藏的信息嵌入到网页原始文件中,同时不改变原始网页的结构,不影响网页的视觉效果。基于网页的信息隐藏技术与通用的信息隐藏技术原理相同。网页的隐藏信息嵌入过程是首先将待隐藏的信息预处理,转化成二进制串,再将处理的隐藏信息嵌入到普通网页中,从而得到含隐藏信息的网页。提取过程是嵌入过程的逆过程:含隐藏信息的网页通过提取算法得到隐藏信息的二进制形式,然后通过逆处理,得到原始隐藏信息。网页信息隐藏和提取的原理过程如图2所示。

网页文件是用HTML是一种超文本标识语言制作的。其结构是由普通文本文件加上各种标记(Tag)所构成,文本中可用于隐藏数据的冗余空间非常有限,其中的文字编码不能容许噪声的出现,所以在文本中嵌入信息而不被察觉维度较高,因此,要实现真正的网页信息隐藏使其达到一般信息隐藏技术所具有的隐蔽性、不可检测性和抗攻击能力的鲁棒性比较困难。现有的网页信息隐藏方法主要分为三种:①利用不可见字符方法:利用浏览器在解析HTML文件时忽略每行行尾以及标记后的不可见字符进行信息的隐藏;该方法易于实现,但改变了文件的大小,而且经受不住网页减肥茶等相关软件的攻击。②利用标记大小写方法:HTML规范规定,浏览器解析HTML文件时不区分标记大小写,比如用大写表示1,用小写表示0;该方法不改变文件的大小,且能够嵌入较大的秘密信息,但标记内字母大小写状态的不统一暴露了隐藏的秘密信息;③基于标记属性对顺序方法:HTML规范规定,开始标记中的属性与顺序无关,用重新排序表示1,保持原来顺序表示0。该方法不改变文件的大小,隐蔽性好,嵌入信息量少,且需要数据库的支持。

针对现有的网页信息隐藏技术存在的缺点,本文提出了一种新方法,结合多网页隐藏信息的方法,将隐藏信息以二值图像应用于网页隐藏中,有效的解决了上述缺点。

4隐藏算法设计

4.1 基本定义

定义1:令Ai表示HTML中一个标记的属性和其属性值,i表示属性和其属性值在标记中出现的顺序。例如在“”中,“size=6”表示A1,“color=red”表示A2。

定义3:用8位表示位图长度,8位表示位图宽度,则待插入字符串为长度、宽度以及位图各像素点对应的图像值所组成的字符串,记为S,将S中第i个字符记作Si。

Step5:若j?叟|C|或者TBi为当前网页的最后可用标记,则结束;否则,继续Step2。

根据HTML规范,对于标记属性进行重复引入时,浏览器只解析第一次对属性进行设置的属性值,因此采用该方法其显示效果与同有重复引入时相同。为叙述方便,假设函数Embeded(H,pos)是按照规则3对网页载体H,隐藏信息从pos处开始隐藏,函数返回该网页隐藏的字符串的位数,记为tempcount;Isinsert(H.C)判断当前网页H以及所有超链接是否有足够标记可以隐藏C,若有,返回true,否则返回false。Decode(H′)是返回H′中隐藏的信息。Strlen(s)返回s的长度,Connect(s1,s2)将s2连接到s1后面。

5实验结果分析

5.1 隐藏容量:在多个网页作中隐藏信息,嵌入的宿主对象多,增加隐蔽信息的嵌入量,同时由于采用二值图像作为嵌入对象,很好解决了图像数据在网页信息隐藏中的问题。

5.2 鲁棒性:此方法是在多个网页中隐藏信息,在单个网页中嵌入的信息相对较少,有较好的抗攻击能力,鲁棒性比较强。同时本文的嵌入方法能够很好的抵抗减肥茶等软件的作用。

5.3 隐藏性:该算法未影响网页在浏览器的正常显示效果,并且嵌入信息后的网页和原始网页在视觉上基本没有差异,具有较好的隐藏性。

5.4 抗检测性:由于在多个网页中隐藏信息,不仅使嵌入容量大幅度增加,而且不会引入明显的统计异常,具有较强的抗检测能力。

参考文献:

[1]龙银香.基于HTML标签的信息隐藏模型[J].计算机应用研究,2007,24(5):137-240.

[2]睦新光,罗慧.一种新的基于超文本的信息隐藏方法[JJ.计算机工程,2005,31(12):136-137.

[3]孙圣和,陆哲明,牛夏牧.数字水印技术及应用[M].北京:科学出版社,2004.

上一篇:浅析钢筋混凝土框架结构施工中常见问题 下一篇:浅谈高层电梯存在的安全隐患及相关设计