面向信息隐藏的文本特征值性质研究.ppt
《面向信息隐藏的文本特征值性质研究.ppt》由会员分享,可在线阅读,更多相关《面向信息隐藏的文本特征值性质研究.ppt(32页珍藏版)》请在三一办公上搜索。
1、2009-11-29,第一届中国(杭州)安全电子商务学术会议,1,面向信息隐藏的文本特征值性质研究,申 请 者:戴祖旭 工作单位:武汉工程大学 电子邮件:申请日期:2009/11/29,2009-11-29,第一届中国(杭州)安全电子商务学术会议,2,摘 要,文本作为一种重要的信息传输载体,文本信息隐藏研究在信息安全等领域应用价值极高。目前对照信息隐藏的要求(数据有效载荷、不可感知性、鲁棒性、安全性等)去研究携带秘密信息的特征值的性质并评价相应算法的工作还很缺乏。本项目采用数理统计方法研究基于词性标记串序关系、语法结构关系以及其他统计特性的载体特征值的概率分布与冗余性质;对词性标记串按文本编辑
2、相互转化关系分类,研究特征值在文本编辑下的变换性质,将这些变换性质作为信息隐藏的噪声,建立不同类型特征值的信道模型,估计容量,设计信道编码方法。本研究为基于词性标记工作域的文本信息隐藏技术提供理论基础。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,3,1.研究意义及国内外研究工作现状,信息隐藏是以多媒体信号作为宿主载体,利用多媒体数据的冗余特性和人类感知觉的冗余特性来隐藏秘密信息的技术。在开放式网络环境中,信息隐藏技术主要用于:(1)隐秘通信;(2)数字作品完整性与版权保护。作为一种重要的信息存储与传输媒体,文本载体信息隐藏理论与技术的研究是信息隐藏学科的一个重要分支。,20
3、09-11-29,第一届中国(杭州)安全电子商务学术会议,4,基于格式的方法:将文本解释为二值或灰度图像,通过调整行间距或单词和字符间距、修改字符轮廓与拓扑结构、调整字符亮度或颜色,以及格式化文本的脚本控制符来隐藏信息。选择行(字)间距、字符结构、字符亮度 等物理量作为载体特征值来携带秘密信息,利用人类视觉保真度量模型计算特征值调整幅度,隐藏过程不改变人眼对文本外观的感知效果。这类方法有科学的人类视觉模型做基础,易于实现自动化,在信息隐藏技术出现的初期发展较快,缺点是隐藏容量较小,抵抗文本重新录入、复印等再生操作的鲁棒性较差。,2.文本信息隐藏的代表性方法,2009-11-29,第一届中国(杭
4、州)安全电子商务学术会议,5,基于内容的方法:建立在文本内容理解的基础上,主要通过修改自然语言语句来隐藏信息,利用同义词替换,可选择同义词、同义词频率、同义词语义歧义等特征值携带秘密信息;利用语句结构的变化,可选择句法分析树和词性标记串等特征值携带秘密信息。更高级的是利用文法来生成含密文本。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,6,例:汉语语句“风景优美的房间请给我。”部分改写实例(1)风景优美的房间请给我。(2)请把风景优美的房间给我。(3)我想要风景优美的房间。(4)请给我风景优美的房间。(5)房间请给我风景优美的。(6)把风景优美的房间给我。(7)风景优美的房间
5、给我。(8)风景优美的房间我要。(9)我要风景优美的房间。(10)给我风景优美的房间。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,7,我们可以有10种改写方式(或许还有更多的其它方式),10个句子的语法都正确,意思也相似。因此,采用定长编码方法,一个句子用句法分析树可携带3比特信息。再考虑到用“优美”的同义词美丽,漂亮,好看,悦目,美妙,幽美,优美做替换,则可增加到70个改写句子,一个句子就可携带6比特信息。当然还可以进一步综合利用词性标记等其它特征值来携带信息以提高容量。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,8,3.信息隐藏算法的两个基本要素,秘
6、密信息的隐藏空间与隐藏方式是信息隐藏算法的两个基本要素。隐藏空间称为嵌入工作域,人们总是利用工作域中的各类特征值来携带秘密信息。隐藏方式由数据嵌入方式实现,包括叠加嵌入和映射嵌入。叠加嵌入中,秘密信息作为弱信号用叠加的方式嵌入到宿主信号的特征值中;映射嵌入中,宿主信号的系数被映射函数映射到由嵌入比特确定的特征值,嵌入方式直接受特征值性质制约。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,9,目前的文本信息隐藏研究一般集中在寻找文本的各种特征值并设计相应的信息隐藏方法等较为基本的内容上,而对照信息隐藏的要求(数据有效载荷、不可感知性、鲁棒性、误判率、安全性、计算效率和成本等)去
7、研究特征值的性质并评价相应信息隐藏算法的研究工作还很缺乏。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,10,4.项目研究内容、目标,文本载体信息隐藏过程一般包括以下步骤:秘密信息编码(映射)为载体特征值(格式参数、同义词、语法树、逆序数等);根据特征值修改载体得到含密载体(受文本不可感知性条件约束);公开发送含密载体以及文本编辑处理等噪声干扰;接收方计算特征值并译码提取秘密信息。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,11,设信息隐藏函数为(1)其中 分别表示秘密信息、原始载体、含密载体和载体特征值,分别表示编码密钥和嵌入密钥,函数d表示不可感知性约
8、束条件,为常数。另设噪声干扰为(2)其中 是加噪含密载体。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,12,项目组成员经过多年研究,找到了基于词性标记工作域的部分特征值,并据此提出了若干文本信息隐藏新算法,在前期研究工作的基础上,本项目将深入研究如下内容:1)研究现有文本载体特征值的性质。公式(1)中t是载体特征值,是秘密信息的携带者,也是噪声干扰的目标。针对文献已提出的特征值,比如语法树、逆序数、信息熵等,重点研究t在常规文本编辑(比如语句或语句中词的增加、删除与移位等)处理下的变换性质,它是进一步评估相关隐藏算法鲁棒性、安全性和计算复杂性的理论基础;特征值t的分布性质,
9、它是设计秘密信息编码函数f的基础,也是度量不可感知性的基本因素之一。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,13,2)研究文本载体信息隐藏信道模型。信道模型是噪声对特征值的作用方式,是计算信息隐藏容量的基础。公式(2)描述了文本编辑噪声对含密文本的干扰作用,这种干扰作用传递到不同的特征值上会有不同的影响。对于逆序数、语法树等来说,干扰导致离散状态之间的转换,对于信息熵等取非负实数的特征值来说,干扰导致熵值的波动。因此信道模型可能是状态转移矩阵,需要具体研究同一类特征值之间的转移概率,也可能是具有加性或乘性噪声的连续信道,需要建立噪声分布函数关系式。,2009-11-29
10、,第一届中国(杭州)安全电子商务学术会议,14,5.本项目预期目标,1)针对2-3种文本载体特征值建立文本编辑变换模型,据此建立相应的信道模型。2)针对2-3种文本载体特征值建立统计模型及其相关性模型。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,15,6.拟采取的研究方法和技术路线,本项目总的研究方案是以词性标记工作域上的特征值为中心,收集大容量的文本样本,将文本按文体分类,首先研究各类特征值的分布规律与冗余性质,研究文本编辑操作对词性标记串的改变规律,对词性标记串按文本编辑相互转换关系进行分类,根据分类情况研究各类特征值的变换性质,将这些性质作为噪声,得到信道模型。,20
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面向 信息 隐藏 文本 特征值 性质 研究
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5674283.html