欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    面向信息隐藏的文本特征值性质研究.ppt

    • 资源ID:5674283       资源大小:293.01KB        全文页数:32页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    面向信息隐藏的文本特征值性质研究.ppt

    2009-11-29,第一届中国(杭州)安全电子商务学术会议,1,面向信息隐藏的文本特征值性质研究,申 请 者:戴祖旭 工作单位:武汉工程大学 电子邮件:申请日期:2009/11/29,2009-11-29,第一届中国(杭州)安全电子商务学术会议,2,摘 要,文本作为一种重要的信息传输载体,文本信息隐藏研究在信息安全等领域应用价值极高。目前对照信息隐藏的要求(数据有效载荷、不可感知性、鲁棒性、安全性等)去研究携带秘密信息的特征值的性质并评价相应算法的工作还很缺乏。本项目采用数理统计方法研究基于词性标记串序关系、语法结构关系以及其他统计特性的载体特征值的概率分布与冗余性质;对词性标记串按文本编辑相互转化关系分类,研究特征值在文本编辑下的变换性质,将这些变换性质作为信息隐藏的噪声,建立不同类型特征值的信道模型,估计容量,设计信道编码方法。本研究为基于词性标记工作域的文本信息隐藏技术提供理论基础。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,3,1.研究意义及国内外研究工作现状,信息隐藏是以多媒体信号作为宿主载体,利用多媒体数据的冗余特性和人类感知觉的冗余特性来隐藏秘密信息的技术。在开放式网络环境中,信息隐藏技术主要用于:(1)隐秘通信;(2)数字作品完整性与版权保护。作为一种重要的信息存储与传输媒体,文本载体信息隐藏理论与技术的研究是信息隐藏学科的一个重要分支。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,4,基于格式的方法:将文本解释为二值或灰度图像,通过调整行间距或单词和字符间距、修改字符轮廓与拓扑结构、调整字符亮度或颜色,以及格式化文本的脚本控制符来隐藏信息。选择行(字)间距、字符结构、字符亮度 等物理量作为载体特征值来携带秘密信息,利用人类视觉保真度量模型计算特征值调整幅度,隐藏过程不改变人眼对文本外观的感知效果。这类方法有科学的人类视觉模型做基础,易于实现自动化,在信息隐藏技术出现的初期发展较快,缺点是隐藏容量较小,抵抗文本重新录入、复印等再生操作的鲁棒性较差。,2.文本信息隐藏的代表性方法,2009-11-29,第一届中国(杭州)安全电子商务学术会议,5,基于内容的方法:建立在文本内容理解的基础上,主要通过修改自然语言语句来隐藏信息,利用同义词替换,可选择同义词、同义词频率、同义词语义歧义等特征值携带秘密信息;利用语句结构的变化,可选择句法分析树和词性标记串等特征值携带秘密信息。更高级的是利用文法来生成含密文本。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,6,例:汉语语句“风景优美的房间请给我。”部分改写实例(1)风景优美的房间请给我。(2)请把风景优美的房间给我。(3)我想要风景优美的房间。(4)请给我风景优美的房间。(5)房间请给我风景优美的。(6)把风景优美的房间给我。(7)风景优美的房间给我。(8)风景优美的房间我要。(9)我要风景优美的房间。(10)给我风景优美的房间。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,7,我们可以有10种改写方式(或许还有更多的其它方式),10个句子的语法都正确,意思也相似。因此,采用定长编码方法,一个句子用句法分析树可携带3比特信息。再考虑到用“优美”的同义词美丽,漂亮,好看,悦目,美妙,幽美,优美做替换,则可增加到70个改写句子,一个句子就可携带6比特信息。当然还可以进一步综合利用词性标记等其它特征值来携带信息以提高容量。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,8,3.信息隐藏算法的两个基本要素,秘密信息的隐藏空间与隐藏方式是信息隐藏算法的两个基本要素。隐藏空间称为嵌入工作域,人们总是利用工作域中的各类特征值来携带秘密信息。隐藏方式由数据嵌入方式实现,包括叠加嵌入和映射嵌入。叠加嵌入中,秘密信息作为弱信号用叠加的方式嵌入到宿主信号的特征值中;映射嵌入中,宿主信号的系数被映射函数映射到由嵌入比特确定的特征值,嵌入方式直接受特征值性质制约。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,9,目前的文本信息隐藏研究一般集中在寻找文本的各种特征值并设计相应的信息隐藏方法等较为基本的内容上,而对照信息隐藏的要求(数据有效载荷、不可感知性、鲁棒性、误判率、安全性、计算效率和成本等)去研究特征值的性质并评价相应信息隐藏算法的研究工作还很缺乏。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,10,4.项目研究内容、目标,文本载体信息隐藏过程一般包括以下步骤:秘密信息编码(映射)为载体特征值(格式参数、同义词、语法树、逆序数等);根据特征值修改载体得到含密载体(受文本不可感知性条件约束);公开发送含密载体以及文本编辑处理等噪声干扰;接收方计算特征值并译码提取秘密信息。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,11,设信息隐藏函数为(1)其中 分别表示秘密信息、原始载体、含密载体和载体特征值,分别表示编码密钥和嵌入密钥,函数d表示不可感知性约束条件,为常数。另设噪声干扰为(2)其中 是加噪含密载体。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,12,项目组成员经过多年研究,找到了基于词性标记工作域的部分特征值,并据此提出了若干文本信息隐藏新算法,在前期研究工作的基础上,本项目将深入研究如下内容:1)研究现有文本载体特征值的性质。公式(1)中t是载体特征值,是秘密信息的携带者,也是噪声干扰的目标。针对文献已提出的特征值,比如语法树、逆序数、信息熵等,重点研究t在常规文本编辑(比如语句或语句中词的增加、删除与移位等)处理下的变换性质,它是进一步评估相关隐藏算法鲁棒性、安全性和计算复杂性的理论基础;特征值t的分布性质,它是设计秘密信息编码函数f的基础,也是度量不可感知性的基本因素之一。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,13,2)研究文本载体信息隐藏信道模型。信道模型是噪声对特征值的作用方式,是计算信息隐藏容量的基础。公式(2)描述了文本编辑噪声对含密文本的干扰作用,这种干扰作用传递到不同的特征值上会有不同的影响。对于逆序数、语法树等来说,干扰导致离散状态之间的转换,对于信息熵等取非负实数的特征值来说,干扰导致熵值的波动。因此信道模型可能是状态转移矩阵,需要具体研究同一类特征值之间的转移概率,也可能是具有加性或乘性噪声的连续信道,需要建立噪声分布函数关系式。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,14,5.本项目预期目标,1)针对2-3种文本载体特征值建立文本编辑变换模型,据此建立相应的信道模型。2)针对2-3种文本载体特征值建立统计模型及其相关性模型。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,15,6.拟采取的研究方法和技术路线,本项目总的研究方案是以词性标记工作域上的特征值为中心,收集大容量的文本样本,将文本按文体分类,首先研究各类特征值的分布规律与冗余性质,研究文本编辑操作对词性标记串的改变规律,对词性标记串按文本编辑相互转换关系进行分类,根据分类情况研究各类特征值的变换性质,将这些性质作为噪声,得到信道模型。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,16,1)关于数据统计分析工作 本项目的研究内容涉及大量不同类型数据的统计分析工作,可以利用成熟的数理统计方法,关键点在于合理规划数据采集、存储与处理等实验方案,科学选择统计指标与统计模型,保证数据处理工作有序、高效且准确。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,17,研究载体特征值概率分布模型时,计划将载体按文体分为小说、散文、新闻报道、文史哲类学术论文四类,每类文体样本量在1000篇左右,分别对词性、词性标记串及其信息熵、逆序数等进行统计处理,分门别类地建立这些特征值的概率分布类型与冗余模型,测定各种分布参数。把特征值理解为一个句子固有的属性,而这些特征值都具有随机性,因此可以用特征值随机向量来描述样本。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,18,设 是特征值构成的随机向量,其中 是统计相关的,是联合分布。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,19,采集各特征值的样本,建立特征值的一维分布和高维联合分布。联合分布可由样本统计得到,而相应低维分布就是边际分布,即=;,2009-11-29,第一届中国(杭州)安全电子商务学术会议,20,分析特征值之间的相关关系。由于各特征值统计上是不独立的,所以携带秘密信息的主特征值的分布改变后,其它特征值的分布也会改变,因此我们要知道其它特征值的分布的变化规律,这样才能控制其它特征值分布的变化。这个变化规律就是主特征值与其它特征值的相关关系,对于一个好的信息隐藏系统来说,这种关系在信息隐藏前后应该是不变的。可采用两种方法表示这种相关关系。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,21,例句“他/r买/v了/u一/m把/q裁/v纸/n的/u刀/n,/w”“他/r买/v了/u一/m把/q裁/v纸/n刀/n,/w”,(去掉“的”)则句法分析树变了,词性标记串也由“/r/v/u/m/q/v/n/u/n/w”变为“/r/v/u/m/q/v/n/n/w”,词性标记串的逆序数也由偶数20变为奇数19(采用字典序)。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,22,一个是函数关系,我们可以由采集到的样本回归出 与 的函数关系;,2009-11-29,第一届中国(杭州)安全电子商务学术会议,23,另一个是条件概率,比如条件概率 反映了真实文本中特征值子向量 对 的依赖关系。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,24,2)关于信道建模工作 以词性标记串逆序数、逆序数奇偶性、词性标记串信息熵等特征值来携带秘密信息,文本编辑(语句增删与移位,语句中词的增删与移位等)可能引起特征值的改变,改变的规律即为相应的信道模型。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,25,设标记串集合为,文本编辑为公式(1)中映射,定义A上的关系即两个标记串具有关系 当且仅当它们可以通过文本编辑相互转换,显然 具有对称性和传递性,可根据 对A分类。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,26,设有 共n个划分块,设要计算的特征值类型为T,若T为离散型,则根据T的值进一步将 分为 共 个子块,每个子块有相同的特征值。由此可按如下方法定义子块间特征值的转移概率,2009-11-29,第一届中国(杭州)安全电子商务学术会议,27,最后可通过对划分块加权的方式定义特征值转移概率。若为连续型,比如信息熵,则划分块的基数可用于标记串频数变化范围估计,据此可对特征值波动做出误差估计,采用误差分析理论建立信道模型。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,28,7.与本项目有关的工作条件,项目组已购置了由北京大学计算语言学研究所开发的汉语自动分词与词性标注软件,现代汉语语法信息电子词典等自然语言处理工具,为项目实施提供了计算语言学方面的技术支持。项目依托武汉工程大学理学院信息与计算科学专业实验室,具有高性能计算设备和科研团队的支持。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,29,8.项目申请人简介,戴祖旭,男,博士,副教授。2008/92009/7在北京大学计算语言学研究所作为期一年的访问学者,在俞士汶教授指导下从事文本信息隐藏的有关基础理论研究工作;2007年毕业于华中科技大学计算机科学与技术学院,获得计算机软件与理论专业博士学位,研究方向为信息隐藏与数字水印;1999年7月毕业于大连理工大学应用数学系,获得应用数学专业理学硕士学位。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,30,项目申请人主持的相关科研项目:湖北省教育厅科学技术研究项目(D20081506),已结题。该项目主要研究了文本词性标记的数学性质,寻找适合携带秘密信息的特征值(标记串逆序数、信息熵等),在此基础上设计了若干新的信息隐藏算法。,2009-11-29,第一届中国(杭州)安全电子商务学术会议,31,发表与本项目相关的论文有:1戴祖旭.高精度模拟函数J.数学的实践与认识,2009,第一届中国(杭州)安全电子商务学术会议录用论文2戴祖旭.抵抗同义词替换攻击的文本信息隐藏算法J.四川大学学报(工程科学版)(EI收录),2009,41(4):186-1903戴祖旭,洪 帆,崔国华.信息熵方程求解算法及其应用J.高校应用数学学报,2008,23(3):277-2814Dai zuxu,Hong fan,Yang muxiang.Text Information Hiding Based on Part of Speech GrammarC.In Yuping Wang,Qingfu Zhang,Hailin Liu,and Xiamu Niu(ed.):2007 International Conference on Computational Intelligence and Security Workshops,2007:632-635(EI收录)5Zuxu Dai,Fan Hong.Watermarking Text Documents Based on Entropy of Part of Speech StringJ.Journal of Information&Computational Science,2007,4(1):21-25(EI收录),2009-11-29,第一届中国(杭州)安全电子商务学术会议,32,6戴祖旭,洪帆,崔国华,付敏.基于词性标记串统计特性的文本数字水印算法J.通信学报,2007,28(4):108-113(EI收录)7戴祖旭,洪帆,李小刚.文本文档水印质心检测方法的改进J.计算机应用,2007,27(5):1064-10668戴祖旭,洪帆.基于词性标记序列逆序数的文本信息隐藏算法J.计算机工程与应用,2007,43(14):160-161,1989戴祖旭,洪帆.基于句型Huffman编码的文本信息隐藏算法J.计算机工程,2007,33(15):147-14810Ruan-Chi,Zuxu-Dai.Correlation analysis on partition of rare earth in ion-exchangeable phase from weathered crust oresJ.Transactions of Nonferrous Metals Society of China,2006(6):1461-1465(EI收录)11戴祖旭,洪帆.用yacc实现基于词性标记文法的文本信息隐藏J.计算机应用与软件,2006,23(11):40-42,

    注意事项

    本文(面向信息隐藏的文本特征值性质研究.ppt)为本站会员(sccc)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开