082C图象变成-基于纹理的笔迹鉴定样本
(样本只提供该系统的基本情况介绍,若需要完整的设计和论文,建议您购买本系统,凡是购买本站系统的,本站均根据您的要求,把系统上的开发信息,题目等修改成符合您的要求)
本系统开发工具:C
本设计包含内容:源代码+毕业论文+开题报告+答辩稿
论文大概:
基于纹理分析的笔迹识别
摘要:笔迹识别包括笔迹输入、预处理、特征提取、识别三个过程。首先将笔迹材料作为图象扫描输入,并对其进行编号。预处理部分可将笔迹图象的有效部分规范化到一个统一尺寸,接着对其进行二值化和去除噪声的处理,以便于更好的提取图像的特征。在此我们采用了灰度共生矩阵法提取手写笔迹材料的纹理特征,与以往有所不同的是,我们将一份手写材料分割成64块大小为80*80象素的子图象,每个小块都从四个方向(0度、45度、90度以及135度)来更全面的提取特征,并计算出四个最主要的特征值(纹理一致性的统计量、纹理反差的统计量、纹理熵的统计量以及纹理灰度相关性的统计量),将从所有已知材料提取的特征值保存到纹理特征库中,对于待检手写材料,同样采用灰度共生矩阵的方法提取其纹理特征,再利用最小欧氏距离分类法将从待检手写材料中提取的特征值与纹理特征库中的特征值进行比对,与欧氏距离比对值最小的相匹配,输出匹配成功的原材料的标号,进而识别出待检材料书写者的身份。最后输出识别结果。
关键词:笔迹识别,特征提取,纹理特征,欧氏距离,灰度共生矩阵
Handwriting
Identification Based on Texture Features
Abstract:The image recognition process can be divided into
three steps: pre-treatment, apperceive and identify. first scanning
the known handwriting materials then number them ,In pretreatment,
we convert the valid part of the image into a standard
size, as images carries out duotone and go throw off chirp handling
in order to achieve better effect.draw features from the known
handwriting materials with the Co-occurence,especially,we divided a
copy of handwriting into 25 little pieces with the size of 128*128
,drawing features from every little piecese with four directions(0
degree, 45 degrees, 90 degrees as well as 135 degrees) and calculate
the four major feature values( veins and the statistical quantity of
veins contrast and the statistical quantity of veins consistency
Shang the statistical quantity of statistical quantity as well as
the veins correlation of gray scale ), preservation all the feature
value that drawn from all known ma terials to the handwriting
characteristic database,then input the unknown handwriting
materials, also using the method of the Co-occurence to draw those
features, recycling the minimum European Distance law match
the unknown writing material feature value with the handwriting
characteristic feature database, export the label of the known hand
writing materials which is most similar to the unknown
material with minimum European Distance, and then we can confirm who
is the author of the unknown material. Final output the recognition
result.
Keywords:writer identification,character extraction,texture
feature,
European Distance, Co-occurence
目 录
1 引言1
1.1国内外研究现状与发展趋势 1
1.2笔迹识别方法分类 2
2
笔迹鉴定系统总体设计方案3
2.1 笔迹识别系统设计框架3
2.2 系统功能分析 5
2.3 系统功能实现 5
2.3.1 排版特征抽取 5
2.3.2 预处理
5
2.3.3 纹理特征抽取 5
2.3.4 手写材料匹配 5
3
笔迹识别系统详细设计6
3.1 笔迹特征的表示与提取6
3.1.1 笔迹图像的获取
6
3.1.2 笔迹图像的预处理 6
3.1.3 笔迹特征的提取
7
3.1.3.1 灰度共生矩阵特征及定义8
3.1.4
特征向量的提取与修正 10
3.2 欧氏分类器匹配11
3.3
程序算法流程11
3.4 主要算法描述12
4 实验结果与结论13
5
结束语14
致谢
参考文献 15
附录
16
l 引 言
1.1 国内外研究现状与发展趋势
几十年来,在图像处理和模式识别领域中,笔迹识别一直是一个热门研究课题。尽管人们不断地努力,但笔迹识别仍存在一个富有挑战性的问题。在安全及其有关应用中,通过一份手写体来识别书写人身份。但它需要书写人要写相同的固定文本。从这种意义上来说,笔迹识别也可以被称为基于文本的书写人识别。实际上,使用固定文本使得书写人识别容易被伪造。另外,基于文本的身份识别在许多实际应用中是不可取的。例如,对存档的手写文档的书写人识别、法庭上犯罪嫌疑人的识别等等。在这些应用中,对一份手写体书写人的身份识别通常由专业的手写体鉴别人员来进行。
笔迹鉴定作为一种个人身份辩识的有效手段有着重要的作用,随着经济的日益发展,各国文化交流的无论是在政治、经济、文化甚至犯罪学领域,都有着广泛得应用前景,随着人们相互往来的日益频繁,如何高效、准确地进行笔迹鉴定就显得更加重要.在我国,笔迹鉴定,尤其是对汉字的笔迹鉴定研究,得到了众多学者的关注.目前,许多场合都使用人工鉴定方法,其效率不仅低下,而且在鉴定过程中容易引入人为的感情因素,因此,其结果不一定可靠.鉴于此,研究人员提出了利用计算机进行自动鉴别的方法.[1]
计算机笔迹识别系统近几年在国内外都有一定的发展。首先,科研成果为笔迹鉴定提供了理论依据。例如,巴甫洛夫关于高级神经活动的学说使人们得以从理论上阐明笔迹同一认定的科学基础。其次,显微镜等科学仪器的使用大大提高了笔迹检验的精确度。最后,实践经验的积累使人们对笔迹特征的认识越来越深入,对笔迹特征的分类越来越合理,这些都提高了笔迹鉴定的科学性。在司法实践中,笔迹鉴定已经成为人身识别的重要途径之一。将红外-拉曼光谱用于法庭科学研究,发展笔迹鉴定和印章鉴定等多种法庭科学鉴定新方法,利用所建立的方法已协助公安机构破获了一些经济案件。
近年来,用于区分不同语言的文字种类识别已成为国内外研究的热点,字体识别和文字种类识别是一个相近的问题。将文本图像看作一种纹理,使用多通道Gabor滤子技术对文本图像滤波后提取其纹理特征,该方法在文字种类识别中非常有效,但是计算很复杂。
在水平和垂直方向定义了四种文本尺寸(Concav Topbot Bbxhgt Optden)以区分中日文与拉丁文字,
中日文之间以撇和捺的方向属性来区分, 五种拉丁文之间以特征字符集(Symbol Sets)和相关熵模型(Relative Entropy
Model)来区分,这种对不同对象采用不同特征的识别方法具有较高的精度,但却只能用于文字种类识别而不能用于同种语言间的字体识别。
手写体的计算机自动笔迹鉴定的首要成果是字符的识别(Character
Recogniton),即识别字符本身,而不是根据字来识别书写者,字符识别已接近实用水平。其次是签名鉴定(Signature
Verification),在签名鉴定中,比较有效的方法是动态方法,动态方法不仅利用书写的结果,还要求计算机知道书写的过程,如运笔的速度、加速度、笔的压力、握笔的姿态等。签名鉴定在国外的银行领域中已接近实用水平。对于公安、安全及法庭等领域要求的笔迹鉴定而言,疑问文档的获取是静态的、非固定的,甚至是文本独立的,因此将文字识别与签名鉴定的成果直接应用于疑犯鉴别领域的难度较大.
手写体计算机自动笔迹鉴定的第三个层次即为笔迹鉴定(Handwriting
Identification)。计算机笔迹识别系统与传统笔迹鉴定的区别如表1-1所示。[2]
表1-1
计算机笔迹鉴定系统与传统笔迹鉴定的区别
传统的笔迹鉴定 计算机笔迹鉴定系统
识别工作量
大
小
识别形式 主要是依靠“手工”操作的方法,人工描字、制作检验记录(比对表),再根据个人对特征的认识及分析、比对,综合评断,靠鉴定人主观意识的分析、判断作出鉴定结论。 半自动化或全自动化地挑选检材、样本中的特征字或相同字,按相似度顺序排列,自动生成比对表,记录笔迹特征,具有客观性。
工作效率 对于检材数量大的情况下,工作效率低,识别速度慢,并且,误识率高 对于检材数量大的情况下,工作效率高,识别速度快,正确率高
识别环境 简单,识别结果极易受到外界因素干扰,如:鉴定人员的专业知识、业务水平、思维方式、工作态度、情绪、精神状态等 不易受到外界干扰,具有很高的独立性,封闭性
识别标准 没有一个综合评断及分项评断可定量分析、计算的科学统一标准 在比对的过程中有统一的标准,
识别的准确性 准确性低 准确性高
1.2 笔迹识别方法分类
计算机笔迹识别主要分为在线(on-line)和离线 (off-line)
两类。离线笔迹识别的对象是写在纸上的字符,通过扫描仪和摄像机转化为计算机能处理的信号;而在线笔迹识别则通过专用的数字板或数字仪实时地采集书写信号,它不仅可以采集到笔迹序列并转化成图像,而且可以记录书写的压力、速度等信息,可为笔迹鉴别提供更丰富的信息(广泛用于电子商务和电子政务)。
从考察的对象和提取特征的方法,计算机笔迹识别可分为文本依存(Text-dependent)和文本独立(Text-independent)
两大类。前一种方法又称为与内容有关:从检材(检验)笔迹和样本(参考)笔迹中选择相同的单字(称为特征字)、相同的偏旁部首(特征字元)进行比较,即在相同字的基础上鉴别。因而是依赖于文本内容的,可以提取更多的特征并对字符进行细致深入的分析,故理论上可得到比文本独立方法更高的鉴别率和可靠性。但自动分割、定位、识别与提取检材笔迹和样本笔迹材料中写法完全相似的所有特征字与特征字元(部首、偏旁、笔划),在算法的实现上,尤其是自动分割算法、抽取笔划特征(它涉及到笔划的起势、落势、运笔时的走势等特征)算法目前有一定的难度,因而影响识别率和可靠性;同时这种与内容有关的方法要求被识别的文字是固定的,以至于在某些情况下,根本就不能完成实际任务。
用笔迹进行身份识别的目的是鉴别出某一笔迹的风格,所以不必关心具体的笔迹内容。本课题采用的是离线且文本独立(与内容无关)的笔迹识别方法,它的特点是利用纹理分析来提取笔迹的特征。[3]
特征的提取在模式识别的过程中起到很重要的作用。提取文本独立持征的有Fourier变换和自相关法、游程长度直方图法、笔段长度直方图法、笔段方向直方图等;用纹理分析方法K、t1提取文本依存持征的有:walsh—Hardarnlard变换、线段谱分解方法。
2 笔迹鉴定系统总体设计方案
2.1
笔迹鉴定系统设计框架
(1)笔迹鉴定基本过程如图2-1所示:
图2-1 笔迹鉴定基本过程示意图
(2)笔迹鉴定系统模型如图2-2所示:
图例
登记
验证
映射
输入样本材料
出示待识别材料
计算特征值
保存ID与特征值
逐一比对
匹配时输出与待检材料最相近的样本ID
匹配不成功且不知材料手写者的材料特征统一编号后追加到纹理特征库中
匹配不成功但知道材料手写者的材料特征直接追加到纹理库中并将手写者资料相应的追加到手写者信息库中
2-2
笔迹鉴定系统模型
2.2
系统功能分析
基于纹理分析的笔迹鉴定系统应具备笔迹材料的输入,鉴定结果的输出、建立笔迹材料特征库、笔迹材料特征提取、笔迹材料匹配和确认笔迹材料书写者的身份等基本功能:
(1)具有建立笔迹材料特征库的功能,对重点人群的手写笔迹材料特征建立特征库。
(2)能够对输入的笔迹材料进行快速提取其特征,并求出笔迹材料的特征量。
(3)能够快速将未知的手写材料的特征值与特征库中的已知手写材料特征值相匹配。并输出匹配结果。
(4)具有检错、提示功能。[4]
2.3系统功能实现
根据系统的功能要求,可以分别设置特征提取模块
、特征匹配模块、计算特征值模块、建立手写材料特征库模块、输入输出模块;除此之外,还设置一主菜单作为笔迹鉴定系统的主界面,同时设置检错功能。再附设一退出功能。
2.3.1 排版特征抽取
采用垂直投影和水平投影法抽取笔迹图像汉字的平均高度和宽度,平均字间距和行间距。
2.3.2
预处理
行与行之间、字与字之间可能包含大小不一的空白,这些空白对笔迹鉴别来说是没有意义的,但是却会影响到图像的纹理,所以要进行字间距与行间距的归一化。[5]
2.3.3 纹理特征抽取
纹理纹理可分为自然纹理和人工纹理,自然纹理是具有重复排列的自然景像,如砖墙、木板、种子、森林、草地之类的照片。人工纹理是由自然背景上的符号排列组成,这些符号可以是线条、点、字母、数字等。笔迹图象的纹理属于人工纹理。本课题将原始的笔迹图像经ADOBE
PHOTOSHOP处理成640×640二值纹理图像,它把不同的笔迹看成不同的纹理,笔迹纹理之间的差别主要是由笔划的方向和笔划之间或偏旁之间的交接部位及相对位置的高低、疏密引起的
。通过提取笔迹纹理图像的纹理信息来获取一个人的笔迹特征。
我们采用灰度共生矩阵分析法提取纹理特征(纹理特征分析方法大致可以分为:统计方法、构造方法、谱分析方法。灰度共生矩阵分析法属于统计方法之一,是一种揭示纹理空间性质的方法。[6]
2.3.4
手写材料匹配
获得特征向量之后,笔迹识别的问题就是一个典型的模式匹配识别问题。本课题采用加权欧氏距离(加权最小距离)Weighted
Euclidean Distance
(WED)进行笔迹识别。
(2-1)
fi表示检材(未知样本)的第i个特征,fi(k)表示第k个样本(已知)的第i个特征,wi表示第i个特征的权值,n表示所提取的特征总数。把未知笔迹的特征向量与已知样本笔迹的特征向量相比较,当且仅当它的特征向量与第k个样本的欧氏加权距离最小时,未知笔迹被识别为第k类笔迹。[7]
3 笔迹鉴定系统详细设计
3.1笔迹特征的表示与提取
3.1.1
笔迹图像的获取
我们采集了20个人的笔迹,每人一份,每份笔迹含300个手写汉字左右,对内容、书写用笔和纸张均进行了统一,将笔迹文稿按500dpi分辨率RGB格式扫描,处理成二值图像,以BMP图像格式存储,组织成20人的笔迹库。
3.1.2
笔迹图像的预处理
为了进行特征提取和分类,需要对笔迹图像进行预处理和归一化操作,以消除书写纸背景、扫描噪声以及书写时出现的大量的空白等因素对笔迹特征提取的影响。首先利用RGB颜色信息进行聚类,根据象素的分布特征设定相应的阀值去除背景,接着对图像二值化,如图a、b所示;以位图方式存储。将得到的笔迹一分为二,一份用于训练(如图c所示),另一份用于测试(如图d所示),以保证训练数据和测试数据完全不同(如果有足够的笔迹页,可以拿一页做训练,另外的做测试),对于训练数据以统一的行高个象素对每行进行归一化处理,粘贴到640*640的图像中,将得到的图像平均分成25个128*128的图像用于训练,用同样的方法将测试数据粘贴成640*640的图像,再分割成25个128*128的图像块用于测试。图e所示为通过上述方法得到的三个不同书写人的笔迹样本。[8]
(a)原始笔迹图像
(b)去除背景,二值化后的图像
(c)
用于训练的图像
(d) 用于测试的图像
(e)
图3-1 3个不同书写人的笔迹样本
3.1.3
笔迹特征的提取
每个人都有自己的书写风格,如图3-1(e)所示,从整体笔迹图像看,因为它们含有不同的纹理特征,所以把笔迹识别问题转化成纹理识别问题处理。
纹理区域的灰度直方图作为纹理特征,为了研究灰度直方图的相似性,可以比较累积灰度直方图分布,计算灰度级的最大偏差或总偏差。如果限定对象,则采用这样简单的方法也能够识别纹理。但是灰度直方图不能得到纹理的二维灰度变化,即使作为一般性的纹理识别法,其能力是很低的。两种纹理具有相同的直方图,只靠直方图就不能区别这两种纹理。[9]
根据定义,所构成的灰度共生矩阵的第i行、第j列元素,表示图像上的所有在Ø方向、相隔为δ,一个为灰度i值,另一个为灰度j值的像素点对出现的频率。这里Ø取值一般为0°、45°、90°和135°。很明显,若Δx=1,Δy=0,
Ø =0 °; Δx =1, Δy =- 1, Ø=
45°;Δx=0,Δy=-1,Ø=90°;Δx=1,Δy=-1,Ø=135°.δ的取值与图像有关,一般根据实验确定,在此,我们取δ=1。
灰度共生矩阵反映了图像灰度关于方向、相邻间隔、变化幅度的综合信息,它可作为分析图像基元和排列结构的信息。作为纹理分析的特征量,往往不是直接应用计算的灰度共生矩阵,而是在灰度共生矩阵的基础上再提取纹理特征量,称为二次统计量。一幅图像的灰度级数一般是256,这样计算的灰度共生矩阵太大。为了解决这一问题,在求灰度共生矩阵之前,我们将图像扫描成二值图像。
用灰度共生矩阵提取特征之前,要作正规化处理。R是正规化常数。
当取δ=1,q=0°时,每一行有2(Nx–1)个水平相邻像素对,因此总共有2Ny
(Nx–1)水平相邻像素对,这时R=2Ny(Nx–1)。当取δ=1, q=45°时,共有2(Ny–1)
(Nx–1)相邻像素对,R=2(Ny –1)(Nx –1)
。由对称性可知,当q=90°和135°时,其相邻像素对数是显然的。Haralick等人由灰度共生矩阵提取了14种特征。最常用的4个特征是:
(1) 逆差矩
(2) 对比度(惯性矩)
(3) 相关
(4) 熵
若希望提取具有旋转不变性的特征,简单的方法是对θ取0°、45°、90°和135°的同一特征求平均值和均方差就可得到。对待鉴别的象素为640*640材料,将其分割成25块象素为128*128的小块。间隔δ=1,Ng=2(将0–255压缩成2级)。取特征f1,
f2, f3, f4关于θ的四个方向的平均和均方差,得到8个旋转不变的纹理特征。[10][11]
3.1.3.1 灰度共生矩阵特征及定义
(3)最小欧氏匹配流程图如表3-3所示:
表 3-3 最小欧氏距离匹配