关键词:计算机;视觉技术;图书馆;应用探讨
引言
俗话说“书是人类进步的阶梯”,各大高校以及各大城市都建有图书馆,图书馆可以满足人们对各种知识的需求,因此对图书馆的管理工作也是十分重要。如今科技不断的发展,技术被运用到图书馆管理中。。计算机视觉是一门综合性的学科也是一个富有挑战性的领域,它已经被应用到各个领域中,它的重要性不言而喻。
一、计算机视觉技术的特点
(一)检测范围广泛
人眼的检测范围毕竟有限,有些细微的方面人眼是检测不到的,比如红外线、超声波等,但是计算机视觉技术却是可以检测到人眼所检测不到的范围。计算机视觉技术可以将红外线和超声波处理成图像呈现出来,它的检测范围十分广泛而且是不加选择的进行检测,可以说它的使用大大拓展了人眼的视野。
(二)检测安全可靠
我们都知道电子产品如果接触使用必然是会受到一定辐射的,但是计算机视觉与以往的检测机器不同,它是不需要与被测者进行接触的,观测者和被测者都是十分安全不会受到丝毫损伤的,而且它在使用的过程中并不会像人眼一样感到疲惫,它可以一直进行高效率的工作,因此对其检测结果也是十分的可靠的。
二、视觉技术在图书馆工作中的应用分析
(一)图书剔旧和修补
图书馆是人们知识的殿堂,是思想文化知识不断扩展的地方,因此图书馆的剔旧是一项十分重要的工作。图书馆的空间毕竟有限,一些相对陈旧而利用率较低的参考文献是需要不定期的进行筛选的,这些资料通常都是表面发黄、布满灰尘和封面破旧等,而图书馆的剔旧工作大多是由工作人员亲自到书库中进行挑选,这样不仅工作量大、耗时长还有可能会存在遗漏的现象,而且资料上的灰尘也会给工作人员的身体健康带来影响。
图书馆会收藏一些珍贵的古籍和字画,但是时间一长,受到温度、湿度等的影响会造成古籍和字画表面发黄、纸张变脆甚至会出现虫眼,这时候就需要对古籍字画进行修补工作。这项工作大多由工作人员亲力亲为,会给工作人员带来一定的健康影响,如果使用计算机视觉技术代替人们来进行工作,会大大减少工作人员的工作强度,同时也保证了工作效率。
(二)管理职工人员
图书馆中职工人员的正常有序的工作是保证图书馆正常运行的关键之处,在进行图书馆职工人员的管理上可以引用计算机视觉技术。以往的职工签到可能会出现代签现象,而计算机视觉技术可以采用图像视觉处理技术对职员进行磁卡、眼膜、人脸识别等进行签到,杜绝了以往签到工作所存在的弊端。同时,在图书馆工作处理中,计算机视觉技术也可以帮助职工人员处理一些难题,让图书馆工作能够有序高效的进行。
(三)监控检测系统
如今图书馆的书籍是完全向人们开放的,人们可以自由进行借阅,以往的人工检测会造成猜疑和尴尬,也会加大图书馆管理人员与读者之间的磨擦。计算机视觉技术的使用可以全自动化进行监控和检测,避免了以往人工监测所出现的问题。图书馆的书籍借阅管理工作异常重要,计算机视觉技术可以全程自动化进行高效工作,可以进行无人看管检测读者进出携带书籍文献和借阅空间的监控等,大大提高了工作效率,让图书馆的借阅工作顺利有序的进行。
三、视觉技术在图书馆工作中的应用问题的研究
(一)循序渐进的结合
计算机视觉作为一个新兴技术,虽然已经被运用到各个领域内,但是在引进入图书馆的管理中,如果想要快速的取代传统的管理模式,无论是工作人员还是工作理念都不可能及时接受这种改变的。新技术的融入必须要循序渐进,找到与传统的管理模式的结合点,然后进行慢慢磨合,达到与传统相结合的效果,这样人们才能够接受一种新技术的使用,不仅提高了工作效率减轻了工作人员的工作负担,也能够更好的发挥出计算机视觉技术的真正。
(二)提高专业人员的业务水平
新的技术需要新的业务水平来支持,如果没有相应的业务水平是没有办法发挥出新技术应有的作用。计算机视觉技术通过计算机成像系统来代替人类的视觉感官,能够自主适应环境、自主工作的能力。计算机视觉技术在不断的更新中,它的使用功能也是越来越多,操作方法越来越复杂,这时就需要图书馆的工作人员对计算机视觉技术有细的了解,能够熟练操作和运用计算机视觉技术。图书馆管理阶层应该组织工作人员进行培训工作,让他们接收新的知识掌握新的技术,不断的提高图书馆工作人员的业务水平,才能够保证图书馆工作高效进行。
(三)读者素质和应用手段的提高
现代化图书馆要想实现工作和服务的全面自动化,就需要有现代化技术的支持,计算机视觉技术的引用虽然是一个现代化技术的支持,但是如今仅停留在生物特征的识别领域。比如图书馆如今普遍有门禁系统,这也仅停留在计数功能和监控可冲消磁条的识别和认定上,如果有些读者素质不高故意去掉这些生物识别,图书馆的门禁系统就没有办法阻止这些读者的进入进出。因此,提高读者的素质和计算机视觉技术的应用手段,才能够保证计算机视觉技术在图书馆被广泛的进行使用。
结束语
关键词:计算机视觉;课程创新;教学改革
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)20-0118-02
计算机视觉课程是人工智能学科的分支学科,对互联网技术的发展有着重要的推进作用。随着时代的飞速变迁,越来越多的学生对这一领域产生了浓厚的兴趣,计算机视觉课程在信息专业中也开始占据重要的地位。如何让学生对这门课程保持长久的兴趣,如何培养学生的专业能力和实践能力,是当前高校应该考虑的问题。经过近几年的教学实践后,很多高校已经逐步确定了通过实际应用培养学生兴趣的教学方法,在满足学生对计算机视觉应用需求的同时,加深了学生对理论知识的理解,这已经成为了当前高校计算机视觉课程教学的重要模式。
一、计算机视觉课程的特点
近年来,随着计算机网络的飞速发展,计算机视觉的应用也越来越广泛,成为了信息相关专业学生的一门必修课。计算机视觉课程涉及众多领域,包括人工智能与模式识别、应用数学等,其覆盖范围广,综合性较强。。计算机视觉是一门新技术,随着时代的变迁,互联网新技术的更新日新月异,这就使得课程内容的更新过快,内容广泛,教师很难在第一时间向学生输送所有的课程知识。二是计算机视觉课程涉及多个学科领域,并且所涉及的领域知识内容复杂,表达抽象,这对学生的学习来说是一个较大的障碍。三是实践性强。。
。计算机视觉一般输入的都是图像或图像序列,其输入资料主要来自usb摄像头或是相机。经过处理后,计算机视觉输出的是对图像序列和图像对应的对真实世界的一种理解,在这一方面,计算机视觉有识别车牌、人脸的作用。而计算机图形学则是一种对虚拟场景的描述。它一般是由多个多边性数组组成,每个多边性有三个顶点,输出的是二维像素数组。在增强现实的应用中,人们不仅需要用计算机视觉来提高对物体识别和姿态获取的效率,还需要用到计算机图形学对虚拟三维物体的叠加方法。
。。其次,计算机视觉与数字图像处理之间的区别在于图形是一种纯数字化、矢量的单位,而图像则不仅包括图形,有时还包括来自现实世界的信号,并且图形的处理不是一种简单的堆积,计算机视觉的处理要从图像中找到一些统计数据和信息,并做进一步的数据分析。
三、高校计算机视觉课程教学的创新策略
1.以工程应用为导向的课程内容。鉴于学习本课程的学生在毕业之后多数会进入相关工程企业或者研究院工作,因此,在对学生进行培养时,高校一方面要考虑到学生的知识接受度,另一方面要设置以工程应用为导向的课程内容,帮助学生更好的进入企业或研究院开展工作。高校在进行计算机视觉课程教学创新时,首先要创新课程教材,摒弃以往枯燥的理论书籍,多选取一些实践性和应用性强的教材。;另外一本是国内外十分推崇的计算机视觉著作,它是美国教授Richard Szeliski教授的作品。该书在2010年出版,获得了众多业界人士的好评。Richard Szeliski教授是华盛顿大学的兼职教授,也是微软研究院交互视觉与多媒体的主任,他对计算机视觉的发展和未来走向十分清楚,也深刻了解产业界和大学需要什么样的计算机视觉课程教材。因此,这本教材面向应用,与当今最新的科技成果紧密相连,综合论述了计算机视觉在各个领域的发展,展示了计算机视觉的最新研究成果和未来的发展趋势。此外,本书中还有详细的国外研究案例和更加深入的应用案例,适合学生开展探究性学习。两本教材都是遵循以工程应用为导向的原则,对学生开放性思维的培养有着重要的意义。
2.面向科技最新成果的课程定位。计算机视觉是一门新技术,科技创新是其发展的原动力,因此,高校在进行课程安排时,应该将当今计算机视觉领域的重要的科技成果作为计算机课程的基本教学内容。。考虑到不同学生的数字图像处理基础不一的问题,学校可以在课程中补充一些有关数字图像处理的基础内容。在选择教材内容时,计算机视觉课程的内容应该包括数字图像处理、视觉学习和模式识别这三大部分。数字图像处理是视觉课程的基础内容,主要向学生介绍数字图像处理和计算机视觉所涉及的一些基础知识,包括图像的分割和检测、图像滤波的处理等。数字图像处理是整个计算机课程学习的重要基础内容,其课时可占总课时的二分之一。。作为最前沿的科技领域,视觉部分将会是该课程后期的重点内容,与实践作业紧密结合。而模式识别则更多的是新技术的一种工程应用,学生会更多的涉及到实践操作,更好的培养学生的实践能力。(2)强化学生自学和调研能力。课程调研和实践是信息专业学生强化能力的重要方法之一,高校可以在课程项目中引入新技术的探究,在使课程在具有基础性、研究性的同时,具有一定的前沿性,还能让学生在第一时间了解到最新的科技成果和互联网应用技术。在课程调研和实践中,高校必须要强化学生的自学和调研能力,在调研时给每一个小组安排一位高年级研究生作为指导,每组学生独立完成任务,高年级研究生只做引导和辅助的作用。学生在自我设置调研程序,查找资料,理解和熟悉相关程序的时候,能够更加掌握最新科技成果的内容,同时还提高了学生的自学能力和团队协作能力。
3.工程实践化的教学形式。工程项目综合能力是信息专业的学生必须具备的素质之一,因此在计算机视觉课程的教学过程中,培养学生的工程实践能力是教学目标之一。。。这对学生来说过于抽象,不易理解,因此教师不应当仅仅限于知识的传授,还应该选取一些适当的工程实例,将知识体系串联在一起,加深学会对教学内容的理解,从而达到良好的教学效果。例如,在教学过程中,教师可以着重介绍手机制造的例子。手机是现在学生十分熟悉的产品,用手机举例更加贴近学生的生活,教师可以详细介绍手机键盘和主板的制造过程,并在这一过程中将所学的算法和理论融合进去,加深学生对知识的理解。其次,教师在手机讲解时,还可以引导学生思考类似的产品制造,从而引出数码相机的制造原理,和学生一起探讨其制造算法。这种做法不仅可以帮助学生学习,还可以让学生拓宽思路,发散思维,不断创新计算机视觉领域。(2)选择合适的实际应用。计算机视觉课程是一门实践性和操作性极强的学科,因此,为了学生更好的学习,教师要将理论工程实践化,选择合适的实际应用来提高学生的实践能力。教师可以安排学生进入手机制造厂房,给学生上一堂别开生面的实践课,详细介绍每个制造流程,并向学生不断抛出与课程有关的问题,引发学生的思考,比如选择什么样的模板匹配法可以更为简单。学生在不断的解答和提问中,对学科知识的了解也会逐步加深。其次,高校可以建立专门的实训基地,学生可以在基地里实践操作,将理论转化为实物,亲自尝试做出模型,这种做法可以极大地提高学生的实践能力,使学生更快的将理论转化为实际。
四、结语
在新形势下,高校应不断创新计算机视觉课程的教学模式,并以此展开教学活动,培养学生的实践能力和创新精神。将工程应用和科技最新成果结合的教学模式,有利于解决理论和实践相脱节的问题,在增强学生学习兴趣、提高学生独立分析能力的同时,还使学生接触了国际最新的研究成果,拓宽了学生的思路,这对学生未来的发展有着重要的意义。
参考文献:
[1]郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践[J].理工高教研究,2010,(05).
[2]伦向敏,侯一民.高校《计算机视觉》课程辅助教学系统的研究[J].教育教学论坛,2012,(18).
[3]陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式[J].当地教育理论和实践,2013,(07).
[4]杨晨.视觉传达设计专业插画设计课程创新与实践人才培养机制探究[J].艺术科技,2015,(05).
[5]蒋辰.基于数字媒体环境的视觉传达设计专业综合实验课程改革探证[J].文艺生活:中旬刊,2015,(07).
[6]张胜利.视觉传达设计专业中色彩风景写生课程多元立体化教学模式的构建[J].美术教育研究,2015,(08).
1.1自动化程度高
计算机视觉可以实现对农产品的多个外形和内在品质指标进行同时检测分析,可以进行整体识别、增强对目标识别的准确性。
1.2实现无损检测
由于计算机视觉技术对农产品的识别是通过扫描、摄像,而不需要直接接触,可以减少对所检测食品的伤害。
1.3稳定的检测精度
设计的运行程序确定后,计算机视觉技术的识别功能就会具有统一的识别标准,具有稳定的检测精度,避免了人工识别和检测时主观因素所造成的差异。
2计算机视觉技术在食品检测中的应用
20世纪70年代初,学者开始研究计算机视觉技术在食品工业中的应用,近几十年电子技术得到快速发展,计算机视觉技术也越来越成熟。国内外学者在研究计算机视觉技术在食品工业中的应用方面主要集中在该技术对果蔬的外部形态(如形状、重量、外观损伤、色泽等)的识别、内部无损检测等方面。国内有关计算机视觉技术在食品业中的应用研究起始于90年代,比国外发达国家晚20多年,但是发展很快。
2.1计算机视觉技术在果蔬分级中的应用研究
计算机视觉技术在食品检测中的应用研究相当广泛,从外部直径、成熟度的检测到内部腐烂程度的检测都有研究。韩伟等[4]采用分割水果的拍摄图像和新的计算机算法计算水果的半径,进而得出果蔬的最大直径。研究表明,该算法不仅降低了计算量而且提高了计算精度,此方法用于水果分级的误差不超过2mm,高于国际水果分级标准所规定的5mm分类标准差,可在工业生产中很好应用。李庆中[5]也利用图像的缺陷分割算法研究了计算机视觉技术在苹果检测与分级中的应用,结果表明此算法能快速、有效地分割出苹果的表面缺陷。孙洪胜等[6]以苹果色泽特征比率的变化规律为理论基础,结合模糊聚类知识利用计算机视觉技术来检测苹果缺陷域,检测不仅快速而且结果精确。刘禾等[7]通过研究认为苹果的表面缺陷可以利用计算机视觉技术进行检测,计算机视觉技术还可以将苹果按照检测结果进行分级,把检测过的苹果分成裂果、刺伤果、碰伤果和虫伤果等类别。梨的果梗是否存在是梨类分级的重要特征之一,应义斌等[8]通过计算机视觉技术、图象处理技术、傅立叶描述子的方法来描述和识别果形以及有无果柄,其识别率达到90%。杨秀坤等[9]综合运用计算机视觉技术、遗传算法、多层前馈神经网络系统,实现了具有精确度高、灵活性强和速度快等优点的苹果成熟度自动判别。陈育彦等[10]采用半导体激光技术、计算机视觉技术和图像分析技术相结合的方法检测苹果表面的机械损伤和果实内部的腐烂情况,初步验证了计算机视觉技术检测苹果表面的损伤和内部腐烂是可行的。冯斌等[11]通过计算机视觉技术对水果图像的边缘进行检测,然后确定水果的大小用以水果分级。试验表明,该方法比传统的检测方法速度快、准确率高,适用于计算机视觉的实时检测。朱伟[12]在模糊颜色的基础上,分析西红柿损伤部分和完好部分模糊颜色的差别,用分割方法对西红柿的缺陷进行分割,结果显示准确率高达96%。曹乐平等[13]人研究了温州蜜柑的果皮颜色与果实可滴定酸含量以及糖分含量之间的相关性,然而根据相关性,样品检测的正确识别率分别只有约74%和67%。刘刚等[14]从垂直和水平两个方向获取苹果的图像,并通过计算机自动分析图像数据,对苹果的外径、体积、以及圆形度等参数进行处理,与人工检测相比,计算机视觉技术具有检测效率高,检测标准统一性好等优点。Blasco.J[15]通过计算机视觉技术分析柑橘果皮的缺陷,进而对其在线分级,正确率约为95%。赵广华等[16]人综合计算机视觉识别系统、输送转换系统、输送翻转系统、差速匀果系统和分选系统,研制出一款适于实时监测、品质动态的智能分级系统,能够很好地实现苹果分级。。
2.2计算机视觉技术在禽蛋检测中的应用研究
禽蛋企业在生产过程中,产品的分级、品质检测主要采用人工方法,不仅需要大量的物力人力,而且存在劳动强度大、人为误差大、工作效率低等缺点,计算机视觉技术可以很好的解决这类产品工业生产中存在的困扰。欧阳静怡等[18]利用计算机视觉技术来检测鸡蛋蛋壳裂纹,利用摄像机获取鸡蛋图像后,采用fisher、同态滤波和BET算法等优化后的图像处理技术,获得裂纹形状并判断,试验结果表明,计算机视觉技术对鸡蛋蛋壳裂纹的检测准确率高达98%。汪俊德等[19]以计算机视觉技术为基础,设计出一套双黄鸡蛋检测系统。该系统获取蛋黄指数、蛋黄特征和蛋形尺寸等特征,和设计的数学模型对比来实现双黄鸡蛋的检测和识别,检测准确率高达95%。郑丽敏等[20]人通过高分辨率的数字摄像头获取鸡蛋图像,根据图像特征建立数学模型来预测鸡蛋的新鲜度和贮藏期,结果表明,计算机视觉技术对鸡蛋的新鲜度、贮藏期进行预测的结果准确率为94%。潘磊庆等[21]通过计算机视觉技术和声学响应信息技术相结合的方法检测裂纹鸡蛋,其检测准确率达到98%。MertensK等[22]人基于计算机视觉技术研发了鸡蛋的分级检测系统,该系统识别带污渍鸡蛋的正确率高达99%。
2.3计算机视觉技术在检测食品中微生物含量的应用研究
计算机技术和图像处理技术在综合学科中的应用得到快速发展,在微生物快速检测中的应用也越来越多,主要是针对微生物微菌落的处理。食品工业中计算机视觉技术在微生物检测方面的研究和应用以研究单个细胞为主,并在个体细胞的研究上取得了一定的进展。殷涌光等[23]以颜色特征分辨技术为基础,设计了一套应用计算机视觉技术快速定量检测食品中大肠杆菌的系统,该系统检测结果与传统方法的检测结果具有很好的相关性,但与传统方法相比,可以节省5d时间,检测时间在18h以内,并且能够有效提高产品品质。Lawless等[24]人等时间段测定培养基上的细胞密度,然后通过计算机技术建立时间和细胞密度之间的动态关联,利用该关联可以预测和自动检测微生物的生长情况,如通过计算机控制自动定量采集检测对象,然后分析菌落的边缘形态,根据菌落的边缘形态计算机可以显示被检测菌落的具置,并且根据动态关联计算机视觉系统可以同时处理多个不同的样品。郭培源等[25]人对计算机视觉技术用于猪肉的分级进行了研究,结果显示计算机视觉技术在识别猪肉表面微生物数量上与国标方法检测的结果显著相关,该技术可以有效地计算微生物的数量。Bayraktar.B等[26]人采用计算机视觉技术、光散射技术(BARDOT)和模式识别技术相结合的方法来快速检测李斯特菌,在获取该菌菌落中的形态特征有,对图像进行分析处理达到对该菌的分类识别。殷涌光等[27]人综合利用计算机视觉、活体染色、人工神经网络、图像处理等技术,用分辨率为520万像素的数字摄像机拍摄细菌内部的染色效果,并结合新的图像处理算法,对细菌形态学的8个特征参数进行检测,检测结果与传统检测结果显著相关(相关系数R=0.9987),和传统检测方法相比该方法具有操作简单、快速、结果准确、适合现场快速检测等特点。鲁静[28]和刘侃[29]利用显微镜和图像采集仪器,获取乳制品的扫描图像,然后微生物的图像特征和微生物数量进行识别,并以此作为衡量乳制品质量是否达标的依据,并对产品进行分级。
2.4计算机视觉技术在其他食品产业中的应用研究
里红杰等[30]通过提取贝类和虾类等海产品的形状、尺寸、纹理、颜色等外形特征,对照数学模型,采用数字图像处理技术、计算机识别技术实现了对贝类和虾类等海产品的无损检测和自动化分类、分级和质量评估,并通过实例详细阐述了该技术的实现方法,证实了此项技术的有效性。计算机视觉技术还可以检验玉米粒形和玉米种子质量、识别玉米品种和玉米田间杂草[31]。晁德起等[32]通过x射线照射获取毛叶枣的透视图像后,运用计算机视觉技术对图像进行分析评估,毛叶枣可食率的评估结果与运用物理方法测得的结果平均误差仅为1.47%,因此得出结论:计算机视觉技术可以应用于毛叶枣的自动分级。GokmenV等[33-34]通过对薯片制作过程中图像像素的变化来研究薯片的褐变率,通过分析特色参数来研究薯片中丙烯酰胺的含量和褐变率的关系,结果显示两项参数相关性为0.989,从而可以应用计算机视觉技术来预测加热食品中丙烯酰胺的含量,该方法可以在加热食品行业中得到广泛应用。韩仲志等[35]人拍摄和扫描11类花生籽粒,每类100颗不同等级的花生籽粒的正反面图像,利用计算机视觉技术对花生内部和外部采集图像,并通过图像对其外在品质和内在品质进行分析,并建立相应的数学模型,该技术在对待检样品进行分级检测时的正确率高达92%。另外,郭培源等[36]人以国家标准为依据,通过数字摄像技术获取猪肉的细菌菌斑面积、脂肪细胞数、颜色特征值以及氨气等品质指标来实现猪肉新鲜程度的分级辨认。
3展望
新技术的研究与应用必然伴随着坎坷,从70年代初计算机视觉技术在食品工业中进行应用开始,就遇到了很多问题。。
3.1检测指标有限
计算机视觉技术在检测食品单一指标或者以一个指标作为分级标准进行分级时具有理想效果,但以同一食品的多个指标共同作为分级标准进行检测分级,则分级结果误差较大[37]。例如,Davenel等[38]通过计算机视觉对苹果的大小、重量、外观损伤进行分析,但研究结果显示,系统会把花萼和果梗标记为缺陷,还由于苹果表面碰压伤等缺陷情况复杂,造成分级误差很大,分级正确率只有69%。Nozer[39-40]等以计算机视觉为主要技术手段,获取水果的图像,进而通过分析图像来确定水果的形状、大小、颜色和重量,并进行分级,其正确率仅为85.1%。
3.2兼容性差
计算机视觉技术针对单一种类的果蔬分级检测效果显著,但是,同一套系统和设备很难用于其它种类的果蔬,甚至同一种类不同品种的农产品也很难公用一套计算机视觉设备。Reyerzwiggelaar等[41]利用计算机视觉检查杏和桃的损伤程度,发现其检测桃子的准确率显著高于杏的。Majumdar.S等[42]利用计算机视觉技术区分不同种类的麦粒,小麦、燕麦、大麦的识别正确率有明显差异。
3.3检测性能受环境制约
关键词:计算机; 交通运输; 视觉; 信号控制
中图分类号:TP39 文献标识码:A 文章编号:1006-3315(2013)06-175-001
近20年来,随着我国经济社会的快速发展,大家直接的感觉是交通和运输行业呈现出井喷式的发展:在1990年的时候,我国机动车保有量是1476.26万辆,我国公路的总里程102.83万公里;到了2010年,我国汽车的保有量已经达到了2706.13万辆,我国公路总里程已经达到了482万公里。交通运输对经济的发展起着至关重要的作用,高效的运输保障能力是促进经济发展的重要措施;自上世纪计算机技术在交通运输领域应用以来,其高运算性、集成性为交通运输系统的发展提供了充分的技术支持,提高了运输效率,缓解了交通运输压力。随着计算机技术的飞速发展,在交通运输系统中将会有更为广泛的运用。
1.计算机视觉技术在交通运输中的应用
。
①基于计算机视觉技术的车辆牌照自动识别。
②基于计算机视觉技术的车辆检测与流量统计。
③基于计算机视觉技术的公交车辆乘客人数统计。
④基于计算机视觉技术的公交专用道非法占道抓拍。
⑤基于计算机视觉技术的驾驶员工作状态判断。
⑥基于计算机视觉技术的行人检测。
随着图像处理、模式识别与人工智能技术的发展,更多的基于计算机视觉新技术将在智能交通系统中涌现,并以此进一步便利人们的出行方式与交通职能部门管理水平与工作效率。
2.车辆收费系统中计算机技术的应用
在近期我国兴起的不停车收费系统(ETC系统)是一种先进的电子收费系统,它包括自动车辆识别系统、计算机网络、监控系统和车道系统4个部分。与之前人工的收费系统相比,节约资源、减少污染、杜绝票款流失、减少车辆延误、提高通行能力与服务水平;该系统普遍采用非接触式的射频卡,以天线的方式对车辆上卡中信息进行读写,采用高速率的半双工协议来进行车辆识别与数据交换,实现车辆不停车收费,不停车收费系统将是未来收费系统的发展趋势,具有极其广阔的应用前景。
3.在交通信号控制领域计算机技术的应用
随着大、中城市不断增加的车辆和有限的道路空间矛盾日益加剧,交通系统面临着越来越多的问题。合理的运用计算机控制管理技术是缓解城市交通问题的重要措施之一,交通信号自动控制是交通控制的重要组成部分。智能交通中的信号灯控制显示出了越来越多的重要性,采用计算机技术、自动化控制技术和现代网络通讯技术,使车辆行驶和道路导航实现智能化,从而缓解道路交通拥堵,减少交通事故,改善道路交通环境,节约交通能源,减轻驾驶疲劳等功能,最终实现安全、舒适、快速、经济的交通环境。
。哪里发生了交通事故,哪里交通拥挤,哪条路最为畅通,会以最快的速度提供给驾驶员和交通管理人员。。无论你是在办公室、大街上、家中、汽车上,只要采用其中任何一种方式,你都能从信息系统中获得所需要的信息。有了该系统,外出旅行者就可以眼观六路、耳听八方了。
4.总结
21世纪将是计算机技术高速发展并更加广泛应用的世纪,也是公路交通智能化的世纪,人们将要利用计算机技术,构建更加智能的交通运输体系。计算机技术在将来的交通运输管理中将发挥更加重要的作用。计算机技术将使未来的车辆靠自己的智能系统和道路交通管理体系在道路上自由行驶;。计算机技术使得交通运输的效率更高,更好的为经济飞速发展做好支持。
参考文献:
农业机械化不仅是人类的解放,解放劳动力。这些年轻的劳动力投入到其他领域,促进中国的经济发展可以提高农业生产的效率,优化操作质量和增加作物产量,有利于农业发展和农民收入,因此,今后应重视先进技术的推广,提高农业机械化水平。目前农业机械的使用,一些机械在使用过程中不能清楚地确定作物的位置,机器在关闭过程中很容易错过,所以利用新技术在农业机械有利于弥补农业机械的脆弱性,提高机器的运作效率。
目前,高新技术的应用范围扩大,农业机械行业也开始使用高新技术,引入计算机视觉技术、自动控制技术、信息网络技术、人工智能技术、机器人技术和液压技术在农业机械的应用现状。
2 农业机械的应用技术
2.1 农业机械的应用计算机视觉技术
农业机械的应用计算机视觉技术,主要是利用计算机视觉技术在农产品质量、品位等农业产品检查,是基于图像处理,计算机视觉的学科,主要是视觉信息处理理论。表达和计算方法研究,近年来,图像处理,计算机硬件和软件,等可视化仿真技术的逐渐发展计算机视觉技术的使用功能也扩大,计算机视觉技术是用来检查农产品的质量不仅是现阶段和分级产品还用于收割、种植等。
2.2 农业机械的CAD技术
CAD技术在我国已广泛应用于机械工程设计制造从上个世纪60年代,我国40多年后独立研究开发和推广应用。但由于我国机械工程设计CAD系统的开发过程的社会主义改革开放的影响,以便后期的完美程度我国机械工程设计CAD系统程度的效率和其他性能大大受到限制,相对于我国的国外机械工程设计CAD系统仍处于较低水平。
2.3 农业机械的信息网络技术
信息网络技术在农业机械中的应用非常成功,信息网络技术和地理信息系统,结合自动化技术等技术,可以监测作物和土壤的农业生产,也可以生产作物的发展,植物病虫害,和实时监控等等,然后依靠定位系统和地理信息系统来完成现场操作。
农业机械、机器人技术应用、信息网络、计算机视觉、自动控制技术的融合。目前,已经开发了采摘机器人,嫁接机器人,机器人除草,施肥机器人喷涂机器人,等。对肥料和喷涂机器人的使用,可以避免肥料、杀虫剂和其他化学品危害人体,达到改善环境的目的。目前虽然我国机器人技术落后于发达国家,取得了一些就,但由于现代机械机器人的购买成本非常高,所以这项技术并没有得到普及。
在农业机械的设计、制造和测试,虚拟现实技术具有非常广阔的发展前景,利用虚拟现实技术建立三维模型的农业机械设计师不仅可以了解每一个部分的质量,也可以完全满足的每一部分的运行性能三维农业机械模型具有很高的精度,和农业机械制造商大规模生产的计算机数据的基础上。
在虚拟制造系统中,虚拟现实技术的基础,虚拟制造系统是由多种学科知识,利用计算机技术综合建模、仿真、生产、制造汽车。与此同时,虚拟制造系统还可以制定合理的产品检验和测试程序。目前,虚拟制造技术应用范围广泛,涉及开始工装及模具生产设备,和其他领域,可以在生产部门系统,在这一过程中完成建模、修改、分析和优化的四个工作。此外,虚拟现实技术用于柔性制造系统和计算机集成制造系统的设计。
2.4 人工智能技术
近年来,全球高端技术获得了农业机械在农业的快速发展,管理,挖掘和采摘等实现智能化,使用人工智能技术研究和开发的激光拖拉机、内部导航设备,等等,可以拖拉机的方向和具置测量,并通过建立计算机数据库将记录相关数据,使用数据库了解排水位置、土壤湿度、等等。了解土地信息后,制定合理的土地种植方案,计算机化化肥消费,数量的农药和种子。
3 先进技术的应用在农业机械化操作的保障措施
得到更好的应用程序为了促进先进技术,提高农业机械化水平,未来应该完善的技术推广体系,提高农业机械化水平,促进农业生产和发展。完善的技术推广体系,高度重视农业技术推广,建立试验示范基地,发挥作用的指导,让农民参观和学习。让他们意识到农业机械设备的重要作用,加强农业机械化的意识,接受和使用机械设备,技术推广和培训活动。让广大农民掌握农业机械和设备的使用,提高思想认识和应用技能、农业机械和农业技术应用于农业生产。
构建技术环境,当地政府应该高度重视农业机械和农业技术推广的作用。提高思想认识,加强规划和指导,增加资本投资,培训专业人才,创新工作方法,对许多人来说,完善的技术推广体系,认真履行职责,并扩大先进技术的影响。完善法律法规,充分利用其在技术和人才优势,重视技术的宣传和推广活动,增强服务意识,扩展广泛的服务渠道,更好的满足实际工作的需要,对农业技术的发展,为推广农业机械和设备创造便利。
4 农业机械新技术的发展
首先,加快新技术的使用和推广。科学技术是第一生产力,加快计算机视觉技术、自动控制技术和智能技术等新技术在农业机械的使用,同时引进国外先进的机械、新技术,促进我国农业的发展,提高农业的生产效率具有重要意义。
第二,政府补贴。购买新机器的个人组织生产、资本压力,使得他们很难机械技术推广,所以对于农业机械推广使用新技术,政府将给予补贴材料,扩大新机器的使用。
第三,提高农业资源的利用效率。机械使用以提高农业生产的效率,提高农业资源的利用率。例如,在传统的农业生产过程中,和处理农作物秸秆,绝大多数情况下燃烧,不仅浪费资源,还污染空气。但农业机械的使用新技术的农作物秸秆粉碎加工、作物秸秆可以转化成脂肪不仅材料,提高农业资源的使用效率,也减少了空气污染。
关键词:计算机视觉;手势交互;肤色模型;静态识别
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2016)35-0193-02
1 研究背景
随着信息化的高速发展,人们的生活也进入了网络时代。大数据,云计算也进入了人们的生活,其标志性的现象就是各类智能终端设备的不断涌现,它使人机交互的方式正发生着深层次改变。人机交互的方式正在从传统的鼠标搭配键盘的方式往触控、语音交互、动作识别等技术为主导的更自然的方式转变。其中语音与计算机视觉尤为突出,它使计算机变得更加的灵性化。而这两者中计算机视觉又更能够传情表意,它能够“看”明白用户的肢体语言或者表情。国内外的自然交互研究涉及了人脸识别、眼神识别、表情识别、手势识别、肢体语言识别等。手势识别作为一种人类普遍使用的交流方式,应用在计算机交互上能给人一种直观和自然的感觉。这种自然的输入方式把人们从传统的与输入设备接触交互方式中解放出来,使人们与计算机交互更加的轻松愉悦。
计算机视觉是让计算机可以替代人眼的技术。。其中,手势识别技术是计算机视觉的一个的重要的研究方向,它是一种常用并且合理的人机交互方式。随着计算机视觉,包括图像处理技术以及人工智能等技术,特别是虚拟现实技术的迅速发展,手势识别的实现更加成为可能。由于客观环境的多变及人手和手势的多样性,如何在限制较少的条件准确识别手势并能保证其精度、效率以及稳定性是研究的关键。
手势识别按照手势输入设备分类,可以分为基于数据手套的手势识别和基于视X的手势识别。基于视觉的手势识别中,最常见的手势分类是将手势分为静态手势和动态手势。静态手势是一种较简单的手势,当用户做出一个固定和静止的动作时计算机将其处理后识别出来。动态手势相对要复杂一些,它可以看做是由一系列的静态手势组成的序列。如果将静态手势和动态手势组合,将可以形成语义很丰富的手势系统。
1目前人机交互的不足
人与计算机之间的交互方式是人机交互研究的核心。从现在的姿势交互和语音交互往前追溯,有触摸交互、手写交互、鼠标和键盘交互。姿势交互又细分为手势交互、表情交互、身体姿势交互。
传统的输入设备有很多的不足之处。鼠标和键盘,由于它们的使用需要接触,在某些环境下使用不方便。用户在车站、餐厅、购物商场等场景下要与计算机交互时,使用传统交互方式十分的不便。而且在公共场合下,接触性的使用会有很大的卫生问题。不仅需要占用很大的空间,同时也会有设备损耗的问题。
手写交互和触摸交互改善了传统的机械性输入,它们是更符合人类的使用习惯的。但是它们任然要求用户要与设备接触,这不免会在接触设备的过程中损坏到设备。所以同样有着易损耗等问题。
基于视觉的手势交互很好克服了上述交互方式的不足之处。手势交互是不需要接触的,没有损耗问题,也不会有接触带来的卫生问题。手势交互有符合人类动作习惯和直观自然的优点,使其成为了下一代自然交互方式研究的焦点。
2目前国内外手势识别状况
基于视觉的手势识别不需要昂贵的设备,仅仅需要摄像头和PC机器就够了。其廉价的输入设备会使其将来应用范围十分广泛。手势识别在计算机视觉的研究中是热点。国内外都有很多的学者在不断研究。这些研究在手势的分割、跟踪、识别和应用中有很多的进展。
国外对基于视觉的手势识别的研究工作起步很早。L.H.Howe等人使用肤色阈值和帧相减的技术实现了手的检测和分割。J.Zaletel等人提出了静态手势特征的方法,这种方法是用于提取手指的位置的。它先计算出掌心的位置,然后将掌心的位置作为极坐标的原点,将手掌的轮廓映射到这个极坐标,然后利用极坐标上的局部最大值来提取手指的位置。Huang使用3D神经网络创建的手势识别系统实现了15个不同手势的识别[1]。
在技术的应用上面,从上世纪九十年代开始,国外的科学家就开始不断研究手势识别技术,并且研制出一些实体来进行试验,例如:可以模仿人进行手势操作的机器人;电视控制的传感系统,无需遥控,利用手势识别左右上下进行对电视的遥控;体感游戏,更是完美的利用手势识别,在信息交互中完全释放出手势识别的优势。
我国相对于国外的研究起步要晚,但是目前也取得了很大的研究成果。朱建伟[1]使用两个摄像头正交放置,实现了三维手势的识别,并实现了使用手势实现对照片的浏览。孙玉[3]使用Hu矩特征手势识别和CamShift算法对手势跟踪,实现了手势对Word的输入和操作。
3意义
本文主要研究基于视觉的手势识别技术和对这种技术的应用。目标跟踪识别是计算机视觉领域中的关键技术,多应用于人机交互。手势识别必将使人与机器之间的沟通变得智能化、信息化,与传统的输入设备相比,手势操作则显得直观和自然,更符合人类习惯。
手势识别作为新型的人机交互技术,手势识别技术越来越广泛应用到各个行业。体感游戏首先成熟使用的,改变了传统的手持物体操作。更加互动,真实。使得人与游戏美妙结合,身临其境。
手势识别还可以用于手语识别。手语是聋哑人使用的语言,是聋哑人与正常人交流的平台。在医疗领域中,具有语言交流障碍的患者,可以通过手势识别,在预设好系统中,自助挂号,表达病情。更加体现人性化。综上所述,手势识别技术越来越被研发人员重视,在日常生活中涉及的领域也越来越多,研究价值也越来越突出。这项技术也将被广泛的普及推广到人们生活中的方方面面。
4结束语
基于计算机视觉的识别的功能还可以不断拓展,可以实现摄像头检测人与电脑的距离(当计算机识别出人坐在计算机前时显示器显示,当人离开的时候关闭显示器,达到节约电能的作用)等等。手势识别还可以应用于虚拟键盘,使用一个投影的键盘,然后通过摄像头识别手在虚拟键盘上的相关操作。可以用在智慧医疗中,解决传统的诊疗挂号方式。从根本上寻找解决病人就医难的状况的合理方案将健康的养生知识传播到更远更广。
参考文献:
[1] Guan Ran and Xu Xiangmin, A Computer Vision-Based Gesture Detectio And Recognition Technique[J]. Computer Applications and Software.2013,30(1):155-164.
(东北石油大学,黑龙江 大庆 163318)
摘 OpenCV及Matlab设计并实现一套排球智能分析系统,为排球比赛分析及球队战术训练等提供决策支持.
关键词 ;目标检测;识别跟踪;轨迹提取
中图分类号:G842文献标识码:A文章编号:1673-260X(2015)02-0182-02
1 关键技术分析实现
(1)进行摄像机标定和场地标定,获得摄像机内外参数以及场地边界数据,同时将图像的像素坐标映射成实际场地坐标.
(3)比赛开始后启动系统,利用运动目标检测算法检测是否有运动目标.
(4)通过特定的运动目标跟踪识别算法从图像中分割并提取出运动目标.
(5)根据双目摄像机所获取的目标质心坐标得到排球的三维坐标值,记录其运动轨迹数据和轨迹特征,建立运动轨迹方程.
(6)将轨迹曲线特征作为智能分析系统的输入,用于比赛训练等的裁判决策和智能分析.
1.1
1.2 运动目标检测
1.3 运动目标跟踪识别
1.4 轨迹曲线提取
1.5 智能分析模块
智能分析模块可依据对排球运动轨迹变化情况的分析,研究排球比赛中运动员击球行为的检测、击球动作的分类、识别与分析技术等.
2
2.1 系统软硬件架构
软件部分使用Intel公司支持的开源计算机视觉库OpenCV提供的函数进行计算机视觉算法方面的开发,采用VC++编程实现运动目标的检测跟踪算法,完成了摄像机及场地的标定、图像序列的获取、排球目标的检测、排球运动轨迹的提取、轨迹特征信息的分析等.
2.2 系统实现
系统深入研究双摄像头下排球的识别检测跟踪与轨迹提取方法,为裁判辅助智能分析系统提供有效的数据输入和决策支持,同时满足系统的精确性、鲁棒性、实时性等方面的问题.
(Video For
3 小结
参考文献:
〔1〕张虎.机器视觉中二维图像的三维重建[D].北京:北方工业大学,2006.
关键词:涂胶机 双目立体视觉 图像标定
中图分类号:TP273 文献标识码:A 文章编号:1672-3791(2015)01(b)-0000-00
随着现代机器视觉处理技术发展,目视系统制造工艺得到巨大进步,高分辨率、低非线性失真目视系统价格已大大降低。飞速发展的计算机视觉系统在汽车生产领域使用日愈广泛,双目视系统通过图像定位获取物体的精确坐标,并将物置信息提供给机器操作分支进行精确操作。在计算机视觉系统和工业检测中需要对景物进行三维立体坐标测量、精确定位和定量分析。双目视系统是计算机视觉的重要部分,能够对视觉范围内的物体进行自动识别定位,对数据进行分析后实现系统现场标定。目视系统需要将三维场景中的物体和二维图像进行连接,具有高效率、高精确度和低成本等特点,在现代工业中得到广泛应用。一般常用的目视系统模型分为线性针孔模型、拟透视投影模型和正交投影模型三类。
1 透视变换模型标定
双目视系统的需要从二维图像中计算出空间物体的三维信息,运用透视变换模型需要获取物体图像信息,再根据所获取的图像信息分析物体的三维立体坐标,从而进行识别并得到物体准确的位置信息。所谓的目视系统标定是指通过几何模型参数将空间物体和图像进行点对点连接后,进行数据分析标定的过程。几何模型参数决定了空间物体表面的几何位置和图像对应点间的相互关系,对双目视系统定位具有关键性的作用[1]。
在视觉导航、监控跟踪等立体视觉系统应用中,对图像定位处理的效率要求较高,建立高效快捷的双目视系统模型是社会发展的现实要求。在实际应用中,常使用线性目视系统模式进行图像标定处理,反而忽视了目视系统非线性因素的影响。
2 目视系统标定重要性
目视系统标定具有如下几个重要作用:
1:从计算机图像中导出三维信息
目视系统标定经过多次试验和计算能够得到一个目视系统模型参数,该参数决定了计算机图像和空间物体表面进行点对点连接的相互关系,能够提供给定坐标点的图像坐标,并确定实际物体目标点的空间位置信息。目视系统标定在机电元件自动装配、机器人标定、轨迹分析及在线检测等方面运用广泛。
2:确定自动行驶车辆上的空间位置
利用目视系统标定可以确定自动行驶车辆和移动机器人的空间位置信息,如果知道目标点的空间坐标和图像坐标,可以通过目视系统参数标定技术进行分析,从而得到目视系统的方向信息。
3:已知物体的三维信息可导出物体的二维计算机图像坐标
在进行模型驱动的机器视觉检测和装配中,有关于物体的方向假设和立体空间坐标问题时,可以利用目视系统参数转化为该图像的假设,然后将假设的图像和物体三维图像进行比较,如果假设图像满足物体三维信息,则可确认或拒绝对该物体和物体空间位置假设成立。
3 目视系统的标定原则
目视系统的标定包括图像获取、参数计算、图像预处理等关键步骤,在进行图像标定时一般需要在目视系统前放置特制的标定参照物,获取该物体图像后计算内、外部系统参数[2]。采用点特征提取方式标定参照物,并根据每个特征点相对于世界坐标系OwXwYwZw 的位置进行精确的测量。得到物体坐标点的数据进而可以解出目视系统内、外部参数。
下面用矩阵形式写出这些方程:
(1)
从以上方程中可以知道, M矩阵乘以任意一个不为零的常数都不会影响 与 的关系,我们可以任意使m34=1,可以得到M矩阵中其他元素的2n个线性方程。这些未知元素的个数为11个,将其记为11维向量,可以将(1)式简写成:Km = U
其中,K为(1)式左边2n×11矩阵;m指代未知的11维向量;U为(4)式右边的2n维向量,K,U为已知向量。当2n>11时,用最小二乘法可以求出上述线性方程解为: m =(KTK)-1KTU 。
m向量与 =1构成了所求解的M矩阵。从以上式子可知,若有空间6个以上的已知点和它们的二维图像坐标匹配的话,就可以求出M矩阵。一般在进行标定时都会使标定模板上有数十个已知坐标点,使方程的个数远远多于未知数的个数,用最小二乘法求方程解,从而降低误差。
求出M矩阵后,如果需要解目视系统的内部、外部参数,可由(4)式表示的关系算出目视系统的全部的内部、外部参数。不过,所求得的M矩阵与(4)式所表示的矩阵M相差一个常数因子 。指定 =1虽然并不影响投影关系,但在分解M矩阵时必须进行考虑。将(1)式M矩阵与目视系统内部、外部参数的关系写成
(2)
其中,miT(i=1~3)从式子(1)中解出,作为M矩阵第i行的前三个元素组成的行向量。二mi4是M矩阵第i行第四列元素;riT(i=1~3)是作为旋转矩阵R的第i行;tx,ty,tz分别为平移向量T的三个分量。且r1T ,r2T ,r3T ,之间有如下的约束关系:
, , ,
, , (3)
由式(2)可以得到
(4)
比较以上式子可知: m3= ,由 是正交单位矩阵的第三行, ,因此,可以从 求出 即 , , , , :
(5)
(5)式中的×表示向量运算符号,根据(5)所得参数可以得到(6)式中的参数。
(6)
从以上方程式中可以知道,根据空间6个以上一直点及其坐标信息和图像,可以按照方程(5)和(6)求出目视系统的内、外部参数。
4 总结
本文根据汽车涂胶机目视系统图像坐标和针孔目视系统模型定位等方面展开讨论。在此基础上,说明通过目视系统标定和图像点坐标可以唯一地确定空间中的一条射线。利用两个标定过的目视系统观察同一个待测点,它的空间三维坐标可以用两条这样的射线的交点计算出来,说明了双目视觉的基本原理,并讨论了投影矩阵的求解方法。
参考文献
关键词: 三维人脸;特征区域检测;特征提取;Itti视觉注意模型;计算机视觉
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2014)03-0621-06
人脸在日常的情感表达与交流中扮演着重要的角色,它是语言和复杂情感的表情载体。人类自身对人脸非常熟悉和敏感,人类视觉系统(Human Visual System, 。然而这种对人来说与生俱来的分析合成能力对计算机而言却显得尤为困难。。20世纪90年代以来,随着信息技术的发展和需求的增加,借助计算机系统强大的计算能力,并结合在认知科学、计算机视觉、机器学习等领域的研究成果,使计算机在一定程度上具备对人脸的感知能力,成为一个热门的研究课题,涌现了大量的研究成果,其中涉及人脸检测、人脸识别、特征提取、三维重建等,研究方法和手段也逐渐丰富和成熟。
近年来,随着三维图像系统的发展,三维成像设备从实验室走向市场,逐渐普及,使三维数据获取变得便捷。研究人员已逐渐认识到,相比于二维人脸分析方法,三维人脸能更精确地描述人的脸部特征,提供了人脸曲面的解剖结构信息,在光照、姿态和表情变化等方面具有明显的优势,利用人脸的三维信息是克服二维人脸分析的技术瓶颈最有效的方法。。
由于传统的对人类视觉注意(Human Visual Attention)的研究主要针对二维图像,该文将视觉注意模型引入到对三维人脸模型的分析,借鉴了Itti视觉注意模型[][][][]的思想,并结合计算机视觉中对三维人脸图像的处理算法,提出了一种改进的模型。该模型能够对三维人脸数据进行显著性分析,快速定位人脸特征分布的候选区域,进而进行特征点提取。
1 相关技术及分析
1.1 三维人脸特征点提取
人脸特征点的选择应根据应用需求而定,在MPEG-4中定义了人脸特征点的国际标准[]:FDP(Facial Definition Parameters)和FAP(Facial Animation Parameters)。其中FDP定义了人脸的形状、纹理等特征,提供人脸特征点、网格、纹理、人脸动画定义表等数据。MPEG-4定义了FDP的84个人脸的特征点,如图1所示。
图1 MPEG-4中定义的FDP特征点
三维人脸特征提取是将三维人脸数据模型转化为特征表示,利用特征来体现原始数据模型的特点。特征点能否准确定位对进一步的研究工作(如三维人脸检测和识别、三维人脸重建等)的效率、可靠性和鲁棒性都有很大的影响。特征点定位主要分为三类:1、基于人脸“三庭五等”的几何对称性,从获取人脸的对称平面开始,进而定位其他的特征点;2、基于人脸的几何特征,利用特征点处的深度、曲率和法线等进行特征点定位;3、基于人脸特征点的统计分布,利用人脸的特征点分布区域的共性,定位特征点分布候选区域,再进行特征点提取。
王跃明等人[6]将特征束的思想引入到三维人脸特征点定位,通过手工标定训练集的特征点,计算特征点处的Point Signature,构成特征束,以此判定人脸特征点的平均区域。A.B. Moreno等人[]使用平均曲率和高斯曲率对三维人脸进行分割,得到人脸特征点分布的候选区域,然后通过五官分布特征,去掉非标准区域,得到真正的特征区域。GaileG. Gordon[]将三维人脸深度图转换到圆柱坐标系中,在圆柱坐标参数下计算每一点的高斯曲率和平均曲率。Dorai等人[]提出SI(Shape Index)特征,该特征用来表示每一点的凹凸程度,点p的Shape Index是由其最大和最小曲率计算得到。鼻尖的候选点集由SI值在0.85~1之间的点组成,鼻尖点定位于该区域的质心;内眼角的候选点集由SI值在0~0.27之间的点组成,内眼角定位于该区域的质心:
S. Gupta等人[]将人体测量学原理应用于三维人脸的特征提取。通过手工标定25个测量学上常用的特征点,计算这些特征点之间的测地线距离(ISO-Geodesic Distance),选择其中23组距离比例组合成特征向量,最后用线性判别分析(Linear Discriminative Analysis, LDA)对特征进行分类。人体测量学上的基准点和度量富含更多的三维人脸特征。
2.2 Itti视觉注意模型
视觉注意机制是灵长类动物处理视觉信息的本质特征,人类视网膜对图像是非均匀采样的,这是视觉注意机制的生物基础。同时,由于高层视觉处理只是对初始视觉传感器信息的一个子集进行处理,因此需要对初始得到的视觉信息进行选择。
视觉注意的计算模型用显著图(Saliency Map)来表示视觉区域的显著性。显著图不仅通过其像素值表示原图像对应点在视觉区域的显著性大小,而且通过显著性的空间分布来引导注意区域的选择[1]。显著图最初是由Koch和Ullman[]在1985年提出的,其模型利用颜色、方向特征信息构造出一组特征图。Itti显著图模型(IttiSaliency Map)是Laurent Itti等人于1998年提出的[1],该模型框图如图2所示。他采用bottom-up控制策略的注意模型,在Koch和Ullman模型的基础上,提出一个适合自然图像处理的计算模型。该模型主要包括特征提取、显著图生成和注意焦点转移三个模块:首先采用高斯金字塔结构对输入图像进行多尺度表示,去除图像中的冗余信息,得到颜色、亮度和方向的初级视觉特征提取图,然后利用生物的中心-环绕(Center-Surround)计算策略在每种特征图的内部进行竞争,通过在多个空间尺度上提取初级特征,将得到的多种特征、多种尺度的视觉空间的特征显著图通过组合形成一幅最终的显著图来引导注意;最后采用WTA(Winner-Take-All)机制控制注意转移。WTA机制中被检测出来的胜者,即为显著度更高的注意焦点。由于待注意目标在所有参与竞争的目标中总是最显著的,在竞争中总是会获得胜利,所以需要采用抑制返回检测的机制、就近转移的原则和注意区域尺寸的确定来实现焦点的注意和转移。
在Itti等人最初的论文中[1],针对无top-down外部命令的情况下,提出了一个特征图归一化算子,以增强显著峰较少的特征图、削弱存在大量显著峰的特征图。在Itti等人后来的工作中[2][3],比较了多种特征组合策略,发现归一化每一特征图至固定动态范围后再相加将在检测复杂景象中的突出目标时表现出较差的检测性能。于是在归一化的基础上,Itti等人给出了一种新的特征组合策略,通过各特征图内的局部非线性竞争增强现显著峰较少的特征图,而削弱存在大量显著峰的特征图。这种特征内竞争模式与电生理学所观察到的非经典抑制相互作用类似。
3 基于Itti视觉注意模型的三维人脸特征检测
3.1 三维人脸数据表示
本文的研究中采用点云(Point Cloud)来表示三维人脸数据。点云数据是指在一个三维坐标系统中的一组三维元组的集合,这些元组通常以(x, y, z)三维坐标的形式表示,一般主要用来代表一个物体的外表面形状。除(x, y, z)代表集合位置信息以外,点云数据还可以附加一个点的RGB颜色通道信息、灰度值、深度等。
假设p=(x,y,z)∈[?]3表示三维人脸点云数据p中的一个三维的点。由于一个三维的点可以表示成一个三维的向量[p],所以可以将三维人脸点云数据表示为:
3.2 三维人脸数据预处理
一个典型的三维人脸点云数据往往包含十几万个顶点,并且获取的数据往往包含噪声和毛刺,所以需要对这些顶点进行预处理操作。该文采用的预处理操作主要有:
1)向下采样(Downsampleing):首先定义一个三维的体素网格(3D Voxel Grid),将这个网格在点云数据中移动,并计算落在网格内的点的质心,以这个质心来表示落在网格中的所有点;
2)重采样(Resampling):采用MLS(Move Least Square)方法对三维人脸点云数据进行规整化。
3)姿态校正(Pose Correction):原始三维人脸的姿态并不一致,所以需要对获得的三维人脸数据进行姿态校正,使其正面与z轴垂直。
4)面部区域裁剪(Face Segmentation):该文采用P.Bagchi等人[]的方法找到鼻尖位置。在得到鼻尖的位置之后,采用P. Nair等人[]提出的方法进行人脸面部区域的裁剪。
3.3 改进的Itti视觉注意模型
为了让Itti视觉注意模型能够处理三维人脸数据,该文对Itti模型进行了改进。改进后的模型如图3所示。
1)从纹理图像数据[T]获取颜色显著图。三维人脸点云数据p中点i在纹理数据中对应的颜色值:
[rgb(i)=f(ui,vi),i=0,1,2,...,n ] (10)
得到点i的颜色后,用该点的灰度值归一化各个颜色通道,然后建立4个宽调谐(Broadly-tuned)的颜色通道RGBY:
若R、G、B、Y为负值则置为0。然后建立这4个颜色通道的高斯金字塔R([σ])、G([σ])、B([σ])和Y([σ])。
2)从位置数据[P]获取深度图[D]。设三维人脸点云数据p的在XY轴的分辨率为M×N,分布区间分别为[xmin,xmax]和[ymin,ymax],则可以计算得到深度图[D]在XY轴的坐标集:
由于二维深度图[D]中xy坐标值与点云p中xy坐标值并不是一一对应,函数g通过计算点云p中隐式xy坐标(implicit x- and y- coordinates)处的z坐标的插值,得到深度图中的深度值。
3)计算空间法向量[N]。三维人脸点云数据p中点i的法向量计算公式:
其中k是选择的点[pj]的邻域的点数,[p]为邻域内点的质心。
4)计算曲率[C]。本位采用Dorai等人[9]提出最大和最小曲率计算方法,并得到点云数据p中点i的SI(Shape Index)特征。加入曲率特征的显著图是为了增强人脸的器官如鼻子、眼睛、嘴巴等的显著性。
4 实验结果
为了检测改进的Itti视觉注意模型对三维人脸特征区域检测的有效性,实验采用的平台为Intel I5 2500K CPU、8G内存、NvidiaGFX460显卡、Ubuntu13.04(x64)操作系统。 Cosker教授提供的D3DFACS(Dynamic 3D FACS Dataset)[]数据库,该人脸库包含6位女性和4位男性,总共记录了519张不同表情的人脸三维模型。实验首先对数据格式进行.obj到.pcd的格式转换,利用PCL点云库对三维人脸点云数据进行预处理,生成三维人脸点云数据的深度图像、空间法向量以及空间曲率。通过修改Laurent Itti教授开源的神经元计算模型iNVT(iLabNeuromorphic Vision C++ Tookit)[]的源代码,使其能够接收并处理三维数据,生成三维人脸图像的显著图。选择阈值[θ]对特征图进行二值化后,选取面积最大的前4个显著区域,并将其用该区域的最大外接矩形进行表示。
实验分两组进行。第一组将自然状态下的三维人脸作为输入,第二组将有表情变化的三维人脸作为输入。实验结果如图4所示。从实验结果可以看出,该文提出的改进的Itti视觉注意模型能够准确检测出有表情和无表情的三维人脸数据中如眼睛、鼻子和嘴巴的分布区域。
5 结论
传统的视觉注意模型主要针对二维图像数据进行研究,该文将传统的视觉注意模型引入到对三维人脸数据的处理,提出了一种基于Itti视觉注意模型的三维人脸特征检测方法。该方法通过结合原始数据中的纹理信息和三维人脸点云数据中的空间位置信息、空间法向量、深度信息和空间曲率,生成三维人脸图像的显著图。最后利用生成的显著图快速定位三维人脸的特征区域分布,从而进行三维人脸特征的提取。实验结果证明了该方法具有特征区域检测效果好、适用性广的特点。下一步的工作将集中在对已经检测出的特征区域进行分析,并结合二维纹理数据,尽可能精确的提取出特征区域中的特征点。
参考文献:
[1] The iLabNeuromorphic Vision C++ Toolkit: http://ilab.usc.edu/toolkit/
[2] D. Cosker, E. Krumhuber, A. Hilton. A FACS Valid 3D Dynamic Action Unit Database with Applications to 3D Dynamic Morphable Facial Modeling [C]. Proceedings of IEEE International Conference on Computer Vision (ICCV), 2011.
[3] P. Nair, A. Cavallaro. 3-D Face Detection, Landmark Localization, and Registration Using a Point Distribution Model [J]. IEEE Transactions on Multimedia, 2009, 11(4):611-623.
[4] P. Bagchi, D. Bhattacharjee, M. Nasipuri, et al. A Novel Approach for Nose Tip Detection using Smoothing by Weighted Median Filtering Applied to 3D Face Images in Variant Poses [C]. Proceedings of the International Conference on Pattern Recognition, Informatics and Medical Engineering, 2012.
[5] C. Koch, S. Ullman. Shifts in Selective Visual Attention: Towards the Underlying Neural Circuitry [J]. Human Neurobiology, 1985, 4:219-227.
[6] S. Gupta, J.K. Aggarwal, M.K. Markey, et al. 3D Face Recognition Founded on the Structural Diversity of Human Faces [C]. Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition, Minneapolis, 2007:1-7.
[7] C. Darai, A.K. Jain. COSMOS-A representation scheme for 3D free-form objects [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(10):1115-1130.
[8] G.G. Gordon. Face recognition based on depth and curvature features [J]. Proceedings of SPIE Conference on Geometric Method in Computer Vison, 1992:234-247.
[9] A.B. Moreno, A. Sanchez, J.F. Velez, et al. Face Recognition using 3D Local Geometrical Features: PCA vs. SVM [C]. International Symposium on Image and Signal Processing and Analysis, 2005:185-190.
[10] WangYingjie, Chua Chin-Seng, Ho Yeong-Khing. Facial Feature Detection and Face Recognition from 2D and 3D Images [J]. Pattern Recognition Letters, 2002, 23(10):1191-1202.
[11] ISO/IEC 14496-1:1999, Coding of Audio-Visual Objects: System Amendment 1[R]. 1999
[12] V. Navalpakkam, L. Itti. Modeling the Influence of Task on Attention [J]. Vision Research, 2005, 45(2): 205-231.
[13] L. Itti, C.Koch. Computational Modeling of Visual Attention [J]. Nature Neuroscience, 2001, 2:194:203.
论文关键词:表面粗糙度,非接触,光学测量
随着科学技术的进步和社会的发展,人们对于机械产品表面质量的要求越来越高。表面粗糙度是评价工件表面质量的一个重要指标,国内外很多学者在表面粗糙度检测方面做了大量研究工作。目前测量表面粗糙度的主要方法有:接触式测量和非接触式测量。
1 接触式测量
接触式测量就是测量装置的探测部分直接接触被测表面,能够直观地反映被测表面的信息,接触式测量方法主要是触针法,该方法经过几十年的充分发展,以其稳定、可靠的特点被广泛应用。但接触式测量存在很大的缺陷,具体表现在:(1)对高精度表面及软质金属表面有划伤破坏作用;(2)受触针尖端圆弧半径的限制,其测量精度有限;(3)因触针磨损及测量速度的限制,无法实现在线实时测量[1]。
2 非接触式测量
为了克服接触式测量方法的不足非接触,人们对非接触式测量方法进行了广泛研究。研究表明,非接触式测量方法具有非接触、无损伤、快速、测量精度高、易于实现在线测量、响应速度快等优点。目前已有的非接触式测量方法包括各种光学测量方法、超声法、扫描隧道显微镜法、基于计算机视觉技术的表面粗糙度检测方法等。这里我们只对基于光学散射原理的测量方法、基于光学干涉原理的测量方法和基于计算机视觉技术的测量方法做简单介绍论文格式模板。
2.1基于光学散射原理的测量方法
当一束光以一定的角度照射到物体表面后,加工表面的粗糙不平将引起发生散射现象。研究表明:表面粗糙度和散射光强度分布有一定的关系。对于表面粗糙度数值较小的表面,散射光能较弱,反射光能较强;反之,表面粗糙度数值较大的表面,散射光能较强,反射光能较弱。
基于光学散射原理测量表面粗糙度的研究方法和理论较多。四川联合大学和哈尔滨理工大学相继提出了一种称之为散射特征值的参数,表征被测物体表面上反射光和散射光的分散度,散射特征值与被测物体表面的粗糙度有很好的对应关系[2]。哈尔滨理工大学利用已知表面粗糙度参数值的标准样块测得其散射特征值,建立—关系曲线,从而实现利用散射特征值测量火炮内膛表面粗糙度[3]。
基于光学散射原理的表面粗糙度检测方法,具有结构简单、体积小、易于集成产品、动态响应好、适于在线测量等优点。该方法的缺点是测量精度不高,用于超光滑表面粗糙度的测量还有待进一步改进。
2.2基于光学干涉原理的测量方法
当相干光照射到工件表面同一位置时,由于光波的相互位相关系,将产生光波干涉现象。一般的干涉法测量是利用被测面和标准参考面反射的光束进行比较,对干涉条纹做适当变换,通过测量干涉条纹的相对变形来定量检测表面粗糙度。该方法的测量精度取决于光的波长。但是由于干涉条纹的分辨率是以光波波长的一半为极限的,仅从条纹的状态无法判断表面是凸起还是凹陷,因此非接触,作为一种具有较好分辨率、宽测量范围的表面粗糙度在线检测技术,这种干涉法测量技术还有待于进一步发展[4]。
基于光学干涉原理,1984年美国洛克西德导弹公司huang采用共模抑制技术研制成功了光学外差轮廓仪,光外差干涉检测技术是一种具有纳米级测量准确度的高精度光学测量方法,适用于精加工、超精加工表面的测量,而且可以进行动态时间的研究;华中理工大学采用光外差干涉方法研制出2D-SROP-1型表面粗糙度轮廓仪[5]。美国的维易科(VEECO)精密仪器有限公司,采用共光路干涉法研制了WYKO激光干涉仪和光学轮廓仪,可用来测量干涉条纹位相[6]。
基于光学干涉原理测量表面粗糙度分辨率高,适于测量超光滑表面粗糙度,但由于该方法的测量精度受光波波长的影响很大,所以其测量范围受到一定影响。
2.3基于计算机视觉技术的测量方法
基于计算机视觉的粗糙度测量方法是指使用摄像机抓取图像,然后将该图像传送至处理单元,通过数字化处理,根据像素分布和灰度、纹理、形状、颜色等信息,选用合理的算法计算工件的粗糙度参数值。。
北京理工大学的王仲春等人采用显微镜对检测表面进行放大,并通过对CCD采集加工表面微观图像进行处理实现了表面粗糙度的检测[7]论文格式模板。哈尔滨理工大学吴春亚、刘献礼等为解决机械加工表面粗糙度的快速、在线检测,设计了一种表面粗糙度图像检测方法,建立了图像灰度变化信息与表面粗糙度之间的关系模型[8]。英国学者Hossein Ragheb和Edwin R. Hancock通过数码相机拍摄的表面反射图来估计表面粗糙度参数非接触,运用Vernold–Harvey修正的B–K散射理论模型获得了比Oren–Nayar模型更好的粗糙度估计结果[9]。澳大利亚学者Ghassan A. Al-Kindi和Bijan Shirinzadeh对基于显微视觉的不同机械加工表面粗糙度参数获取的可行性进行了评估,讨论了照射光源与表面辐照度模型对检测的影响,结果显示尽管从视觉数据和触针数据所获得的粗糙度参数存在一定差异,但是基于视觉的方法仍是一种可靠的粗糙度参数估计方法[10-11]。
可以看出,基于计算机视觉技术的测量方法主要有统计分析、特征映射和神经网络等黑箱估计法。通过这些方法获得的表面粗糙度参数的估计值受诸多因素的影响,难以给出其准确的物理解释。真正要定量地计算出粗糙度参数,需要科学的计算。
但是随着机械加工自动化水平的提高,基于计算机视觉技术的检测方法处理内容丰富、处理精度高、处理速度快、易于集成等优点将受到越来越多的重视。
3 结束语
接触式测量测量速度较慢,容易划伤工件表面,并且不适用于连续生产材料表面的检测。非接触式测量具有无损伤、快速、测量精度高、易于实现在线测量等优点,已成为表面粗糙度检测的重点研究方向。非接触测量以光学法为主,随着计算机技术和工业生产的迅猛发展,基于计算机视觉技术的表面粗糙度非接触式检测方法受到越来越多的重视。
参考文献:
[1]刘斌,冯其波,匡萃方.表面粗糙度测量方法综述[J]. 光学仪器, 2004, 26(5): 54-55.
[2]苑惠娟等.非接触式表面粗糙度测量仪[J].哈尔滨科学技术大学学报,1995,19(6):30-34.
[3]强熙富,张咏,许文海.扩展激光散射法测量粗糙度的测量范围的研究[J].计量学报,1990,11(2):81-85.
[4]王文卓,李大勇,陈捷.表面粗糙度非接触式测量技术研究概况[J].机械工程师,2004,11:6-9.
[5]王菊香.2D-SROP-1型表面粗糙度轮廓仪[J].工业计量,1994,(4):27-29.
[6]徐德衍等.光学表面粗糙度研究的进展与方向[J].光学仪器,1996,18(1):32-41.
[7]王仲春,高岳,黄粤熙等.显微成像检测表面粗糙度[J]. 光学技术, 1998, 5: 46-48.
[8]吴春亚,刘献礼,王玉景等.机械加工表面粗糙度的图像检测方法[J]. 哈尔滨理工大学学报, 2007, 12(3): 148-151.
[9]Hossein Ragheb, Edwin R.Hancock. The modified Beckmann–Kirchhoff scattering theory for rough surfaceanalysis[J]. Pattern Recognition, 2007, 40: 2004-2020.
[10]Ghassan A. Al-Kindi, BijanShirinzadeh. An evaluation of surface roughness parameters measurement usingvision-based data[J]. International Journal of Machine Tools & Manufacture,2007, 47: 697-708.
[11]Ghassan A. Al-Kindi, BijanShirinzadeh. Feasibility assessment of vision-based surface roughnessparameters acquisition for different types of machined specimens[J]. Image andVision Computing, 2008, 6: 1-15.