打印本文 打印本文  关闭窗口 关闭窗口  
视频图象压缩编码研究毕业设计(论文)
投稿人:liu溪溪  文章来源:本站原创  点击数  更新时间:2013-11-11 6:41:29  

摘要:多媒体文件数据量很大,如果不对其进行压缩,会给计算机的存储和传送带来很大困难,从而影响多媒体文件的使用和流通。在视频监视系统中,采用有效的压缩方法可以提高监控的实时性和有效性。本文讨论了当前视频编码关键技术的研究进展,并对以往的视频压缩方法进行了回顾和总结,在此基础上设计了一个视频图像压缩系统。该系统采用DirectShow技术实现对实时视频流的捕获和预览,而且能够自动保存为BMP图像;再利用JPEG编码标准对所捕获单帧图像进行批量压缩,得到高质量、高压缩比的视频图像,并实现视频流的存储和回放;最后用树形结构实现视频的再次合成。本设计采用的方法有效提高了视频图像的采集速度和质量,在安防系统、视频会议等领域有广阔的应用前景。

关键词:视频图像;DirectShow;视频捕获;视频合成

 

目    录
第1章  绪论 1
1.1  选题的背景和意义 1
1.2  视频图像压缩技术及其发展现状 1
1.3  视频压缩编码的应用 3
1.4  本文研究内容 4
第2章  系统总体描述 5
2.1  系统方案设计 5
2.1.1  系统的输入设计 6
2.1.2  系统的输出设计 7
2.1.3  系统功能结构 7
2.2  系统工作流程 8
2.3  界面设计 9
2.4  非功能性需求 10
2.5  术语表 11
2.6  系统约束 11
第3章  各部分模块的设计 12
3.1  实时视频流的获取 12
3.1.1  DirectShow概述 12
3.1.2  DirectShow工作的架构体系 12
3.2  单帧图像批量压缩算法的实现 17
3.2.1  JPEG算法概要 18
3.2.2  JPEG算法的主要步骤 18
3.3  视频合成 24
第4章  实验结果与讨论 27
4.1  测试过程 27
4.2  测试结果 32
总结 33
致谢 35
参考文献 36
附录1(视频捕获) 37
附录2(视频单帧捕获) 38
附录3(批量压缩单帧图像) 38
附录4(视频合成) 46
 
第1章  绪  论
1.1  选题的背景和意义
    人类传递信息的主要媒介是语音和图像。据统计,在人类接受的信息中,听觉信息占20%,视觉信息占60%,其他如味觉、触觉、嗅觉总的加起来不过占20%。所以,作为传递信息的重要媒体和手段的图像信息是十分重要的。由于视频信号含有极其丰富、直观的大量信息,又最符合人们的观习惯,因此,许多行业都利用视频信号进行监控,它不仅具有监测灵敏度高,而且便于记录和观察现场信息等优点。现已广泛应用于视频会议系统、机器视觉、工业生产线检测、人工智能等领域。
图像压缩编码是指用尽可能少的数据表示信源发出的图像信号,以减少容纳给定消息集合的信号空间,信号空间通常有三方面的含义[1]:
1.物理空间,指内存、磁盘、磁带等数据存储介质;
2.时间空间,指传输给定消息集合所需的时间;
3.电磁频谱空间,指传输给定消息所需的频带等。
那么图像压缩的目的,就是减少数据占用的存储空间、传输时间和频率带宽。
视频处理技术是伴随着视频从模拟到数字化转变的过程中得到蓬勃发展的。随着人们对视频图像的清晰度、流畅度、实时度的要求越来越苛刻,使其成为了一项炙手可热的技术。同时由于当前周边行业比如Internet、显示设备等产业的兴盛,也推动了视频处理技术的发展。视频处理技术可以细化为视频压缩解压缩技术、数字视频广播技术等分支学科,应用于通信、家庭等各个行业。其中视频压缩技术尤其被专业人士看好。为了有效防止信号在传输和存储过程引入噪声和导致波形畸变,获得更好的品质,模拟信号一般都先进行采样和数字化,然后再进行存储、传输和接受重建。但这些数字化信号的数据量极大,尽管海量存储技术、处理器的速度以及数字通信系统的性能的迅猛发展,但对数据存储的能力和数据传输带宽的需求仍然超出了现有技术的能力所及。为了使通信成为可能并尽可能地降低通信费用,信号的压缩是必需的。
1.2  视频图像压缩技术及其发展现状
压缩算法是针对多媒体数据中存在的各种冗余而设计的, 即采用一定的编码方式, 消除其中的冗余信息, 实现不失真压缩, 或以人的视觉和听觉的生理特性为基础, 在容许失真限度内的有失真压缩以得到更高的压缩比。
而压缩技术分为两类:有损压缩和无损压缩。无损压缩保证在数据压缩和还原过程中,多媒体信息没有任何的损耗或失真,其压缩效率通常较低。有损压缩则采用一些高效的有限失真数据压缩算法,大幅度减少多媒体中的冗余信息,其压缩效率远高于无损压缩。通常情况下,数据压缩率越高,信息的损耗或失真也越大,需要找出一个相对平衡点。
    有损压缩应用于一般图像,如风景、人物照片、部分医疗图像等,如大家接触的JPEG图像格式一般都是有损压缩。有损压缩的压缩比很高,能达到10:1、20:1,甚至到40:1,主要原因就在于原始图像的像素值可以用一些近似值代替,因为人眼对这些差距并不十分敏感,这也体现了一种对图像数据的精确性,存储空间和带宽占用的折中处理。
无损压缩应用于认证签名图像处理和档案图像领域,医疗图像也逐步采用无损压缩方法,但无损图像的压缩比并不是很高,一般只有2:1到4:1。
未来多媒体数据压缩技术的发展趋势将是基于内容的压缩。但是一涉及到基于内容的目标,就会遇到很多的困难。最恰当的方法是从很小的一个领域做起。其次,我们还需要积极地参与到国际标准的制定过程中去,做大量的工作。新的标准和算法一出台,就需要配合大量的工具,其中包括预处理方面的工具,以及各种各样的编辑工具等等。在这方面,大家都是处于同一条起跑线上。如果谁提前开发出来并将之商用化,谁就可能抓住了市场先机[2]。视频压缩正在市场中催生数量日益增长的数字视频产品。另外,图像压缩技术、视频技术与网络技术相结合的应用前景十分可观。


以下内容请付费后查看或者联系客服人员。。。

 

致  谢
大学四年的学习生活即将结束,在本文撰写行将完成之际,首先请让我对给予我悉心指导和帮助的老师表示最衷心的感谢和最诚挚的敬意!她循循善诱的教导和不拘一格的思路给予我无尽的启迪。在学习上,她对我严格要求,同时又不遗余力教导我,使我真正学习到了知识,尤其是解决实际问题的能力得到了很大提高。同时李老师渊博的知识、敏锐的学术眼光、严谨的治学态度又使我由衷的敬佩。
我要感谢学姐在百忙之中抽出宝贵时间来帮我修改这篇论文,还要感谢6A313实验室的成员给我的关爱及建议。
    当然在学习期间及撰写论文的时候同时也得到了很多同学及其他老师的热情帮助和关心,在此我向所有帮助过我的人致以衷心的感谢!

打印本文 打印本文  关闭窗口 关闭窗口