logo资料库

Directshow++开发笔记.pdf

第1页 / 共216页
第2页 / 共216页
第3页 / 共216页
第4页 / 共216页
第5页 / 共216页
第6页 / 共216页
第7页 / 共216页
第8页 / 共216页
资料共216页,剩余部分请下载后查看
1 About Directshow基础
1.1 设置dshow的开发环境
1.2 先演示一下dshow使用的一个例子
1.3 Direcshow概述
1.4 Filter Graph及其组成
1.5构建一个Filter Graph图
1.6数据流在Filter Graph里的流动(Data Flow)
1.7事件通知机制(Event Notification)
1.8Directshow中的时钟(Time and Clocks in Dshow)
1.9动态删除或增加Filter(Dynamic Graph Building)
1.10 Plug-in Distributors
2 Directshow的应用(Using Directshow)
2.1在GraphEdit中模拟构建Graph(Simulating Graph Building)
2.2Directshow基本应用(Basic Tasks)
2.2.1视频提交(Video Rendering)
2.2.2 如何处理事件通知(Event Notification)
2.2.3如何枚举系统的设备和过虑器
2.2.4如何枚举Graph图中的对象(filter,pin)
2.2.5构建Graph图常用技术
2.2.5.1如何根据CLSID向graph中添加filter
2.2.5.2如何查找filter空闲的pin。
2.2.5.3如何连接两个Filter
2.2.5.4如何获得filter或者pin的接口指针
2.2.5.5如何查找和某个filter的上下相连的filter
2.2.5.6如何删除graph中的所有filter
2.2.5.7如何利用Capture Graph Builder构建Graph图表
2.2.6 Seeking Filter graph
2.2.7 如何设置Graph时钟(Setting Graph Clock)
2.2.8在Dshow中如何调试
2.3音频的捕捉
2.4视频的捕捉(Video Capture)
2.4.1关于视频捕捉(About Video Capture in Dshow)
2.4.2选择一个视频捕捉设备(Select capture device)
2.4.3预览视频(Previewing Video)
2.4.4如何捕捉视频流并保存到文件(Capture video to File)
2.4.5如何控制Capture Graph(Controlling Capture Graph)
2.4.6视频捕捉的任务(Video Capture Tasks)
2.4.6.1如何配置一个视频捕捉设备
2.4.6.2Working With Crossbars
2.4.6.3将设备从系统中移走时的事件通知(Device remove Notify)
2.4.6.4从静止图像pin中捕捉图片
2.4.7数字视频DV(Digital Video in Direcshow)
2.4.7.1关于Directshow中的DV应用
2.4.7.2如何将DV捕捉到一个文件中
2.4.7.3如何将文件中的DV读入到盘中
2.4.7.4 DVINFO Field Settings in the MSDV Driver
2.4.8如何控制DV 便携式摄像机(Controlling a DV Camcorder)
2.4.9模拟电视的视频捕捉(Analog Television)
2.4.10视频捕捉的高级话题
2.4.10.1处理视频重画事件
2.4.10.2如何确定pin的种类(Pin Categories)
2.4.10.3如何使用一个SmartTee Filer
2.4.10.4如何使用一个重叠混合器(Overlay Mixer in Video Capture)
2.4.10.5Video Port Pins
2.4.10.6VideoInfo2 Format Type
2.4.10.7手动添加WDM类驱动filter
2.4.10.8如何创建内核filter
2.5Directshow Editing Services
2.6DVD应用(DVD Application)
2.7 MPEP_2支持
2.8Windows Media应用
2.9 TV应用
2.10使用视频混合Render
2.11 Using the Stream Buffer Engine
2.12开发自己的Filter
1 如何开发自己的filter
2filter的连接
3filter间的数据流动
4pin连接时数据格式的动态改变
4 Threads and Critical Sections
5质量控制管理
6dshow和com
7如何写Transform Filter
8如何写视频播放过滤器Video Renderer Filter
9如何写捕捉filter(源)
10创建filter 属性页
11 capture and compression formats
12Graph如何定位filter的位置并加载
2.13 Encoder and Decoder开发
3Directshow的基类学习
3.1 Dshow的基类简介
3.2 Filter和pin的基类
3.2.1CBaseFilter
3.2.2CBasePin
3.2.3CBaseInputPin
3.2.4CBaseOutputPin
3.3几种常用Filter的基类
3.3.1CSource
3.3.2CSourceStream
3.3.3CTransformFilter
3.3.4CTransformInputPin
3.3.5CTransformOutputPin
3.3.6CTransInPlaceFilter
3.3.7 CTransInPlaceInputPin
3.3.8CTransInPlaceOutputPin
3.3.4CVideoTransformFilter
3.3.9CBaseRenderer
3.3.10CRendererInputPin
3.3.11CBaseVideoRenderer
3.3.12 CBaseAllocator
3.3.13 CMediaSample
3.4Filter和pin经常用到的类
3.4.1CPullPin
3.4.2COutputQueue
3.4.3CSourceSeeking
3.4.4CEnumPins
3.4.5CEnumMediaTypes
3.4.6CMemAllocator
3.4.7CMediaSample
3.4.8CBaseReferenceClock
3.4.9CMediaType
3.5几个比较重要的类
4Direcshow提供的接口学习
5DirectShow Tutorials
5.1Implementing a Seek Bar
5.2Displaying a Filter's Property Pages
5.3Grabbing a Poster Frame
5.4Using the Sample Grabber
5.5Recompressing an AVI File
6C++在电视开发中的应用
6.1TV Ratings Reference
6.2Video Control C++ Reference
6.3Microsoft Unified Tuning Model C++ Reference
6.4Transport Information Interfaces
6.5BDA Filter Interfaces
6.6MPEG-2 Sections and Tables Filter Reference
7Direcshow提供的Filter
智慧的鱼--------DirctShow SDK 学习笔记 Directshow 开发笔记(翻译) 个人感觉开发自己的 Filter 还是要对 dshow 的基类要熟悉一些。所以才想起了要翻译这 些东西,希望在 9 月底前完成这些东西。我不想它的句子有多么流畅,语法的错误有多少, 我只希望能看明白就可以了 智慧的鱼(LeeQiang) 2004.8.20 由于某些原因,SDK 中的有些章节我没有翻译,如果哪位兄弟补充以后,可以将补充后的文 档发给我,我也学习学习,互相学习的过程就是提高的过程。 1
智慧的鱼--------DirctShow SDK 学习笔记 1 About Directshow 基础 1.1 设置 dshow 的开发环境 如果你用 VC 开发环境,一定要在 Setting 里设置下面的东西 包含头文件 Dshow.h 所有的 dshow 应用必须包含 包含动态库 Strmiids.lib 导出所有接口的 CLSID 和接口 IID 定义。必须包含 Quartz.lib 1
智慧的鱼--------DirctShow SDK 学习笔记 1.2 先演示一下 dshow 使用的一个例子 这里暂略。 1.3 Direcshow 概述 DirectShow 是微软公司提供的一套在 Windows 平台上进行流媒体处理的开发包,与 DirectX 开发包一起发布。 那么,DirectShow 能够做些什么呢?且看,DirectShow 为多媒体流的捕捉和回放提供了强有 力的支持。运用 DirectShow,我们可以很方便地从支持 WDM 驱动模型的采集卡上捕获数据, 并且进行相应的后期处理乃至存储到文件中。它广泛地支持各种媒体格式,包括 Asf、Mpeg、 Avi、Dv、Mp3、Wave 等等,使得多媒体数据的回放变得轻而易举。另外,DirectShow 还集 成了 DirectX 其它部分(比如 DirectDraw、DirectSound)的技术,直接支持 DVD 的播放,视 频的非线性编辑,以及与数字摄像机的数据交换。更值得一提的是,DirectShow 提供的是一 种开放式的开发环境,我们可以根据自己的需要定制自己的组件。 DirectShow 的系统组成 应用程序与 DirectShow 组件以及 DirectShow 所支持的软硬件之间的关系如图 1 所示。 图 1 DirectShow 系统框图 1.4 Filter Graph 及其组成 这篇文档中我想给讲述 Directshow 的主要组成部分,一个概括性的入门文章,对于应用开发 或者 directshow 的开发者都有所帮助。 1 DirectShow 的 Filter Directshow 是基于模块化,每个功能模块都采取 COM 组件方式,称为 Filter。Directshow 1
智慧的鱼--------DirctShow SDK 学习笔记 提供了一系列的标准的模块可用于应用开发,开发者也可以开发自己的功能 Filter 来扩展 Directshow 的应用。下面我们用一个例子来说明如何采取 Filter 来播放一个 AVI 的视频文件。 从一个文件读取数据,形成字节流。(这个工作由源 Filter 完成) 检查 AVI 数据流的头格式,然后通过 AVI 分割 Filter 将视频流和音频流分开。 解码视频流,根据压缩格式的不同,选取不同的 decoder filters 。 重画视频图像,通过 Renderer Filter。 将音频流送到声卡进行播放,一般采用缺省的 DirectSound Device Filter。流程见下图。 从上面的图表看,每一个 filter 都一个其他的一个或者两个 filter 相连接,连接点也是 com 对 象,我们称为 Pin。Filter 通过 pin 将数据从一个 filter 传递到另一个 filter 中,从而可以使数据 的 filter 的链表中流动。图中的箭头表示 filter 链表中的数据流的方向。在 Directshow 中,一 个 filter 链表我们称为 filter Graph。 Filter具有三个状态,运行,停止,暂停。当一个filter运行时,它就处理媒体数据流,当停 止时,filter就不在处理数据,暂停状态常用来给运行状态之前cure data。Data Flow in the Filter Graph一章详细描述了这些概念,可以参考。 除非特别的例外,所有 Filter graph 中的 filter 的状态的改变都是统一的,也就说,filte graph 中的所有的 filter 的状态改变是一致协调的。也就是说,我们也可以用 filter graph 也可以有运 行,停止,暂停三种状态。 Filter 一般分为下面几种类型。 (1)源过滤器(source filter):源过滤器引入数据到过滤器图表中,数据来源可以是文 件、网络、照相机等。不同的源过滤器处理不同类型的数据源。 (2)变换过滤器(transform filter):变换过滤器的工作是获取输入流,处理数据,并生 成输出流。变换过滤器对数据的处理包括编解码、格式转换、压缩解压缩等。 (3)提交过滤器(renderer filter):提交过滤器在过滤器图表里处于最后一级,它们接 收数据并把数据提交给外设。 (4)分割过滤器(splitter filter):分割过滤器把输入流分割成多个输出。例如,AVI 分 割过滤器把一个 AVI 格式的字节流分割成视频流和音频流。 (5)混合过滤器(mux filter):混合过滤器把多个输入组合成一个单独的数据流。例如, AVI 混合过滤器把视频流和音频流合成一个 AVI 格式的字节流。 过滤器的这些分类并不是绝对的,例如一个 ASF 读过滤器(ASF Reader filter)既是 一个源过滤器又是一个分割过滤器。 2 关于 Filter Graph Manager Filter Graph Manager也是一个com对象,用来控制Filter graph中的所有的filter,主要有以下的 功能: 1 用来协调 filter 之间的状态改变,从而使 graph 中的所有的 filter 的状态的改变应该一致。 2 建立一个参考时钟。 3 将 filter 的消息返回给应用程序 4 提供方法用来建立 filter graph。 1
智慧的鱼--------DirctShow SDK 学习笔记 这里只是简单的描述一下,详细地可以参考文档。 状态改变,Graph 中的 filter 的状态改变应该一致,因此,应用程序并将状态改变的命令直接 发给 filter,而是将相应的状态改变的命令发送给 Filter graph Manager,由 manager 将命令分 发给 graph 中每一个 filter。Seeking 也是同样的方式工作,首先由应用程序将 seek 命令发送到 filter graph 管理器,然后由其分发给每个 filter。 参考时钟,graph 中的 filter 都采用的同一个时钟,称为参考时钟(reference clock),参考时钟 可 以 确 保 所 有 的 数 据 流 同 步 , 视 频 桢 或 者 音 频 桢 应 该 被 提 交 的 时 间 称 为 presentation time.presentation time 是相对于参考时钟来确定的。Filter graph Manager 应该选择一个参考时 钟,可以选择声卡上的时钟,也可以选择系统时钟 Graph 事件, Graph 管理器采用事件机制将 graph 中发生的事件通知给应用程序,这个机制 类似于 windows 的消息循环机制。 Graph 构建的方法,graph 管理器给应用程序提供了将 filter 添加进 graph 的方法,连接 filter 的方法,断开 filter 连接的方法。 但是,graph 管理器没有提供如何将数据从一个 filter 发送到另一个 filter 的方法,这个工作 是由 filter 在内部通过 pin 来独立完成的, 3 媒体类型 因为 Directshow 是基于 com 组件的,就需要有一种方式来描述 filter graph 每一个点的数据 格式,例如,我们还以播放 AVI 文件为例,数据以 RIFF 块的形式进入 graph 中,然后被分割 成视频和音频流,视频流有一系列的压缩的视频桢组成,解压后,视频流由一系列的无压缩 的位图组成,音频流也要走同样的步骤。 Media Types: How DirectShow Represents Formats 媒体类型是一种很普遍的,可以扩展的用来描述数字媒体格式的方法,当两个 filter 连接的 时候,他们会就采用某一种媒体类型达成一致的协议。媒体类型定义了处于源头的 filter 将要 给下游的 filter 发送什么样的数据,以及数据的 physical layout。如果两个 filter 不能够支持同 一种的媒体类型,那么他们就没法连接起来。 对于大多数的应用来说,也许你不用考虑媒体类型,但是,有些应用程序中,你会直接应 用到媒体类型的。 媒体类型是通过 AM_MEDIA_TYPE结构定义的,看看原始定义吧 typedef struct _MediaType { GUID majortype; GUID subtype; BOOL bFixedSizeSamples; BOOL bTemporalCompression; ULONG lSampleSize; GUID formattype; IUnknown *pUnk; ULONG cbFormat; [size_is(cbFormat)] BYTE *pbFormat; } AM_MEDIA_TYPE; Major type:是一个 GUID,用来定义数据的主类型,包括,音频,视频,unparsed 字节流,MIDI 数据,等等,具体可以参考 msdn。 Subtype:子类型,也是一个 GUID,用来进一步的细化数据格式,例如,在视频主类型中,还 包括 RGB-24, RGB-32, UYVY 等等一些子类型,在音频主类型中还包括 PCM audio, MPEG-1 payload 等类型,子类型提供了比主类型更详细的信息,但是并没有定义所有的格式,例如, 1
智慧的鱼--------DirctShow SDK 学习笔记 视频的子类型并没有定义图像大小,桢率。这些由下面的字段定义。 bFixedSizeSamples 当这个值为 TRUE 时,表示 sample 大小固定。 bTemporalCompression 当这个值为 TRUE 时,表示 sample 采用了临时压缩格式,表明不是 所有的桢都是关键桢,如果为 FALSE,表明所有的都是关键桢。 lSampleSize 表示 sample 的大小。对于压缩的数据,这个值可能为零。 Formattype 一 个 GUID 值 , 用 来 表 明 内 存 块 的 格 式 。 包 括 如 下 : FORMAT_None , FORMAT_DvInfo,FORMAT_MPEGVideo,FORMAT_MPEG2Video,FORMAT_VideoInfo, FORMAT_VideoInfo2,FORMAT_WaveFormatEx,GUID_NULL pUnk 该参数没有用到 cbFormat 内存块的大小 pbFormat 指向内存块的指针, 下面我们看一段代码,看看 filter 如何检测媒体类型的。 HRESULT CheckMediaType(AM_MEDIA_TYPE *pmt) { if (pmt == NULL) return E_POINTER; // Check the major type. We're looking for video. if (pmt->majortype != MEDIATYPE_Video) { return VFW_E_INVALIDMEDIATYPE; } // Check the subtype. We're looking for 24-bit RGB. if (pmt->subtype != MEDIASUBTYPE_RGB24) { return VFW_E_INVALIDMEDIATYPE; } // Check the format type and the size of the format block. if ((pmt->formattype == FORMAT_VideoInfo) && (pmt->cbFormat >= sizeof(VIDEOINFOHEADER) && (pmt->pbFormat != NULL)) { // Now it's safe to coerce the format block pointer to the // correct structure, as defined by the formattype GUID. VIDEOINFOHEADER *pVIH = (VIDEOINFOHEADER*)pmt->pbFormat; // Examine pVIH (not shown). If it looks OK, return S_OK. return S_OK; } return VFW_E_INVALIDMEDIATYPE; } 下面简单介绍几个和 Media Type 相关的函数 AM_MEDIA_TYPE 结构包含一个指向数据块的指针,因此,当你使用这个结构的时候,一定 要小心内存分配,以防内存泄漏。 1
智慧的鱼--------DirctShow SDK 学习笔记 分配函数 1 AM_MEDIA_TYPE * WINAPI CreateMediaType( AM_MEDIA_TYPE const *pSrc ); 这个函数分配一个新的AM_MEDIA_TYPE结构,包含特定格式的数据块。释放由这个函数分 配的内存,可以调用 DeleteMediaType. 函数 2 STDAPI CreateAudioMediaType( const WAVEFORMATEX *pwfx, AM_MEDIA_TYPE *pmt, BOOL bSetFormat); 该函数利用一个给定的 WAVEFORMATIEX 结构来初始化媒体类型,如果 bsetFormat 参数为 TRUE,该函数就分配一块新的内存,如果原来的 pmt 已经包含内存,就有可能发生内存泄漏。 为了避免内存泄漏,在调用这个函数前要调用 FreeMediaType(),在这个函数返回之后,再 次调用 FreeMediaType(),释放 format block。 3HRESULT WINAPI CopyMediaType( AM_MEDIA_TYPE *pmtTarget, const AM_MEDIA_TYPE *pmtSource); 这个函数复制了一个结构到另一个结构中去。这个函数也要重新分配内存给目的结构,如果 pmtTarget, 已 经 包 含 一 个 内 存 块 , 就 要 内 存 泄 漏 , 因 此 , 在 调 用 该 函 数 前 后 都 要 调 用 FreeMediaType 函数。 释放函数 4 void WINAPI DeleteMediaType( AM_MEDIA_TYPE *pmt); 无论是采用 CoTaskMemAlloc 函数还是用 CreateMediaType 函数分配的内存都可以用这个函数 来释放,如果你没有连接基类的动态库,你可以用下面的代码 void MyDeleteMediaType(AM_MEDIA_TYPE *pmt) { if (pmt != NULL) { MyFreeMediaType(*pmt); // 见下面的 FreeMediaType 函数 CoTaskMemFree(pmt); } } 5 void WINAPI FreeMediaType( AM_MEDIA_TYPE& mt); 这 个 函 数 用 来 释 放 数 据 块 的 内 存 , 如 果 要 删 除 AM_MEDIA_TYPE 结 构 , 可 以 使 用 DeleteMediaType 函数。 void MyFreeMediaType(AM_MEDIA_TYPE& mt) { if (mt.cbFormat != 0) { CoTaskMemFree((PVOID)mt.pbFormat); mt.cbFormat = 0; mt.pbFormat = NULL; } if (mt.pUnk != NULL) { 1
智慧的鱼--------DirctShow SDK 学习笔记 // Unecessary because pUnk should not be used, but safest. mt.pUnk->Release(); mt.pUnk = NULL; } } 4 媒体 Samples 和 Allocators Filters通过pin的连接来传递数据,数据流是从一个filter的输出pin流向相连的filter的输入pin。 输出pin常用的传递数据的方式是调用输入pin上的 IMemInputPin::Receive方法。 对于filter来说,可以有好几种方式来分配媒体数据使用的内存块,可以在堆上分配,可以 在DirectDraw的表面,也可以采用GDI共享内存,还有其他的一些方法,在Directshow中用来 进 行 内 存 分 配 任 务 的 是 内 存 分 配 器 ( allocator ), 也 是 一 个 COM 对 象 , 暴 露 了 一 个 IMemAllocator接口。 当两个 pin 连接的时候,必须有一个 pin 提供一个 allocator,Directshow 定义了一系列函数 调用用来确定由哪个 pin 提供 allocator,以及 buffer 的数量和大小。 在数据流开始之前,allocator会创建一个内存池(pool of buffer),在开始发送数据流以后, 源filter就会将数据填充到内存池中一个空闲的buffer中,然后传递给下面的filter。但是,源filter 并不是直接将内存buffer的指针直接传递给下游的filter,而是通过一个media samples的COM对 象,这个sample是allocator创建的用来管理内存buffer。Media sample暴露了 IMediaSample接 口,一个sample包含了下面的内容: 一个指向没有发送的内存的指针。 一个时间戳 一些标志 媒体类型。 时间戳表明了 presentation time,Renderer filter 就是根据这个时间来安排 render 顺序的。标志 是用来标示数据是否中断等等,媒体类型提供了中途改变数据格式的一种方法,不过,一般 sample 没有媒体类型,表明它们的媒体类型一直没有改变。 当一个 filter 正在使用 buffer,它就会保持一个 sample 的引用计数,allocator 通过 sample 的 引用计数用来确定是否可以重新使用一个 buffer。这样就防止了 buffer 的使用冲突,当所有的 filter 都释放了对 sample 的引用,sample 才返回到 allocator 的内存池,供重新使用。 5 硬件设备在 graph 中的作用 下面的这段话借用的是陆其明的一段文档,特此标记 2005-1-26 我觉得他对硬件的表述比较 清楚。 大家知道,为了提高系统的稳定性,Windows 操作系统对硬件操作进行了隔离;应用程序一 般不能直接访问硬件。DirectShow Filter 工作在用户模式(User mode,操作系统特权级别为 Ring 3),而硬件工作在内核模式(Kernel mode,操作系统特权级别为 Ring 0),那么它们之 间怎么协同工作呢? DirectShow 解决的方法是,为这些硬件设计包装 Filter;这种 Filter 能够工作在用户模式下, 外观、控制方法跟普通 Filter 一样,而包装 Filter 内部完成与硬件驱动程序的交互。这样的 设计,使得编写 DirectShow 应用程序的开发人员,从为支持硬件而需做出的特殊处理中解脱 出来。DirectShow 已经集成的包装 Filter,包括 Audio Capture Filter(qcap.dll)、VfW Capture Filter(qcap.dll,Filter 的 Class Id 为 CLSID_VfwCapture)、TV Tuner Filter(KSTVTune.ax, Filter 的 Class Id 为 CLSID_CTVTunerFilter)、Analog Video Crossbar Filter(ksxbar.ax)、TV Audio 1
分享到:
收藏