视频流媒体技术展望 - 视频流媒体 - 兰健

(这条文章已经被阅读了 126 次) 时间:2001-05-22 11:14:53 来源:兰健 (河马兰兰) 转载

视频流媒体技术展望

随着现代网络技术的发展,作为第四媒体的网络开始带给人们的是更多形式的信息模式。从在网络上出现第一张图片,到现在各种形式的网络视频,三维动画,人们的视听觉感官在网络上得到了很大的满足。而同时面临的是另外一种不可避免的尴尬:正是由于人们需求的不断提高,上网人数的不断增加,加之网络硬件设备的局限性,使得文件的大小成为网络传输一个不可忽视的参数。一方面,人们希望能在网络上看到生动清晰的媒体演示,另一方面人们又不得不去面对如此慢的网络速度下文件传输所需的大量时间。为了解决这种矛盾,一种新的媒体技术应运而生,这就是“流媒体技术”。

不知道大家是从什么时候开始认识这样的技术,在我的印象里面,FLASH技术是最先带给我“流(STREAM)”这个概念的。包括后来的ShockwaveforAuthorware、ShockwaveforDirector等等。而最新的网络三维图象标准,同样采用的是流式的传播技术,例子就是最近被炒的很热,而且效果的确很好的Viewpoiint (Metastream)和Cult3D技术。当然象QTVR里面也用了流传输的概念,我们在这里就不多提了。

上面或许只能算些题外话,我今天演讲的主要内容,或者说演讲的真正标题应该是“网络视频流技术展望”主要介绍的是把流媒体技术用于网络视频传输应用的系统,主要是Real System 和 Media Service .当然还有QuickTime。至于象CISCO IP/TV一类系统,由于使用范围不大,加之时间和场合所限,在此不做详细研究探讨。

无论是哪一种系统,他们的基本原理都是一样的:首先通过采用高效的压缩算法,在降低文件大小的同时伴随质量的损失,让原有的庞大的多媒体数据适合流式传输。然后通过架设流媒体服务器,修改MIME标识。通过各种实时协议传输流数据。

实时流传输协议包括:
实时传输协议RTP。RTP(Real-timeTransportProtocol)

实时传输控制协议RTCP。RTCP(Real-timeTransportControlProtocol)

实时流协议RTSP。实时流协议RTSP(RealTimeStreamingProtocol)

RSVP协议。RSVP(ResourceReserveProtocol)

MMS 协议:Microsoft Media Server protocol (MMS protocol)

下面我们采用对比的方式来对这几种系统做一些更详细的介绍:
1.概述:

—-Microsoft公司的WindowsMedia的核心是ASF(AdvancedStreamFormat)。ASF是一种数据格式,音频、视频、图像以及控制命令脚本等多媒体信息通过这种格式,以网络数据包的形式传输,实现流式多媒体内容发布。

—-RealNetworks公司的RealMedia包括RealAudio、RealVideo和RealFlash三类文件。。RealNetworks公司自1995年发布RealAudio1.0以来,RealAudio和RealVideo产品已经成为Internet网上最受欢迎的解决方案。

—-Apple公司的QuickTime于1991年登台亮相,是Apple公司面向专业视频编辑、Web网站创建和CD-ROM内容制作领域开发的多媒体技术平台,QuickTime支持几乎所有主流的个人计算平台,是数字媒体领域事实上的工业标准,是创建3D动画、实时效果、虚拟现实、A/V和其他数字流媒体的重要基础。

2.压缩方式:

WM8:当然是最新版本了,采用MPEG-4压缩编码,我们也看到了他正式版的效果要比BETA版本好很多。无论是在WMV还是WMA的压缩方法上,就原来的V7都有很大的进步。支持True-VBR(真正动态变量速率编码,该技术能保证下载过程中影像的品质)和Two-Pass编码技术。

REAL:采用的是REAL专用算法,最近又增加了RA8的压缩算法。通过SVT(ScalableVideoTechnology)技术可以让速度较慢的电脑不需要解开所有的原始图像数据也能流畅观看节目;双向编码(Two�Encoding)技术类似于VBR根据带宽的限制选择最优化压缩码率。为了更好地适应在网上传播,它还可以根据你所采用Modem的速率来选择最佳压缩比率的Real文件,这就是所谓的SureStream技术。我们不能否认的是,在网络带宽自适应方面,REAL比WM要做的好很多!

QT:我们可以看到在QT输出文件时候可以选择包括H.263在内的多种编码。但主要以SorensonVideo为主,据说由5.0开始已经采用了MPEG-4压缩技术。QuickTime中的声音Codec为QualcomPureVolM,从QuickTime4.1版本中开始支持VBR。QuickTime的音乐Codec为QDesiglMusic2。

3.服务器和客户端:

Windows Media:
服务器:WINDOWS SERVER的附带组件,无客户连接数限制。

客户端:MICROSOFT的免费播放器WINDOWS MEDIA PLAYER,我们可以在最新的WINDOWS XP里面看到它的最新版本8。

Real System:

服务器:REAL SERVER ,提供免费下载,最新分了很多版本:比如PLUS,PRO版本等,其实内部结构基本相同,只是提供的LICENSE的权限有所不同。访问有用户连接数限制,通过LICENSE文件实现,同时,该文件也具备了各种功能的管理功能。同一个SERVER通过倒入不同的LICENCE,可以实现不同的功能权限。

客户端:REAL公司播放器REAL PLAYER,有不同版本,基础的BASIC为免费下载,专业的PLUS版本需要付费。PLUS版本提供更多图象画面控制,这点在MEDIA PLAYER里面是没有的。最新版本是:6.0.9.584

Quick Time:
服务器:QUICK TIME STREAMING SERVER 是MAC平台下的服务器,有用户连接限制,固定数目,单个SERVER允许最大连接4000个。在PC平台下有基于Perl的DARWIN STREAMING SERVER(PR3)。同时REAL SERVER 8也支持以RTSP方式调用MOV文件。

客户端:APPLE公司播放器QUICK TIME。同样有版本功能区别,专业版本需要付费获取,专业版本增加了对MOV文件的简单编辑功能。

4.编辑工具以及拓展功能:

Windows Media:
“Windows Media 编码器”转换实时和存储的视频和音频内容为 ASF 流,然后即通过 Windows Media 服务器在网络中传送。原来的版本是集成到一个叫NetTools的文件里面的。后来的版本于是就把它独立出来了。

“Windows Media Author”是 Microsoft 与 Digital Renaissance, Incorporated 合作开发的一种工具。此工具用以装配、同步和压缩视频和图象文件为单一的 .asf 文件。Windows Media Author 创建的内容称为“演示音频”,因为它类似声音曲目的幻灯演示。Windows Media Author 也可新增脚本命令和 URL 到 .asf 文件中。

“Windows Media Publish to ASF for Microsoft PowerPoint 97” 是一种将带旁白的 PowerPoint 演示转换成 .asf 文件的工具。

“Windows Media Plug-In for Adobe Premiere”可在 Adobe Premiere 中方便地压缩和转换视频文件为 ASF 文件。在新版本的Premiere6里面我们可以找到它

“VidToAsf”和“ WavToAsf”是从服务器的命令行运行的转换实用工具。它们用于转换现有的声音和电影文件为 ASF 格式。

“ASFCheck”和“ASFChop”是从服务器的命令行运行的文件实用工具。ASFCheck 用于检验 .asf 的格式,若可能的话也修复文件。ASFChop 可用来向 .asf 文件新增属性、标记、索引和脚本命令,以及删除 .asf 文件的时间字段。

另外,在安装了Windows Media 相关的SDK程序以后,我们可以在里面的WMSSDK\Samples\ScrBld\目录下面找到一个nsscript.exe的文件用于编辑ASF的标记位和SCRIPT跳转,在WMSSDK\Samples\Batch\目录下面找到一个setup.exe用于安装Batch Encode Utility,这是一个用于批处理转换的程序。

ASX的文件格式参考的详细,可以在Windows Media SDK 里面的Microsoft Windows Media Player Control SDK中找到。这是一种较为简单的编程语言,只是现在还没有比较方便的图形化编辑工具,或者说GUI。但相信MS在不久以后就会推出相关的辅助编辑程序。因为在这方面上REAL已经走在他们前面。

通过ASX文件,可以对播放文件进行简单的控制,在ASX元件中,包含象TITLE/ LOGO这样的标志元件,ENTRY这样的基础元件,和STARTMARKER / ENDMARKER这样的标记元件,以及/EVENT这样的交互元件,REPEAT这样的控制元件。

下面是一个ASX文件的例子:

<"ASX VERSION="3.0"> Example Media Player Show Windows Media Technologies (c) 1999, Microsoft Corporation Example Clip Windows Media Technologies (c) 1999, Microsoft Corporation Another Clip Windows Media Technologies (c) 1999, Microsoft Corporation

在这里仅仅是定义了两个标准的视频条目,以及相关作者信息。
不否认,用ASX的交互作用是很弱的,我们可以通过在ASF里面加MARKER然后调用网页,在网页里面通过编写JAVA SCRIPTS或其他辅助语言调用来弥补这个缺陷

还有要讲的就是Windows Media Rights Manager,这是一个数字权限授权管理软件,通过后台数据库的支持,它可以对每一个发布的ASF文件进行加密打包,然后通过数字证书对发布文件进行管理。不必要担心会被StreamBox这种软件进行截获,因为用户在打开该文件时,将会进行数字证书的确认,用户可以将下载后的文件进行拷贝,但是另外一个用户在打开该文件时,由于该用户机器上没有该文件的认证证书,系统将重新连线获取证书。数字证书可以是免费的,也可以是收费的。这就在很大程度上抑制了盗版的泛滥。实现了网上媒体文件的版权管理。关于Windows Media Rights Manager的详细使用可以在它的帮助文件和SDK文件里面获取。我们通过该软件还可以对网上用户群的爱好分布进行调查统计。

Real:
Real producer:REAL文件的生成工具,现在能制作REAL文件的工具除它,还可以通过CLEANER 5 的PREMIERE 外挂输出。但效果和详细参数设定都远远没有REAL PRODUCER来的好。REAL PRODUCER与MEDIA ENCODER在功能上是对应的。做的都是多媒体视音频在进行网络传输前的压缩过程。不可避免的,在此中将会有质量上的损失。而进行何种压缩方式则是用户根据视频源的质量和类型来定义的,在网络带宽允许的情况下,我们采用尽可能高的压缩方式。同时REAL还提供了自行定义的压缩特性,包括:Normal Motion Video / Smoothest Motion Video / Sharpest Motion Video /三种类型,区别在于,Sharpest Motion Video的图象和Normal MotionVideo比较将更加清晰、锐利,但同时它的动作连贯性将会损失,而Smoothest Motion Video的效果则是相反的效果。同时,我们也可以看到在producer的选项里面可以定义“2-pass Encoding”“Variable Bit Rate Encoding” 这也是我们前面所提到过的。我们同样可以找到和WINDOWS MEDIA相类似的批处理程序:rmbatch.exe,不同的是这里没有提供GUI,而是需要用户自己用命令行的方式输入。

Real Slide Show: 这是REAL 一个做幻灯片的软件,和“Windows Media Author”在作用差不多,做的是一些简单的图片跳转和过渡效果,生成RP文件(就是REAL PICTURE)。其实用简单的SMI语言就可以实现其中功能,所以,我个人认为其功能基本不大。

Real Rresenter:是一款和“Windows Media Presenter for Microsoft PowerPoint 97”功能类似的工具,它的本质是把PPT文件通过同期录播的形式保存下来,适用于网络教学。教师可以控制录播的开始,然后一边讲课,一边翻页。REAL将用SMI和分帧的形式将课程内容和老师的讲课声音记录下来并重现,更值得一提的是,它可以根据PPT内置的框架结构,划分整个记录过程的片断。也就是说他可以根据PPT内置结构,把一节课分为:第一小节/第一段/第二段,第二小节….缺点是图象质量差了点,不过这是在没有和“Windows Media Presenter for Microsoft PowerPoint 97”相比较的情况下得出的结论,而导致这种结果的原因是他们算法的本身,因为采用了抖动的效果来优化图形,反而使得原本很清晰的字体边缘出现模糊。这样的产品效果不适合于用在投影上。

Real Jukebox:一款数码音乐软件,但可以用在转换格式上,他对CD-RM的转换功能很强,CD-MP3的转换功能也不错。但用它来播放音乐时,占用资源过多,不推荐使用。

REAL的扩展功能是强大的,突出表现在它对SMIL语言的支持。SMIL通常被人们读作“Smile”,它实际上是专为流多媒体的格式设计而指定的一个开放的WWW协会(WorldWideWebConsortium,W3C)提议。和HTML一样,SMIL也是定义了一种机制的标识语言,用户可以根据它来创建多媒体演示。SMIL的机制类似于JavaScript和VBScript。浏览器需要了解如何处理脚本,因而能够被为集成到浏览器内而制定的一个WWW协会标准所采用。

SMIL和HTML的主要区别在于,HTML只能够演示超文本数据,而无法用于多媒体内容。使用HTML,您只能通过启动辅助应用或使播放器每次都出现在页面的同一位置的方式来提供多媒体。SMIL是一种机制,也可以看作是一个命令文件,它能控制流音频、视频和图像的显示来利用工作站上业已提供的多媒体能力。SMIL为设计者赋予了更多控制如何、何时或何处在浏览器中播放视频和音频的能力。

SMIL也提供了更多的数据类型来处理多媒体。例如,RealNetworks公司的RealPix和RealText两项技术能使站点创建者控制RealAudio、RealVideo和RealFlash内容。

下面是一个SMIL文件:

<"SMIL>

Real 同样提供为于文件内部的标记记号,同样的,它是通过编辑软件从外部植入的,这个编辑软件就是PRODUCER内置的REAL EDITOR 。通过插入TAG和EVENT,(相当于Windows Media里面的MARKER和SCRIPTS), 来控制文件播放时候的附带动作。其实这个功能在SMI同步里面已经可以很好的实现了,在这里显的就不是那么重要。

Quick Time

由于QT毕竟是APPLE的东西,所以更多关于它的编辑和处理都在MAC上面完成,在PC上面方便的进行QT编辑的软件不多,我们可以用PREMEIRE和QuickTmie Pro对MOV文件进行简单的编辑修改。但效果远没有在MAC上面用专业软件的效果好。

QT文件的交互性是最强的,支持多种交互功能。同样有类似Windows Meida 和 Real 的文件内标记和跳转。

QT同样对SMIL有很好的支持,或者应该反过来说。所以说,现在的网页编辑者或许应该开始换一个概念,或许在不久的将来,网络的编程语言将不是HTML而是SMIL,不说XML,至少在多媒体这方面,SMIL已经做的很出色。

5.最新发展以及展望

Windows Media:

最新的Windows Media Encode 8,不仅压缩比率又有新的突破,而且支持更多不同的网络数据传输速率和压缩比率:可以用48Kbps速率播放接近CD音质的音频数据流,用64Kbps速率,播放与CD音质等同的音频数据流;最新发布的视频编码则明显优化了动态效果的处理。不管它是否和官方所称的比WindowsMediaFormat7提高了30%一致,但我们都可以肯定的是它确实使人的期待得到了答复,WMV8还是目前惟一能够提供TrueMotion-Picture-ReadyVideoCodec的视频格式,用低档的DSL/Cable连接速率(250Kbps)下能够达到近乎VHS的视频品质(Near-VHSQuality,分辨率为320×240,每秒24帧)。

用DSL/Cable连接速率(500Kbps)下能够达到与DVD差不多的视频品质(Near-DVDQuality,分辨率为640×480,每秒24帧)。

  REAL :

Real Audio Encode 8 大大增加了Real对音频的压缩处理能力。顺便插一句:在甚低码流下的音频传输,Real要比WM要强一些。

在Server端:iPoint-PrincetonVideoImage为RealSystem8提供了适合广播人士的广告插播PVI技术,iPoint可以在RealSystem8中无缝插入预先定制的广告节目。(流媒体也是一种有效的方法。研究发现,流媒体的广告效果比条幅广告的效果至少好5倍。)

RichFX-RealPlayer8可以以原始文件1/20大小的传输显示3D效果。RichFX视频技术可以为窄带电子商务带来新的商业机会。

RealNetworks还推出RealSystemiQ建立新一代的网上广播神经中枢系统

RealNetworks,Inc.(Nasdaq:RNWK)今天推出全新技术RealSystemiQ,为数码媒体之传播定下新的基础。RealSystemiQ在提升网上广播的稳定性与可靠性,令广播信息可传播至更多观众的同时,也为媒体传播带来更佳的成本效率并弹性。

以往,媒体的流播是透过一个中央的服务器把流播的媒体分派出去其它的流播服务器,然后再传送出去用户。技术的RealSystemiQ就是把这个单向的流播模式扭转。RealSystemiQ建立起一个蜂巢式的服务器组群,让每一个服务器均可以向网络作出广播,以及从其它服务器接收内容,并把数码媒体传送给用户。Neuralcast技术建立一个对等的基础,让数码媒体可透过标准的网络协议由一个服务器传送出其它多个服务器当中。此外,RealSystemiQ的架构是容许用来传送各种格式的媒体。为达至更完美的传送效果,RealSystemiQ的区域传送功能(TerrestrialMediaDelivery)更加入了卫星传送技术的整合支持。

其他厂商:
RealNetworks得到Nokia及其它移动电话制造商的的支持,开发其流式声音和影象。我们可以看到最新的NOKIA 9210已经支持REAL。

美国在线时代华纳、BertelsmannAG、EMI集团和RealNetworks周一宣布了一项极具冒险性的合作计划,那就是RealNetwork将要推出在线音乐服务网–MusicNet,以上三家美国主要的音乐出版商则授权将其子公司(华纳音乐集团、BMG娱乐公司、和EMI唱片公司,它们会以非卖断的方式授权自己的出版物给MusicNet)出版的音乐提供给该网站。

但同样我们可以看到:2000 05英特尔公司宣布鉴于流媒体市场的需求,该公司将为流媒体供应商提供Internet 服务业务. 旨在为一些公司提供流媒体基础设施,此外还使媒体和内容供应商将诸如音乐会、电影、广播、简报等内容通过Internet,以高品质流动内容………

而在2001 02英特尔却宣布将逐步退出流媒体领域的经营. 他强调公司相信网上的流音频和视频的发展前景是好的,只不过现在还不是时机。

谁都想成为这个行业的主流,因为看到了流媒体发展的广阔前景,于是有媒体统计说REAL在家庭用户中的领先优势进一步增加,又有媒体说WM的增长速度是REAL的4倍。最近又有各种消息是SONIC SOLUTION公司将在今年6月推出结合了DVD技术的高端流媒体。但无论如何,我们都会去尝试,然后取舍。带给大家最新最好的技术解决方案。