当今VoIP技术正在世界范围内迅速替代传统的固话语音技术,本文从VoIP应用形式、简单的呼叫模型、主要的VoIP协议、技术发展历程等方面进行介绍,全面展示VoIP技术的现状。 VoIP(网络电话)是指将模拟的声音讯号经压缩与封包后,以数据封包的形式在IP网络环境中进行语音讯号的传输。 目前,国外很多基于互联网运营的VoIP电话系统都已取得成功,其巨大的市场潜力也吸引了众多国际xx厂商,力图在VoIP网络电话市场抢占先机。现以H.323协议为模型,对VoIP系统的原理进行简单说明。 1、典型的VoIP网络构成及呼叫过程 (1)网络构成 VoIP网络主要由主、被叫接入终端;主叫网关、网守;被叫网关、网守组成,如图1所示。 图1 VoIP系统结构(以H.323协议为模型) ①网关的主要功能是实现PSTN网到IP网的转换,包括ISDN信令处理、H.323协议功能、语音编解码和路由协议处理功能等。对外分别提供与PSTN网连接的中继接口以及和IP网络连接的接口。很多网关都支持PPP/PPPOE广域网接入功能,并支持基于WEB的管理方式和具有内建的IP路由、NAT、NAT穿透功能,且很多网关也提供FXS接口,可直接接入普通电话。另外,若主叫本身就是网络电话类的智能终端,一般也都提供支持PP-POE接入的能力,则不再需要源网关。 ②网守的主要功能是用户认证、地址解析、带宽管理、路由管理、安全管理和区域管理。 (2)呼叫过程 呼叫由PSTN发起,通过中继接口接入到网关,也可能是网关直接连接的普通电话发起。网关获得用户希望呼叫的被叫号码后,向网守发出接入请求,申请地址解析,网守根据被叫号码查找被叫网关的IP地址,并根据网络资源情况来判断是否应该建立连接,若可建立连接,则将被叫网关的IP地址通知给主叫网关。主叫网关在得到被叫网关的IP地址后,通过IP网络与对方网关建立起呼叫连接,被叫侧网关向PSTN网络发起呼叫并由交换机向被叫用户振铃。被叫摘机后,被叫侧网关和交换机之间的话音通道被连通。 2、VoIP应用形式 VoIP的应用形式丰富,目前主要是以下几种: (1)PCTOPHONE PCTOPHONE就是主叫方是PC终端上网,利用VoIP语音软件进行通话,被叫方是普通电话用户。这种应用形式在国外相当流行,代表软件有Net2Phone、VoxBar、Skype等。其特点是发话端是互联网用户,受话端是PSTN电话用户,即“INTERNET+PSTN”形式。需要说明的是,目前已出现了很多功能很好的网络电话机,电话机本身即提供PPPOE拨号功能、配置静态IP地址功能和动态获得IP地址功能。只要接入INTERNET就可以打电话,这种情况也还算此类应用范畴。 (2)PHONETOPHONE PHONETOPHONE就是主、被叫方均为PSTN电话用户,主叫用户需拨打短号码并进行卡号和密码认证。这种应用形式出现较早,当前各大电信运营商都提供此类服务,如IP电话卡等。特点是发、受话端均是PSTN电话用户,在主、被叫端之间经有IP网络(既可是专用IP网也可是互联网),即“PSTN+IP网络+PSTN”形式。 (3)PCTOPC PCTOPC就是主、被叫方均为PC终端上网,利用即时通讯软件的语音功能进行语音通话。代表软件有QQ、MSN、ICQ、Skype等。 (4)企业用户的应用方式 当总部城市A的员工需要拨叫企业分部城市B的本地电话时,总部语音网关首先将呼叫转移到分部城市B的语音网关,再由分部城市B网关通过连接在其上的本地PSTN通路发起对被叫方的呼叫。也就是说,若企业所在地安装了VoIP语音网关设备,全国范围内,只要在有分支机构的城市,企业中的任何一人需要给企业有分支机构的任何城市用户打电话,企业所要付出的只是当地的电话费。 我国现有很多拥有自己专网的行业和较多分支机构的大企业,如金融、能源、政府机构、跨国公司等,利用电信运营商提供的DDN、帧中继、ATM等网络组网或通过INTERNET建造自己的IPVPN网络实现内部通话。它们目前也正是中国VoIP市场的主力,已拥有一套运营级的VoIP网络。 3、VoIP协议介绍 语音通信仍是电信运营商的主要业务,只有通过为用户提供更个性化、更多样的业务,才能创造新的业务增长点,为企业创造更多利润。本着技术服务于市场的原则,下一代VoIP的发展方向需按业务个性化和多样性的特点发展。选择什么技术,应具备怎样的特点,是运营者必须关注的重点。目前,可用来实现VoIP的协议有H.323、SIP、H.248、MGCP、P2P类语音协议等。 (1)H.323协议簇 国内早期运营商的VoIP网络几乎全部基于H.323协议集构建的。H.323协议集是ITU-T为基于分组交换网络而开发的多媒体通信系统。呼叫控制是其中的重要组成部分,可用以建立点到点的媒体会话和多点间媒体会议,主要应用于视频会议系统。它并不是一个独立的协议,而是由多种协议组成,包括H.225、H.245、RTP、RTCP等。H.323定义了4个主要部件构筑基于网络的通信系统:终端、网关、网守、多点控制单元(MCU)。 H.323定义了介于电路交换网和分组交换网之间的H.323网关、用于地址翻译和访问控制的网守、以及后台认证、计费等支撑系统组成。在VoIP系统中,没涉及H.323协议的多点会议控制功能部分功能。网关是完成协议转换和媒体编解码的主要设备,而网守则是完成网关之间的路由交换、用户认证和计费的控制层设备。H.323协议集的设计本身就是从电信级网络的角度出发的,易于构建大规模网络,网络的可运营、可管理性及不同厂商设备之间的互通性较好。H.323在分组网络上模拟了PSTN的结构,本身也是分层、主从、集中式的控制方式。 (2)SIP协议 SIP(初始会话协议)是IETFSIP工作组提出的基于文本编码的IP电话/多媒体会议应用层控制协议。用于建立、修改并终止多媒体会话。SIP协议还可用于发起会话或邀请成员加入已用其他方式建立的会话。 自3GPP在Release5的IMS(IP多媒体子系统)中宣布以SIP为核心协议,及ETSI在其NGN体系中采用IMS以来,SIP协议就成为关注热点。最初只有国外的小厂商将SIP协议开发和使用在企业的小型网络中,以提供电话业务。第二版本发布后,SIP协议得到了更广泛的应用,基于该协议开发的系统,用户终端无论在何处接入互联网,都可通过域名找到其归属的服务器,以进行语音和视频通信。 SIP协议的特点如下: ①既可支持点到点的话音通信或视频通信,也可支持多点参与的话音或视频会议等。 ②透明地支持名字映射和重定向服务,便于实现ISDN,智能网及个人移动业务。 ③可用MCU或全互联的方式代替组播发起多方呼叫,与PSTN相连的IP电话网关也可用SIP协议来建立普通电话用户之间的呼叫。 ④采用基于文本的UTF-8编码方式和ISO10646字符集,易于实现,易于调试、灵活和扩展性好。这种方式理解容易、实现简单,方便设备商的产品开发。 ⑤对个人移动业务提供了很好的支持。对主叫发出的请求,被叫可以重定向到多个点位,这些点位可以是任意一个URL,并且电话类型(移动、固定)、应用类型(商用、家用)和被叫优先级列表等附加信息将被传回主叫方,这使得主叫方可以灵活地选择与哪一个点位通话。 ⑥采用Client/Server结构的消息机制,将UA分为两个部分:呼叫方发出邀请(或呼叫);被叫方接受或拒绝邀请(或呼叫)。这种Client/Server的关系不固定,其工作方式对等,当A向B发送请求消息时,A作为Client,B作为Server。反之,当B向A发起请求时,它们之间的Client-Server关系又相反。 ⑦低层协议可为SIP协议层提供可靠或非可靠业务,也可为分组或字节流业务。Internet环境下,SIP协议层可使用UDP协议或TCP协议,它{sx}UDP协议,当不能使用UDP协议时,使用TCP协议。 ⑧SIP协议的可扩展性主要体现在:不可识别的头域可以忽略;用户可指示SIP服务器必须理解的消息内容;新的头域容易引入;状态码采用分层编码方式进行编码。 可见,SIP协议沿用了计算机网络设计的思想。协议设计灵活,可很方便地开展新业务。SIP协议xx传承了Internet的特点,终端高度智能化,网络结构相对简单。智能化有很多智能化的优点:开发众多业务、进行呼叫控制和信令处理、使网络控制简单;但终端智能化也存在缺点:成本高、使用相对复杂、网络控制简单的代价是网络本身不可靠性。 (3)Skype协议 卢森堡Skype网络电话公司开发了一种集语音和IM功能于一体私有P2P应用协议,又因其在国外提供了廉价的网络电话服务,语音通话质量较好、使用方便,所以它一出现便广为流传,业务增长迅速,受到业界的普遍关注。从技术上讲,Skype使用P2P原理传输语音,能够轻松通过NAT/防火墙,采用的语音编解码算法具有较高的效率,使用安全性极高的私有加密方法对端到端语音信息加密。 Skype以P2P的方式提供四类服务:“PCTOPC”;“PCTO PHONE”;“PHONE TO PC”;“语音信箱”。Skype网络结构是一个由普通主机和超级节点、Skype登陆服务器组成。 一个Skype客户端通过监听特殊的端口来接受打入电话,维护一个称作主机缓存的节点表。所谓得主机缓存就是一个超级节点和其开放端口,被定期刷新的列表。使用多种方式的语音编码方式,在本机保留一个好友列表,对信息进行端到端的加密。当Skype客户端被执行后,首先要判断出是否自己在NAT设备,若在,则按不同方式去应对NAT连接造成的问题,Skype客户依据主机缓存地址和端口发送UDP包到超级节点。若UDP包被NAT设备限制,则转而使用TCP协议跨过NAT设备,若采用端口连接无效,就试图分别采取80端口(HTTP端口)和443端口(HTTPS端口)躲过防火墙的干预。Skype被人称道的是其使用AES算法对每个电话和即时信息使用256bit加密,使用1536bit~2048bit RSA去协商对称AES密钥。用户的公钥在进行登陆服务认证时鉴定。 Skype使用其全局索引技术来搜索Skype用户,并宣称这种技术是分布式的,若用户存在且在最近72小时登陆过,就保证能够查找到。 Skype语音信令使用TCP协议来传输,宣称其通信占用带宽只有3Kbit/s~16Kbit/s。不同的主、被叫用户的位置情况不同,Skype采用的技术方式也不同,分为: ①主、被叫用户都使用公网IP地址,信令使用TCP方式连接,媒体流使用UDP方式。 ②主叫用户在端口受限的NAT设备后,接收者是一个公网IP用户,通过已在线的公网的其他Skype节点,以TCP方式转发信令、媒体流,转发信令,以UDP方式转发媒体流。 ③主、被叫用户都在端口受限的NAT设备后,则通过已在线的公网其他Skype节点,以TCP方式来转发信令、媒体流。 由于其随机连接其他Skype节点,使用随机IP地址和端口连接Skype网络,有时还使用知名端口(80或443)跳过防火墙联接,因此鉴别Skype流量是很困难的。 (4)H.248和MGCP协议 H.248和MGCP不能成为独立的VoIP协议,只是软交换的网络中的一种承载控制协议,一种主从协议。所谓软交换,其核心思想是控制、承载和业务分离,采用软交换做控制,不同媒体网关做媒体处理来提供话音、数据、视讯等多媒体业务的实现方式。其核心协议是ITU-T制定的H.248和IETF制定的MGCP。 MGCP是为媒介网关和语音IP终端设备提供信令和呼叫控制的主从设备控制协议(MGC控制MG),是简单网关控制协议和IP设备控制规范的结合。H.248/MeGaCo是MGCP的后继协议和最终替代者,但协议概念xx不同,随NGN的不断发展,MGC与MG之间的媒体控制协议将逐步统一到H.248。 4、结束语 目前,VoIP技术还处在关键的发展阶段,并正迅速地向下一代VoIP技术演化。现阶段,以软交换为基础的NGN网络技术得到业界的广泛关注,因此软交换的技术能够实现很多基于IP电话的补充和增值业务,发挥好这种技术优势,大力开发增值业务,才是这一阶段的核心价值。而如何整合数据网络、融合移动业务则是下一阶段的技术核心问题,运营商将在IPDiffServe、MPLS、SIP等技术方面进行大量研究实践为下一步发展做好技术储备。 运营商目前大部分的长途VoIP网、NGN网络等都建设在专用通信网上。IP地址、安全、服务质量这样的问题并不突出。专网的方式只是一个过渡方式,随着三网融合的趋势,IP电话必然要融入到公共IP网当中。无论是长途网还是本地网,这些问题都必须解决。语音网络将变得越来越具有开放性、丰富性,而不仅仅是从电路交换域变为IP交换域。而在享受VoIP技术带来丰富、廉价的同时,如何从政策、技术等层面更好的控制引导便成为VoIP技术发展中应把握的重点。 |