您好,欢迎来到锐游网。
搜索
您的当前位置:首页信息科学与电子工程专业英语-全文译文

信息科学与电子工程专业英语-全文译文

来源:锐游网
文档可能无法思考全面,请浏览后下载!

Unit 1 电子学:模拟和数字

Unit 1-1

第一部分:理想运算放大器和实际限制

为了讨论运算放大器的理想参数,我们必须首先定义一些指标项,然后对这些指标项讲述我们所认为的理想值。第一眼看运算放大器的性能指标表,感觉好像列出了大量的数值,有些是陌生的单位,有些是相关的,经常使那些对运放不熟悉的人感到迷惑。对于这种情况我们的方法是花上必要的时间有系统的按照列出的次序阅读并理解每一个定义。如果没有对每一项性能指标有一个真正的评价,设计人员必将失败。目标是能够依据公布的数据设计电路,并确认构建的样机将具有预计的功能。对于线性电路而言,它们与现在的复杂逻辑电路结构相比看起来较为简单,(因而在设计中)太容易忽视具体的性能参数了,而这些参数可极大地削弱预期性能。

现在让我们来看一个简单但很引人注意的例子。考虑对于一个在50kHz频率上电压增益为10的放大器驱动10k负载时的要求。选择一个普通的带有内部频率补偿的低价运放,它在闭环增益为10时具有所要求的带宽,并且看起来满足了价格要求。器件连接后,发现有正确地增益。但是它只能产生几伏的电压变化范围,然而数据却清楚地显示输出应该能驱动达到电源电压范围以内2到3伏。设计人员忽视了最大输出电压变化范围是受频率严格限制的,而且最大低频输出变化范围大约在10 kHz受到限制。当然,事实上这个信息也在数据表上,但是它的实用性并没有受到重视。这种问题经常发生在那些缺乏经验的设计人员身上。所以这个例子的寓意十分明显:在开始设计之前总要花上必要的时间来描写全部的工作要求。关注性能指标的详情总是有益的。建议下面列出的具体的性能指标应该考虑:

1. 在温度,时间和供给电压下的闭环增益的精确性和稳定性 2. 电源要求,电源和负载阻抗,功率消耗

3. 输入误差电压和偏置电流,输入输出电阻,随着时间和温度的漂移

4. 频率响应,相位偏移,输出变化范围,瞬态响应,电压转换速率,频率稳定性,电容性负载驱动,过载恢复

5. 线性,失真和噪声

6. 输入,输出或电源保护要求,输入电压范围,共模抑制 7. 外部补偿调整要求

不是所有的指标项都是有关的,但要记住最初就考虑它们会更好,而不要被迫返工。 所有参数可以大范围变化

不要忽略这样一个事实。有多少次是在用典型值设计好电路后发现(该电路)只是因为使用的器件不典型而不能工作?这就提出一个棘手的问题:在设计中何时应该使用典型值,何时应该使用最不利值?这是经验丰富的设计人员也必须进行的判断。显然,如果某些性能

1 / 156

文档可能无法思考全面,请浏览后下载!

要求是强制性的,则一定要用最不利情况下的数值。然而在许多情况下某一规定性能是否可以取得将在易实现性,重要性,经济性之间取得折中。

2 / 156

文档可能无法思考全面,请浏览后下载!

不超指标设计或超安全标准设计

最后,我们将受制于价格因素,因为杀鸡用牛刀实在是没有意义的。简单极为重要,因为用较少元器件实现(的电路)总是更便宜也更可靠。

作为最不利情况设计的例子,考虑一个低增益直流传感器放大器,要求将电压源输出的10mV信号放大,产生1V的输出,在0~70C范围内达到1%的精度。注意,性能要求是1%的精度。这就是指输出必须在0~70C温度范围内控制在1 V 10 mV的限度内。第一步,当然是考虑前面的列表,并决定其中哪些参数是有关的。对这样(非常有限)的参数,两项最重要的指标是电压偏移和对于温度的增益稳定性。我们假设所有的起始误差可以忽略不计(这在实际中是几乎不可能的)。经验丰富的设计人员会知道大多数运放具有极大的开环增益,经常远大于10000。闭环增益1%的变化意味着环路增益(将在下面说明)的变化在闭环增益为100时应该小于100%。很明显这将十分容易实现,设计人员会立刻知道计算中他可以使用开环增益的典型值。但是,补偿电压偏移却有所不同。许多运放技术指标仅仅给出补偿电压偏移的典型值,这很可能会在5V/C的数量级,而未给出任何器件可以达到的最大值30V/C。如果我们碰巧使用的是一个有最不利偏移的器件,那么放大器随温度而产生的误差可为2.1 mV,占所有误差源所产生的总的允许误差的相当大一部分。

这就是我们可以肯定可使用开环增益典型值的情况,不过最大漂移很可能导致相当大的误差。在仔细的设计中这种判定是必要的,而且理解厂商的数据要更加仔细。这种考虑必须推广到前面列出的所有详细资料,除了最不利值通常是不会注明的。经常发现(技术规格表上)给出的值并非是经过100%测试的。例如,采用统计测试可以保证90%的器件的性能在给定范围之内。对于某些用户可能很不方便,他们依赖于技术指标所给出的性能,而随后发现却有“另外”10% 的器件被用在了他们的电路中。

Unit 1-2

第二部分:数据寄存器和计数器 数据寄存器

数据寄存器是寄存器中最简单的类型,它可以用来暂时存放数据的一个“字”。其最简单的形式是由共用一个时钟的一组N 个D触发器组成。N比特数据字中的所有位数通过N条数据总线连接数据寄存器。图1.1显示了一个由四个D触发器实现的四位数据寄存器。由于所有触发器同时改变状态,所以这种数据寄存器称为是同步器件。

图1.1 四位D寄存器

移位寄存器

用于计算机和许多其它类型逻辑电路的另一种普通寄存器是移位寄存器。它就是一组触

2 / 156

文档可能无法思考全面,请浏览后下载!

发器(通常是D锁存器或RS触发器)联在一起,使其中一个触发器的输出成为下一个的输入,依此形成一串

3 / 156

文档可能无法思考全面,请浏览后下载!

。它称为移位寄存器,因为数据在每一个时钟脉冲的作用下通过寄存器移动一位。图1.2显示了一个由D触发器实现的四位移位寄存器。

图1.2 四位串行输入串行输出的移位寄存器

在第一个时钟脉冲的前沿,“DATA”输入端的信号被锁存在第一个触发器中。在下一个时钟脉冲的前沿,第一个触发器的内容被存放到第二个触发器中,而出现在“DATA”输入端的信号则存放在第一个触发器中,依此类推。由于每次有一位数据进入,因此被称为串行输入移位寄存器。由于仅有一个输出,每次从移位寄存器输出1比特数据,因此也称为串行输出移位寄存器。(移位寄存器根据它们的输入输出方式命名,不是串行的就是并行的)。通过预置和清除触发器输入端可以提供并行输入。触发器的并行加载可以是同步的(也就是由时钟脉冲发生),或者异步的(不依赖于时钟脉冲),取决于移位寄存器的设计。如图1.3从每个触发器的输出端可以获得并行输出。

图1.3 四位串行输入并行输出的移位寄存器

计算机与外设之间的通信一般都是串行的,而计算机内部的计算通常都是用并行逻辑电路来执行的。移位寄存器可以将信息从串行形式转换成并行形式,反之亦然。根据所要求的复杂程度,可以利用许多不同种类的移位寄存器。 计数器——二进制数字的加权编码

在某种意义上,移位寄存器可以看作是一种基于一元数字系统的计数器。可惜的是一个一元计数器在计数范围内对于每一个数字需要一个触发器。然而,一个二进制计数器只需要一个触发器就可以进行N位数据计算。一个简单的二进制加权计数器可用T触发器来构建。触发器依次相连,使一个触发器的输出作为下一个的时钟,依此类推。这样,触发器在链中的位置决定了它的权重,即对于二进制计数器而言就是它所对应的2的幂。如图1.4显示了一个由T触发器组成的三比特(模八)二进制计数器,图1.5是此电路的时序图。

图1.4三比特二进制计数器

3 / 156

文档可能无法思考全面,请浏览后下载!

图1.5三比特计数器时序图

注意,一组接在Q0, Q1, Q2上的灯泡将以二进制(模8)形式显示第一个脉冲以来已完成的完整时钟脉冲数。根据需要很多T触发器组合起来构成许多位数的计数器。

注意在这种计数器中,每一个触发器在前一个触发器送来的脉冲下降沿改变状态。因此将略有时延,这是由一个触发器改变状态到下一个触发器改变状态之间的传播延迟造成的,即状态变化像波纹一样传过计数器,因而这些计数器被称为波纹计数器。就像波纹进位加法器一样,传播延时会对大数值计数器造成严重影响。

可以通过整理或购买单片芯片计数器来实现计数器的递增计数、递减计数或者预置任何你想要的数字。一个计数器也可以构造出二—十进制、十二进制或者任何进制数的计数器。

一个倒计数计数器可以通过将Q输出连接到前一级计数器的时钟输入来实现。利用预置和清零端,通过用与门将每一个T触发器的输出与另一个逻辑电平作逻辑运算(比方说0为倒计数,1为正计数),则可构成可预置的可逆二进制计数器。图1.6显示了一个没有预置和清零功能的可逆计数器。

图1.6可编程可逆计数器

同步计数器

以上介绍的是异步计数器,这样叫是因为他们的状态随前一级的状态变化而变化,而非同时变化。一个触发器的输出是下一个的输入,因而状态的变化以波动形式通过各个触发器,所需时间与计数器的长度成正比。可以利用JK触发器来设计同步计数器,所有触发器同时改变状态,即时钟脉冲将同时送给每一级JK触发器。这很容易做到,对于二进制计数器,只要所有前面的数字都是1,任何给定的数字都会改变它的值(从1变为0,或者从0变为1)。图1.7显示了一个四位二进制同步计数器的例子。一个倒计数定时器可通过将Q输出端通过与门连接到J和K端实现。也可以设置预置和清零功能,像前一种一样,计数器也可以做成可编程的。

4 / 156

文档可能无法思考全面,请浏览后下载!

图1.7四比特同步计数器

同步计数器的时序图类似于异步(波纹)计数器,除了波动时间现在为零以及所有计数器的时钟同时输入之外

5 / 156

文档可能无法思考全面,请浏览后下载!

。对于同步计数器而言,在时钟上升沿触发比在下降沿触发更为常见。

Unit 1-3

第三部分:锁相特性

锁相环包含三个组成部分(图1.8): — 相位检测器(PD)。 — 环路滤波器。

— 压控振荡器(VCO),其频率由外部电压控制。

相位检测器将一个周期输入信号的相位与压控振荡器的相位进行比较。相位检测器的输出是它两个输入信号之间相位差的度量。差值电压由环路滤波后,再加到压控振荡器上。压控振荡器的控制电压使频率朝着减小输入信号与本振之间相位差的方向改变。

当锁相环处于锁定状态时,控制电压使压控振荡器的频率正好等于输入信号频率的平均值。对于输入信号的每一周期,振荡器输出也变化一周,且仅仅变化一周。锁相环的一个显而易见的应用是自动频率控制(AFC)。用这种方法可以获得完美的频率控制,而传统的自动频率控制技术不可避免地存在某些频率误差。

为了保持锁定环路所需的控制电压,通常要求相位检测器有一个非零的输出,所以环路是在有一些相位误差条件下工作的。不过实际上对于一个设计良好的环路这种误差很小。

一个稍微不同的解释可提供理解环路工作原理的更好说明。让我们假定输入信号的相位或频率上携带了信息,并且此信号不可避免地受到加性噪声地干扰。锁相接收机的作用是重建原信号而尽可能地去除噪声。

为了重建原始信号,接收机使用一个输出频率与预计信号频率非常接近的本机振荡器。本机振荡和输入信号的波形由相位检测器比较,其误差输出表示瞬时相位差。为了抑制噪声,误差在一定的时间间隔内被平均,将此平均值用于建立振荡器的频率。

如果原信号状态良好(频率稳定),本机振荡器只需要极少信息就能实现跟踪,此信息可通过长时间的平均得到,从而消除可能很强的噪声。环路输入是含噪声的信号,而压控振荡器输出却是一个纯净的输入信号(的复本)。所以,有理由认为环路是一种传输信号并抑制噪声的滤波器。

环路滤波器有两个重要的特性:其一是带宽可以非常窄,其二是滤波器能自动跟踪信号频率。自动跟踪和窄带的特点说明了锁相接收机的主要用途。窄带能够抑制大量的噪声,难怪锁相环路常用来恢复深深地淹没在噪声中的信号。 历史与应用

关于锁相的早期论述(思想)是Bellescize于1932年提出的,并在处理无线电信号同步接收中得到应用。20世纪20年代开始使用超外差接收机,但人们一直努力寻求更简单的接收技术。一种方法就是同步接收机或零差接收机。这种接收机本质上只是由一个本机振荡器,一个混频器和一个音频放大器组成。为了正常工作,必须调节振荡器使其输出频率与输入的信号载波频率完全一致,于是载波被变换成0Hz的“中频”。混频器输出含有解调出来

5 / 156

文档可能无法思考全面,请浏览后下载!

的,由信号边带携带的信息。干扰与本地振荡器不同步,因此由干扰信号引起的混频器输出是一个拍音,可用音频滤波器加以抑制。

6 / 156

文档可能无法思考全面,请浏览后下载!

对于同步接收,本振的正确调谐至关重要,任何一点频率误差都将严重损坏信号。此外,本振的相位必须与接收的载波相位一致,其间的误差限于周期的很小一部分。就是说,本振与输入信号之间必须实现相位锁定。

由于各种原因简单的同步接收机从未广泛应用过。现在锁相接收机几乎无例外地运用超外差原理,并趋于高度复杂化。锁相接收机最重要的应用之一是接收来自遥远的宇宙飞行器的极微弱信号。锁相技术的首次广泛使用是在电视接收机中的行和帧的同步扫描。与视频信号一起传送的脉冲发出电视图像每一行的开始信号和隔行扫描的半帧开始信号。作为一种非常粗糙的重建电视显象管扫描光栅的方法,这些脉冲可以剥离出来单独用于触发一对单扫描发生器。

一个较为复杂的途径是利用一对自由振荡的张弛振荡器驱动扫描发生器。用这种方法,即使失去同步(消失),扫描还是存在的。

将振荡器的自由振荡频率设置得略低于水平和垂直(扫描)脉冲频率,剥离出来的脉冲用于提前触发振荡器从而使振荡器与行频和半帧频同步(由于美国电视在交替的垂直扫描时进行隔行交织,所以是半帧频)。

在噪声不存在的情况下这种方案可提供良好的同步,这就完全可以了。不幸的是噪声总是存在的,并且任何触发电路对噪声都是特别敏感的。在极端情况下触发扫描将完全失效,尽管在这样的信噪比条件下电视图像虽然较差却还能辩认。

在不是极端恶劣的条件下,噪声将造成起始时间抖动和偶尔的误触发。行抖动将降低行清晰度,并使得垂直线条呈现锯齿状。严重的水平误触发通常会造成画面出现狭窄的水平黑带。

帧扫描抖动会引起图像的垂直滚动。另外,相继半帧之间的隔行扫描行还会相对移动,使图像进一步恶(退)化。

将两个振荡器与剥离出来的同步脉冲锁相可大大减小噪声起伏。锁相技术靠检查各振荡器和许多同步脉冲之间的相位关系来调节振荡频率,使得平均相位偏差很小,而不是仅用一个脉冲进行触发。由于锁相同步器检测许多脉冲,因此它不会被偶发的破坏同步器触发的大幅度脉冲噪声所干扰。目前电视接收机中使用的飞轮同步器实际上就是锁相环路。使用飞轮一词是因为此电路能够跟踪增加的噪声或微弱信号的周期。通过锁相可以获得同步性能的重大改进。

在彩色电视接收机中色同步信号是由锁相环路同步的。

宇宙飞行的需要强烈地刺激了锁相技术的应用。锁相的空间应用是随着早期美国人造卫星的发射而开始的。这些飞行体携带低功率(10毫瓦)的连续波发射机,相应的接收信号很微弱。由于多普勒频移和发射振荡器的频率漂移,接收信号的精确频率难以确定。在最初使用的108MHz频率上,多普勒频移可在3kHz范围内。

因此使用普通的固定调谐接收机时,带宽至少应为6kHz,然而信号本身却只占非常窄的频谱,大约在6Hz带宽内。

接收机中的噪声功率与带宽成正比,所以如果使用传统的技术,就不得不接受1000倍(30dB)噪声的代价。随着技术的进步这些数字变得更加惊人。发射频率上升到了S波段,

6 / 156

文档可能无法思考全面,请浏览后下载!

使多普勒频移范围达到75kHz,而接收机带宽则已减小到3Hz。这样一来常规技术的代价就将是47dB左右。这是无法接受的,也就是要使用窄带的锁相跟踪接收机的原因所在。

窄带滤波器能抑制噪声,但是如果滤波器被固定,则信号将几乎总是落在通带之外。一个可用的窄带滤波器必须有跟踪信号的能力。锁相环路既提供了窄带,又提供了所需的跟踪能力。而且,非常窄的带宽也能方便地获得(对于空间应用典型的是3到1000

7 / 156

文档可能无法思考全面,请浏览后下载!

Hz)。如果需要的话,还能容易地改变带宽。

对于多普勒信号,用于确定飞船速度的信息是多普勒频移。锁相接收机很适合用于多普勒恢复,因为当锁相环路锁定时不存在频率误差。 其它应用

以下的应用阐述了目前锁相技术的一些应用,这些应用将在本书其他章节进一步讨论。 1. 跟踪运动飞船的一种方法涉及到将相干信号发射到飞船上,将信号频率偏移并转发

回地面。飞船上的相干应答器必须如此工作以使输入和输出频率严格地成m/n的比例关系,此处m和n都是整数。锁相技术经常被用来建立相干性。

2. 锁相环可用作频率解调器,锁相环在其中比传统的鉴频器具有更优越的性能。 3. 带有噪声的振荡器可被包围在环路内,并使之锁定在一个纯净的信号上。如果环路

具有大的带宽,振荡器检测出自已的噪声,其输出被大大净化。 4. 用锁相环路可构成频率倍乘器和分频器。 5. 数字传输的同步通常应用锁相技术实现。 6. 频率合成器可方便地用锁相环路构成。

Unit 2 集成电路

Unit 2-1

第一部分:集成电路

数字逻辑和电子电路由称为晶体管的电子开关得到它们的(各种)功能。粗略地说,晶体管好似一种电子控制阀,由此加在阀一端的能量可以使能量在另外两个连接端之间流动。通过多个晶体管的组合就可以构成数字逻辑模块,如与门和触发电路等。而晶体管是由半导体构成的。查阅大学化学书中的元素周期表,你会查到半导体是介于金属与非金属之间的一类元素。它们之所以被叫做半导体是由于它们表现出来的性质类似于金属和非金属。可使半导体像金属那样导电,或者像非金属那样绝缘。通过半导体和少量其它元素的混合可以精确地控制这些不同的电特性,这种混合技术称之为“半导体掺杂”。半导体通过掺杂可以包含更多的电子(N型)或更少的电子(P型)。常用的半导体是硅和锗,N型硅半导体掺入磷元素,而P型硅半导体掺入硼元素。

不同掺杂的半导体层形成的三明治状夹层结构可以构成一个晶体管,最常见的两类晶体管是双极型晶体管(BJT)和场效应晶体管(FET),图2.1给出了它们的图示。图中给出了这些晶体管的硅结构,以及它们用于电路图中的符号。BJT是NPN晶体管,因为由N—P—N掺杂硅三层构成。当小电流注入基极时,可使较大的电流从集电极流向发射极。图示的FET是N沟道的场效应型晶体管,它由两块被P型基底分离的N型组成。将电压加在绝缘的栅极上时,可使电流由漏极流向源极。它被叫做N沟道是因为栅极电压诱导基底上的N通道,使电流能在两个N区域之间流动。

7 / 156

文档可能无法思考全面,请浏览后下载!

图2.1所示的另一个基本的半导体结构是二极管,由N型和P型硅连接而成的结组成。二极管的作用就像一个单向阀门,由于电流只能从P流向N。可以构建一些特殊二极管,在加电压时可以发光,这些器件非常合适地被叫做发光二极管或LED。

8 / 156

文档可能无法思考全面,请浏览后下载!

这种小灯泡数以百万计地被制造出来,有各种各样的应用,从电话机到交通灯。 半导体材料上整理晶体管或二极管所形成的小芯片用塑料封装以防损伤和被外界污染。在这封装里一些短线连接半导体夹层和从封装内伸出的插脚以便与(使用该晶体管的)电路其余部分连接。一旦你有了一些分立的晶体管,直接用电线将这些器件连线在一起就可以构建数字逻辑(电路)。电路会工作,但任何实质性的数字逻辑(电路)都将十分庞大,因为要在各种逻辑门中每实现一种都需要多个晶体管。

1947年,John Bardeen、Walter Brattain和and William Shockley发明晶体管的时候。将多个晶体管组装在一个电路上的唯一方法就是购买多个分离的晶体管,将它们连在一起。1959年,Jack Kilby 和 Robert Noyce各自独立地发明了一种将多个晶体管做在同一片半导体材料上的方法。这个发明就是集成电路,或IC,是我们现代电脑化世界的基础。集成电路之所以被这样命名,是因为它将多个晶体管和二极管集成到同一块小的半导体芯片上。IC包含按照形成电路所要求的拓扑结构连在一起的许多小元件,而无需再将分立元件的导线焊接起来。

去除了塑料或陶瓷封装后,一个典型的集成电路就是每一边2mm至15mm的方形或矩形硅片。根据制造集成电路的技术水平的不同,在这种小片上可能有几十个到几百万个晶体管,电子器件这种令人惊异的密度表明那些晶体管以及连接它们线是极其微小的。集成电路的尺寸是以微米为单位测量的,1微米是1米的百万分之一。作为参照,一根人的头发其直径大约为100微米。一些现代集成电路包含的元件和连线,是以小到0.1微米的增量来测量的。每年研究人员和工程师都在寻找新的方法来不断减小这些元件的大小,以便在同样面积的硅片上集成更多的晶体管,如图2.2所示。

在集成电路的设计和制造过程中,常用两种主要晶体管技术是:双极和金属氧化物半导体(MOS)。双极工艺生产出来的是BJT(双极型晶体管),而MOS工艺生产出来的是FET(场效应晶体管)。在20世纪80年代以前更常用的集成电路是双极逻辑,但是此后MOS技术在数字逻辑集成电路中占据了大多数。N沟道FET是采用NMOS工艺生产的,而P沟道FET是采用PMOS工艺生产的。到了20世纪80年代,互补MOS即CMOS成为占主导地位的加工技术,并且延续至今。CMOS集成电路包含了NMOS和PMOS两种晶体管。

Unit 2-2

第二部分:专用集成电路(ASIC)

专用集成电路(ASIC)是为了特殊应用而定制的集成电路,而不是通用的。比如,一片仅被设计用于运行蜂窝式电话的芯片是专用集成电路(ASIC)。相比之下,7400与4000系列集成电路是可以用导线连接的逻辑构建模块,适用于各种不同的应用。

随着逐年来特征尺寸的缩小和设计工具的改进,ASIC中的最大复杂度从5000个门电路增长到了1亿个门电路,因而功能也有极大的提高。现代ASIC常包含32位处理器,包括ROM、RAM、EEPROM、Flash等存储器,以及其它大规模组件。这样的ASIC经常被称为SoC(片上系统)。数字ASIC的设计者们使用硬件描述语言(HDL),比如Verilog或VHDL语言

8 / 156

文档可能无法思考全面,请浏览后下载!

来描述ASIC的功能。

现场可编程门阵列(FPGA)是7400系列和面包板的现代版,它包括可编程逻辑块和可编程的模块之间的相互连接,使得相同的FPGA能够用于许多不同的场合。对于

9 / 156

文档可能无法思考全面,请浏览后下载!

较小规模的设计或(与)小批量生产,FPGA可能比ASIC设计有更高的成本效率。不能循坏的工程费用(建立工厂生产特定ASIC的成本)可能会达到数十万美元。

专用集成电路这一通用名词也包括FPGA,但是大多数设计者仅将ASIC用于非现场可编程的器件,将ASIC和FPGA两者区别开来。 历史

最初的ASIC使用门阵列技术。Ferranti在1980年左右整理了也许是第一片门阵列,ULA(自由逻辑阵列)。通过改变金属互相连接掩模产生了定制。ULA有多至几千个门电路的复杂度。之后的版本变得更通用,有适应用户的包含金属和多层硅的不同基底,有些基底包括RAM单元。 标准单元设计

在20世纪80年代中期,一个设计者要选择一家ASIC制造商,并用制造商提供的设计工具完成他们的设计工作。尽管有第三方设计工具,但第三方设计工具和不同的ASIC制造商的布线以及实际半导体工艺过程的性能之间却缺乏有效的了解。大多数的设计者最终使用工厂特制的工具来完成他们的设计。解决这个问题的一个方法是实现标准元件,这一问题也带来了更高密度的器件。每个ASIC制造商都可创造他们自己的具有已知电性能的功能块,如传播延迟器、电容、电感,这些都可以用第三方工具来表示(实现)。标准单元设计就是利用这些功能块来实现很高的门密度以及良好的电性能。标准单元设计使门阵列和全定制设计之间在一次性投入的工程费用和循环元件成本方面相互适应。

直到80年代后期,逻辑综合工具,比如设计编译器,开始向广大设计者提供。这些工具能够将HDL描述语言编译成门级的网表。这就使得称作标准单元设计的设计方法成为可能。标准单元集成电路的设计过程在概念上需经过以下几个过程,但事实上在实际生产中这些工序都有较大的重叠。

以工业界普通的熟练水平实现的这些步骤几乎总是产生能正确实现原设计的最终器件,除非后来在物理制造过程中引入了缺陷。

设计工程师团队开始工作于对新的ASIC所要求功能的非正式理解,这通常来自于需求分析。

- 设计团队构建对ASIC芯片的描述并使用HDL语言实现这些目标。这一过程可类比于用高级语言编写计算机程序。这一过程常被称为RTL(寄存器传送级)设计。

- 仿真验证目标的合适性。利用例如Virtutech’s Simics工具,用软件构建的虚拟系统能以高达每秒数十亿条模拟指令的速度来模拟ASIC的功能。

- 逻辑综合工具,比如设计编译器,将RTL设计转换成称为标准单元的较低层结构的集合。这些构成的元素是从一个标准单元库中得到的,这个库由事先规定好的门电路集合构成,例如2输入或非门,2输入与非门,非门等等。有计划的ASIC制造商有其特定的标准单元。所产生的所有标准单元,加上连接他们所需要的导线称为门级网表。

- 接着,门级网表由布局工具进行处理,将标准单元布局在代表最终ASIC的区域。努力寻找一种标准单元的布局服从各种规定的约束。有时,先进的技术比如模拟退火被用来

9 / 156

文档可能无法思考全面,请浏览后下载!

优化布局。

- 路由工具获取标准单元的物理布局,并利用网表来创建它们之间的电连接。由于搜索空间很大,该过程将产生满足充分条件的解,而不是全局最优解。这个过程的输出是一套光掩模使半导体制造产生实物的IC。

10 / 156

文档可能无法思考全面,请浏览后下载!

- 接下来是对最终延时、寄生电阻和电容以及能量消耗的周全的评估。对于数字电路,这将被进一步对应为延迟信息,这些评估将用于最后一轮的测试。这一测试表明器件将在所有极端的过程、电压、温度下正常工作。当这项测试完成时,光掩模信息将被公布用于芯片制造。

这些设计步骤(或流程)对于标准产品设计同样适用。重要的差别在于标准单元设计使用制造商的单元库,这些库已用于数以百计的其它设计实现,因而比起全定制设计来风险小得多。 门阵列设计

门阵列设计是一种制造方法,事先定义好扩散层(晶体管和其它有源器件),包含这些器件的晶片在金属化之前被库存,就是说先不进行联接。然后在物理设计过程中定义最终设计的连接。对设计者来说重要的是,ASIC相比在市场上可提供的FPGA解决方案,能达到最小的传播延时。门阵列ASIC是一种折中方案,因为将某一给定的设计与制造商库存的晶片相对应总是不可能达到100%利用率的。

现在电路设计者已经很少采用纯粹的逻辑门阵列设计,而几乎都代之以FPGA之类的现场可编程器件了。这些器件可由用户编程,使工具作业费用最低,以略为提高的零件价格获得可比的性能。现在门阵列正在发展为结构化ASIC,其中包含很大的IP内核,如处理器、DSP单元、外围设备、标准接口、集成SRAM存储器、以及一组可重新设置的未确定功能的逻辑单元。这种转变很大程度上是因为ASIC器件能够集成大量的系统功能模块,以及片上系统所要求的(功能)比仅仅逻辑单元多得多。 全定制设计

全定制设计的优点通常包括减小的面积,性能的改进,以及能集成模拟元件和其它预先设计的元件比如构成片上系统的微处理器核。缺点包括增加的制造和设计时间,增加的不可循环工程成本,更复杂的CAD系统,和对设计团队熟练程度高得多的要求。但对于纯数字设计来说,“标准单元”库与现代CAD系统一起,可以低风险提供相当大的性能/价格优势。自动布局工具使用起来快速且简单,也提供了对设计的性能限制进行人工优化的可能性。 结构化设计

结构化ASIC设计是一个不明确的表达,在不同的上下文中有不同的意义。在工业界这是一个相对新的术语,这也是为什么在它的定义上有一些不同。不过结构化ASIC的基本前提是,由于有事先定义的金属层和事先规定了硅片上包含的内容,制造周期和设计周期相对于基于单元的ASIC都有所减少。一种定义是这样的:在结构化ASIC设计中,器件的逻辑掩模层是被ASCI供应商(有些情况下由第三方)预先定义的。结构化ASCI可以被看成是在现场可编程门阵列与“标准单元”ASCI设计之间建立了解。

使得结构化ASCI与门阵列不同的是,在门阵列中,预先定义的金属层是为能更快地制造转向而服务的。而在结构化ASIC中预先定义的金属化主要是降低掩模的成本,并被用于使设计周期明显缩短。同样的,为结构化ASCI所使用的设计工具可以大大降低成本,并比基于单元的工具更容易使用,因为这些工具不必像基于单元的工具那样执行所有的功能。

10 / 156

文档可能无法思考全面,请浏览后下载!

关于结构化ASIC的另一个重要方面是,它使对于某些应用共同的IP成为内在的,而不是设计在内的。通过直接将IP植入结构中,相比将IP设计在基于单元的ASIC中,设计者又能节省时间和花费。

11 / 156

文档可能无法思考全面,请浏览后下载!

Unit 3 电磁场,天线和微波

Unit 3-1

第一部分:电磁场

电磁场是由带电物体产生的物理场。它会影响场附近的带电物体的行为。电磁场在空间无限延伸,描述电磁相互作用。它是自然界中四个基本作用力之一(其余为万有引力,弱相互作用,强相互作用)。

电磁场可以看成是电场和磁场的结合。电场是由静止电荷产生的,磁场由运动电荷(电流)产生;这两种(电荷)通常被描述为电磁场的源。电荷和电流与电磁场相互作用的方式由麦克斯韦方程组和洛伦兹力定律所描述。从经典的角度,电磁场可认为使平滑、连续的场,以波动方式传播;而从量子力学的角度,场可看作是由光子组成的。 电磁场的结构

电磁场可用两种截然不同的观点来看。

连续结构:经典地,电场和磁场被认为是由带电物体的平滑运动产生的。例如,振荡电荷产生电场和磁场,可看成光滑的、连续的波动方式。这时,能量可以看成是在任意两个位置之间通过电磁场连续地传递。例如,在无线电发射机中的金属原子(看来是)连续地传递能量。这个观点在一定程度上(低频辐射)是有用的,但是高频时就有问题(如紫外灾难)。由此产生了另一种观点。

离散结构:电磁场可以一种比较“粗略”的方式来考虑。实验表明:电磁场的能量传递可以更好地描述为用固定频率的光子来传递。普朗克的关系式将光子的能量E及其频率 通过下式了解起来E = h ,其中h是为纪念马克斯普朗克而命名的普朗克常量。 是

光子的频率。例如在光电效应中,即因电磁辐射而从金属表面发射电子的现象,我们发现增加入射辐射的强度并无影响,只有辐射频率与发射的电子有关。

已经证明电磁场的量子描述是非常成功的,引出了量子电动力学。量子电动力学是一种描述电磁辐射与带电物体之间相互作用的量子场理论。 电磁场的动力学

过去,认为带电物体会产生与它们电荷性质有关的两种场。相对于测量电荷性质的观察者,电荷静止时产生电场,电荷运动(产生电流)时产生磁场(和电场)。随着时间的推移,人们认识到电场和磁场是电磁场这一整体的两个部分。

一旦给定的电荷分布产生了电磁场,那么在电磁场中的其它带电物体就会受到一个力的作用(就像行星受到太阳重力场的力一样)。如果这些电荷和电流的大小与产生上述电磁场的源是可比的,那么将产生一个新的净电磁场。这样,电磁场可以认为是一个动力学实体,它促使其它电荷和电流运动,同时又受它们影响。这些相互作用可由麦克斯韦方程和洛伦兹力定律来描述。

11 / 156

文档可能无法思考全面,请浏览后下载!

Unit 3-2

第二部分:微带天线

通信中,有几种微带天线(又叫印刷天线),其中最普通的是微带片状天线 或片状天线。片状天线是一种窄带宽波束的天线,通过将天线单元图样蚀刻到粘贴在绝缘基底上的金属轨迹而制成,基底的另一面则粘贴连续的金属层形成接地平面。通常微带天线辐射器的形状有正方形的,矩形的,圆形的和椭圆的,而任何连续的形状都是可以。一些片状天线为了避免绝缘基底,在接地平面的上空用绝缘逆电流器悬挂一个金属贴片;这种结构的鲁棒性不是很好,但能提供更好的带宽。因为这种天线外形低矮,机械强度大,并且形状上适应性强,通常装在飞机或太空飞行器外表,或组合在移动无线电通信设备上。

因为其简单的二维形状,所以微带天线的生产和设计相对来说不算太贵。微带天线通常用于UHF(超高频)和更高的频率,因为天线的尺寸直接受制于谐振频率的波长。一个简单的片状天线可以提供最大为6~9dBi的定向增益。通过平板印刷技术我们很容易在单个大绝缘体上印刷贴片阵列。以很少的额外成本,贴片阵列比单个贴片能提供更高的增益,用形成辐射电波的片状微带天线的同样机理,可对印刷微带天线的馈电结构进行匹配和相位调节。以低矮的天线构成高增益阵列的能力是片状天线广泛用于飞机和其他军事应用的原因之一。

最普遍应用的微带天线是矩形贴片。矩形贴片天线长近似为矩形微带传输线的一段,其长度等于半波长。当空气作为天线基底时,矩形微带天线的长度大约为自由空间波长的一半。因为天线是负载绝缘体作为它的基底,所以天线的长度会随着基底的相对介电常数的增加而减小。天线的谐振长度略短一些,这是因为边缘场稍微增加了天线的电气长度。微带天线的一个早期模型是一段微带传输线,在一端具有等效负载,代表辐射损耗。

微带天线的介电负载影响天线的辐射模式和阻抗带宽。随着基底介电常数的增大,天线的带宽减小,其Q值提高,因而阻抗带宽减小。当使用天线的传输线模型时这种情况并没有发生,到了七十年代后期出现空腔模型时这种情况就显现出来了。矩形微带天线的辐射可以理解为一对等效的狭缝。这些狭缝就像一个阵列,当天线使用空气电介质时方向性最好,但是当天线的负载材料的相对介电常数增加时方向性会减弱。

贴片天线固有的优点是能有极化分集。片状天线能很容易地通过多个馈点或在非对称片结构上采用单一馈点设计成具有各种极化特性。这个独特的性质使得贴片天线应用于有不同需求的通信链接的许多领域。

半波矩形微带天线沿其中心有一个虚拟短路平面。用物理短路平面替代上述虚拟短路平面就可以做成四分之一波长微带天线。有时称四分之一波长微带天线为半贴片。这种天线只有单一的辐射边缘(等效狭缝),因此会降低天线的方向性/增益。由于没有辐射边缘之间的耦合,所以阻抗带宽也比半波长全贴片窄。

12 / 156

文档可能无法思考全面,请浏览后下载!

Unit 3-3

第三部分:微波

微波是波长比频率为特赫兹(THz)的波更长,但比无线电波短的电磁波。微波的波长范围大约在30厘米(频率= 1 GHz )到1毫米( 300 GHz)之间。这个波长范围已经使人对命名习惯提出了问题,因为微波使人联想到微米波长。然而,远红外光,赫特辐射,微波,超高频无线电波之间的界限相当随意的,在不同的学科领域有不同的用法。电磁理论的同一个方程组应用于所有频率。当信号的波长和设备的尺寸大致相同时,仪器和技术可被描述为“微波”,因此集总元件电路理论不再准确。微波这个术语一般是指“频率为300 MHz和300GHz之间的交流电信号” 。但是,IEC标准60050和IEEE标准100都定义“微波”频率从1 GHz( 30厘米波长)开始。

詹姆斯·克拉克·麦克斯韦于1864年根据他的方程组预言了电磁波存在,而微波只是电磁波频谱中的一部分。 1888年,亨利希·赫兹构建了在UHF频段产生和检测微波的装置,首次证明了电磁波的存在。1894 J. C. Bose公开展示了用毫米波长对钟进行的无线电控制,并引导了微波传播的研究。

微波范围包括超高频(UHF)(0.3-3 GHz),甚高频(SHF)(3-30GHz)以及极高频(EHF)(30-300 GHz)信号。

地球大气对高于300 GHz的电磁辐射的吸收是如此之大,以至于变得实际上是不透明,直到所谓的红外线和可见光窗口的频率范围,大气又变得透明。 器件

基于电子管的器件是在受控制电场和磁场影响的真空内由电子的冲击运动而工作的,包括磁控管,速调管,行波管和振动陀螺仪。这些器件工作在密度调制模式而不是电流调制方式。这意味着它们是基于真空管发出的电子簇工作的,而不是用连续的电子流。 用途

微波炉是通过穿过食物的微波辐射工作的,通常频率是在2450 MHz(波长12.24厘米)。食物中的水、脂肪和糖分子在称为电介电加热的过程吸收微波波束的能量。许多分子(如那些水)是电偶极子,这意味着它们一端带正电,另一端带负电,因此它们力图与微波波束所引起的交变电场保持一致而发生旋转。旋转分子撞击其它分子使他们运动,这种分子运动产生热量。微波加热对液态水是最有效的,其次为脂肪和糖类(分子偶极矩较少)以及冷冻水(分子不能自由转动)。微波加热有时被错误地解释为水分子的旋转共振,而这种共振只能发生在数十千兆赫的高频。此外,大型工业/商业微波炉在900兆赫的范围内工作,也能很好地加热水和食物。

一个常见的误解是,微波炉从“从里面到外面” 彻底地烹调食物的。实际上与其它加热方法类似,微波被食物外层吸收。微波中的射线处理水粒子来烹调食物。实际上它是由运动引起的摩擦产生热来加热食物。这种误解源自微波在许多普通食物的表面穿透干燥的非导

13 / 156

文档可能无法思考全面,请浏览后下载!

电物质,因此比起其它方法来能在更深层堆积初始热量。使用微波炉,初始热沉积的深度可达几个公分以上,这取决于水分含量的多少,而焙烤是依赖红外辐射或烤箱内的热对流,它们在食物表面存储的热量很浅。微波渗透的深度是依赖于食物的成分和频率,较低频率的微波穿透力更强。

微波无线电用于广播和电信传输,这是因为其波长短,与波长较长(低频)时相比,方向性天线体积更小也更实用。比起其它无线电频谱,微波频谱有更宽的频带可以利用;频率低于300兆赫

14 / 156

文档可能无法思考全面,请浏览后下载!

时可用带宽小于300兆赫,而在300兆赫以上可用频带达到几个GHz。典型地,微波用于电视新闻,它利用一辆特殊装备的车辆将信号从一个偏僻地点发送到电视台。

在光纤传输出现之前,大部分的长途电话都是通过各站点,像AT&T公司的通信设备,之间微波点对点的连接来传送。从20世纪50年代开始,人们用频分复用在每一个微波无线电信道中传送多达5400路电话,将10路无线电信道组合起来送到一个天线,发送到70公里以外的下一个中继站。

雷达也是用微波来检测远距离物体的范围,速度和其它特征的。

无线局域网协议,如蓝牙和IEEE 802.11规范,在2.4 GHz ISM频段上也使用的微波,尽管802.11a 在5 GHz范围使用ISM频段和UNII 频率。在3.5 ~ 4.0 GHz范围内我们可以发现许多国家(但不包括美国)的经授权许可的远距离无线互联网接入业务。

城域网:城域网协议,如WiMAX (微波接入的全球互通)是基于IEEE 802.16规范。IEEE 802.16规范设计工作在2至11千兆赫。商业实现是在2.5千兆赫,3.5千兆赫和5.8千兆赫。

广域移动宽带无线接入: 基于IEEE 802.20或ATIS/ANSI HC-SDMA(如 iBurst ) 标准规范的MBWA协议设计工作在1.6和2.3 GHz之间,提供移动性和楼宇内部穿透性,类似于移动电话但频谱效率更高。

有线电视和同轴电缆上的互联网接入以及广播电视使用一些低频微波。一些移动电话网络,像GSM,也使用较低的微波频率。

许多半导体处理工艺用微波来产生等离子体,用于反应离子蚀刻和等离子体增强化学气相沉积(PECVD)。

微波可用于长距离传输电能(微波输能),二战后就研究了可能性。美国航空航天局在20世纪70年代和80年代初期研究利用太阳能发电卫星系统SPS的可能性,这种系统装有大型太阳能阵列,通过微波向地球表面发送能量。

迈泽是和激光相似的设备,除了前者是工作在微波频率。 大部分射电天文学都是使用微波。 微波频率波段

微波频谱通常定义为频率范围大约从1GHz到1000GHz的电磁能量,但较早的使用还包括较低的频率。常用的是在1到40GHz范围,由大不列颠无线电学会定义的微波频率波段如表3.1。

Unit 4 通信和信息论

Unit 4-1

第一部分:远程通信

远程通信是远距离通信的信号传输,在现代,通常这个过程需要电子发射机发射电磁波,

14 / 156

文档可能无法思考全面,请浏览后下载!

但是在早期远程通信包括使用烟火信号,鼓或旗语或日光仪。今天,远程通信很普遍的,助推这一过程的设备如电视,无线电和电话在世界的许多地区都已很普遍。还有连接这些设备的许多网络,包括计算机网络,公共电话网,无线电网和电视网络。互联网上的计算机通信是众多通信的一个例子。

15 / 156

文档可能无法思考全面,请浏览后下载!

通信系统通常由通信工程师设计。在这个领域中早期的发明家有Alexander Graham Bell, Guglielmo Marconi 和John Logie Baird。通信在当今的世界经济发展中起着举足轻重的作用,通信产业的税收在世界总产值的比例已接近百分之三。 基本要素

每个通信系统包括三个基本要素:采集信息并能将其转换为信号的发射机,传输信号的传输媒介,接收信号并能将其还原为有用信息的接收机。

考虑一个无线电广播的例子。广播塔是发射机,收音机是接收机,传输媒介是自由空间。通常通信系统都是双向的,一个设备既做发射机又做接收机,即收发器。例如,移动手机就是一个收发器。

电话线上的通信称为点对点通信,因为只在一个发射机和一个接收机之间。通过无线电广播的通信称为广播(一对多)通信,因为通信是在一个大功率的发射机和许多接收机之间。 模拟或数字

信号可以是模拟的,也可以是数字的。在模拟信号中,信号根据信息而连续变化。在数字信号信息被编码为一组离散值(如,1和0)。在传输过程中,模拟信号中的信息会因噪声而退化。相反,只要噪声不超过一定的阈值,数字信号中的信息是不会丢失的。这是数字信号相对于模拟信号一个关键的优点。 网络

网络是由一个相互通信的发射机、接收机或收发机的集合。数字网络由一个或多个路由器组成,路由器正确地将数据发送给用户。模拟网路由一个或多个交换器组成,交换器在两个或多个用户间建立连接。这两种网络都需要中继器,用于远距离传输时的放大或重建信号。(中继器)用来抗击衰减,再现噪声中难以分辨的信号。 信道

信道在传输媒介中分隔区域,以用于使传输媒介传送多个信息流。例如,一个广播站可以工作在96 MHz,而另一个广播站可以工作在94.5 MHz。这时,传输媒介被频率分隔,每个信道接收一个单独的广播频率。另一种方法是给每个信道分配重复的时间段,在这种时间段中进行广播,称为时分多路技术,有时用于数字通信中。 调制

传输信息的信号的形成称为调制。调制可将数字信息表示为模拟波形,称为键控法,键控法有几种技术,包括相移键控,频移键控和振幅键控。例如,蓝牙就是通过相移键控在不同设备之间交换信息的。

调制也可用来以更高的频率传送模拟信号的信息。这一点非常有用,因为低频的模拟信号不能在自由空间中有效地传输。所以,低频模拟信号中的信息在发送之前必须叠加在高频载波上。这种调制也有几种不同的方法,最基本的两种是幅度调制和频率调制。例如,电台主持人的声音就是通过频率调制加载在96 MHz 的载波中发送的(收音机的96 FM台

15 / 156

文档可能无法思考全面,请浏览后下载!

可以收到这个声音)。

16 / 156

文档可能无法思考全面,请浏览后下载!

Unit 4-2

第二部分:数据传输

数据传输就是将信息从一个地方传送到另一个地方。在历史上人们依靠信使,篝火连或日光仪传送信息,后来用铜线传送莫尔斯电码。

在近代的计算机时期,数据传输是运用许多技术将比特流或字节流从一个位置传送到另一个位置,这些技术如铜线,光纤,激光或者红外光。实际的应用包括数据在不同存储设备之间的传输及网络连接,网络连接实现数据在网络服务商和用户浏览器之间的传送。

与数据传输有关的一个概念是数据传输协议,使得传输的数据清晰可懂。目前协议都支持基于分组的网络通信。 数据传输类型

串行传送:在一根线路上一位一位地传送比特。尽管一次只传送一个比特,仍可实现很高的传输速率。这种方式可用于较远距离传输,因为一个校验数字或奇偶校验位很容易在数据线上传输。

并行传送:多条线路同时传送多个比特。由于传送一个字节(8个比特)而不是1个比特,所以比串行传输快得多。这种传输方式适用于计算机内部,比如内部总线,有时也用于外部例如对打印机这样的外设。然而这种传输模式只适用于近距离传输。在远距离传输时,由于多条线路之间的干扰比一条线路中干扰更严重,信号会恶化而无法读出。 异步和同步数据传输

异步传输使用开始位和结束位来表示传送的开始和结束。这就意味着一个8个比特的ASCII字符实际上要用10个比特来传输,比如,A “0100 0001”,传送时变为“1 0100 0001 0”。传输开始和结束时附加的1(或 0,根据奇偶校验位)告诉接收机字符来了,以及字符结束了。当数据是间歇地发送而不是连续流时,使用这种传输方式。在之前的例子中开始位和结束位以黑体标注。开始位和结束位必须是相反的。这样接收机就能辨别发送的第二组信息。

同步传输不使用起始和结束位,而是用插入各数据单元中的时钟信号使接收端和发送端传输速度同步。在两个节点之间可以发送一个连续的数据流。由于没有起始和结束位,传输速率较快,尽管会出现更多差错。差错的产生是因为时钟最后会失去同步,由发送/接受协议所规定的时间关系会在接收时发生错误,一些字节因丢失比特而被破坏。解决这个问题的办法包括时钟的再同步,以及使用校验位以确保正确解释字节和正确接收。 协议和握手

协议:协议是两台设备之间为传输数据而达成一致的格式,比如,计算机和打印机之间。设备之间的所有通信都需要设备达成一致的数据格式。定义格式的一组规则称为协议。

协议规定如下内容:

- 使用的差错检测类型,如果有的话。如校验数字(使用什么类型/规则)。

16 / 156

文档可能无法思考全面,请浏览后下载!

- 数据压缩的方法,如果有的话。如Zip压缩文件,如果文件很大,想要在因特网、局域网和广域网上传输。

- 发送设备如何表示已完成一个消息的发送,例如在通信端口可用一根空闲的导线,对于串行传输用开始和结束字来表示。

17 / 156

文档可能无法思考全面,请浏览后下载!

- 接收设备如何标志其已接收信息。 - 传输速率(波特率或比特率)。 - 是同步传送还是异步传送。

另外,协议还可以包括从传送错误中进行检测和恢复的复杂的技术,以及数据的编解码技术。

握手是两个设备开始建立通信的过程,例如沿控制总线送给处理器的某个ASCII字符或是中断信号/请求总线信号。当一个设备向另一个设备发送信息时握手便开始了,表明要建立一个通信信道。然后这两个设备来回发送信息,最终达成一个通信协议。握手必须在数据传输之前建立,因为它允许协议达成一致。

Unit 4-3

第三部分:信息论

信息论是应用数学和工程学的一个分支,涉及信息的定量,用以确定数据压缩和可靠通信的基本界限。信息论中信息的一个重要的量度是信息熵,熵通常用存储或通信时所需要的平均比特数来表示。直观地说,熵定量地表示一个随机变量所包含的不确定性。例如,掷硬币比掷骰子的熵小。

信息论中的基本主题的应用包括无损数据压缩(如ZIP文件),有损数据压缩(如MP3文件)以及信道编码(如为DSL线路编码)。该领域处于数学、统计学、计算机科学、物理学、神经生物学、电气工程的交叉地位。其影响对“探索者”探索外层空间的成功,CD的发明,移动电话的实现,互联网的发展,语言和人类感知的学习,黑洞的研究,以及许多别的领域是极其重要的。信息论中重要的子领域包括信源编码,信道编码,算法的复杂性理论,算法的信息理论以及信息的度量。 综述

我们可以从人类通信最普遍的方式:语言来理解信息论的主要概念。一种好的语言包括两个重要的方面:第一,最常用的字(如a, the, I)长度应该比不常用的字(如benefit, generation, mediocre)短,这样句子就不会很长。字长的折中考虑和数据压缩是类似的,是信源编码的重要方面。第二,如果因为噪声影响(如一辆车经过)使一部分句子未能听到或听错了,受话者应该仍能够收集语音里包含的意思。这样的鲁棒性对于一个电子通信系统而言是非常重要的,就像对语言一样。通过信道编码来实现通信的鲁棒性。信源编码和信道编码是信息论中最基本的问题。

注意这些问题与消息的重要性毫无关系。例如,一句老生常谈“Thank you; come again”与一句紧急呼叫“Call an ambulance!”在说与写方面占用的长度差不多,但是很显然后者更重要更有意义。然而,信息论不涉及消息的重要性或者意义,因为这些是关于数据的质而不是数据的量,数据的量完全取决于概率。

通常认为信息论是1948年由香农创立的,他发表了开创性论文《通信的数学理论》。经典信息论的一个核心思想是含噪信道中的信息传输的工程问题。信息论的最基本的成果是香

17 / 156

文档可能无法思考全面,请浏览后下载!

农信源编码定理:表示一个不确定事件的结果所需平均比特数由其熵给出;以及香农有噪信道编码定理:只要通信速率低于某个阈值,即信道容量,就可能在有噪信道上进行可靠通信。利用合适的编码和解码系统能接近信道容量。

信息论与人们过去半个多世纪里在全世界范围内研究,并以各种形式转化为工程实践的一系列纯科学和应用科学领域有关

18 / 156

文档可能无法思考全面,请浏览后下载!

,包括:自适应系统,预测系统,人工智能,复杂系统,复杂性科学,控制论,信息学,机器学习,以及许多种类的系统科学。信息论是一个广泛而深刻的数学理论,有同样广泛而深刻的应用,编码理论是其中重要的领域。

编码理论是要寻找一些称之为编码的明确方法,以提高效率,降低有噪信道数据通信中的净误码率,以接近香农所证明的该信道最大可能达到的极限。这些编码大体可以分为数据压缩(信源编码)和纠错(信道编码)技术。对于后一种纠错技术,花了很多年才找到香农已证明是可能的方法。信息论编码的第三分类是密码算法(包括代码和密码)。编码理论和信息论的概念方法和成果被广泛用于密码术和密码分析术。

信息论也可以用于信息检索,情报收集,博彩,数据统计甚至是作曲等方面。 信息量

信息论的基础是概率论和统计学。最重要的信息量是熵,即随机变量中的信息,以及互信息,即两个随机变量之间的共有信息量。前者(信息熵)指出消息数据压缩的难易程度,而后者(互信息)确定信道的通信速率。

对数底的选择决定信息熵的单位。最常见的信息单位是基于以2为底对数的比特。 编码理论

编码理论是信息论最重要和最直接的应用。它可分为信源编码理论和信道编码理论。通过采用数据的统计描述,信息论确定了描述数据所需要的比特数即信源的信息熵。

数据压缩(信源编码)有两个压缩方法: – 无损数据压缩——数据必须能够精确重建

– 有损数据压缩是在给定保真度条件下分配重建数据所需比特数,保真度由失真函数

来度量。信息论的这个分支称为率-失真理论。

纠错编码(信道编码)。数据压缩是尽可能地除去冗余度,而纠错编码则是增加适当的冗余度,使数据在含噪信道中更有效更准确地传输。

将编码理论分为压缩和传输两方面这一做法的正确性被信息传输原理或信源-信道分离的理论所证明。这些理论也证明了在许多不同应用中用比特作为统一单位的正确性。但是,这些理论只有在一个发送用户和一个接收用户通信的情况下才成立。当有一个以上的发射机(多址信道),一个以上的接收器(广播信道)或中介帮助者(中继信道),或更一般的网络,压缩后再传送可能不再是最优的。网络信息理论适用于这些多代理通信模型的问题。

Unit 5 多址技术

Unit 5-1

第一部分:多址技术:频分多址、时分多址、码分多址

多址方案用于使许多用户同时使用同一个固定带宽的无线电频谱。在任何无线电系统中分配的带宽总是有限的。移动电话系统的典型总带宽是50MHz,它被分成两半用以提供系统

18 / 156

文档可能无法思考全面,请浏览后下载!

的前向和反向连接。任何无线网络为了提高用户容量都需要共享频谱。频分多址(FDMA)、时分多址(TDMA)、码分

19 / 156

文档可能无法思考全面,请浏览后下载!

多址(CDMA)是无线系统中由众多用户共享可用带宽的三种主要方法。这些方法又有许多扩展和混合技术,例如正交频分复用(OFDM),以及混合时分和频分多址系统。不过要了解任何扩展技术首先要求对三种主要方法的理解。 频分多址

在FDMA中,可用带宽被分为许多个较窄的频带。每一用户被分配一个独特的频带用于发送和接收。在一次通话中其他用户不能使用同一频带。每个用户分配到一个由基站到移动电话的前向信道以及一个返回基站的反向信道,每个信道都是一个单向连接。在每个信道中传输信号是连续的,以便进行模拟通信。FDMA信道的带宽一般较小(30kHz),每个信道只支持一个用户。FDMA作为大多数多信道系统的一部分用于初步分割分配到的宽频带。将可用带宽分配给几个信道的情况见图5.1和图5.2。 时分多址

TDMA将可用频谱分成多个时隙,通过分配给每一个用户一个时隙以便在其中发送或接收。图5.3显示如何以一种循环复用的方式把时隙分配给用户,每个用户每帧分得一个时隙。

TDMA以缓冲和爆发方式发送数据。因此每个信道的发射是不连续的。待发送的输入数据在前一帧期间被缓存,在分配给该信道的时隙中以较高速率爆发式发送出去。TDMA不能直接传送模拟信号因为它需要使用缓冲,因而只能用于传输数字形式的数据。由于通常发送速率很高,TDMA会受到多径效应的影响。这导致多径信号引起码间干扰。

TDMA一般与FDMA结合使用,将可用的全部带宽划分为若干信道。这是为了减少每个信道上的用户数以便使用较低的数据速率。这有助于降低延迟扩展对传输的影响。图5.4显示TDMA结合FDMA的使用。将基于FDMA的各信道进一步用TDMA划分,从而多个用户可以在同一信道上发送信号。这一类传输技术用于大多数第二代移动通信系统。对于GSM系统,分配的全部25MHz带宽被用FDMA分成125个信道,每一个带宽为200kHz。这些信道又用TDMA进一步分割,每一个200kHz的信道可容纳8~16个用户。 码分多址

CDMA是一种扩频技术,既不使用频率信道也不使用时隙。在CDMA中,窄带的消息(典型的是数字话音)被乘以一个宽带的伪随机噪声(PN码)信号。一个CDMA系统中的所有用户使用同一频带而且同时发送。发射的信号通过将接收信号与发送者用的PN码做相关而恢复出来。图5.5显示CDMA系统中频谱的通常使用方式。

CDMA技术最初是在第二次世界大战中由军方开发的。当时研究人员受到激励以寻求安全和能够在干扰中正常工作的通信方式。使CDMA有用的一些特性包括:

— 信号隐藏,而且不干扰现有系统 — 抗敌方干扰和噪声干扰 — 信息安全 — 精确测距 — 多用户接入 — 对多径的适应性

19 / 156

文档可能无法思考全面,请浏览后下载!

多年以来,扩频技术一直被认为是只适合于军用。但是随着大规模集成电路(LSI)和超大规模集成电路(VLSI)设计的快速发展,商用系统也开始使用了。

20 / 156

文档可能无法思考全面,请浏览后下载!

CDMA处理增益

要理解扩频技术最重要的概念之一就是处理增益。系统处理增益是指扩频系统通过扩频和反扩频的性质所表现出来的增益或信噪比的提高。系统处理增益等于使用的扩频带宽与数据原来的比特率之比。因此处理增益可写为:

GpBWRFBWinfo

其中BWRF是数据扩展以后的发射带宽,BWinfo是所发送信息数据的带宽。

图5.6给出CDMA传输过程。待发送的数据(a)在发送前(被)用一个PN码调制实现扩频。这使频谱扩展,如(b)所示。在本例中处理增益为125因为扩频带宽是数据带宽的125倍。(c)是接收信号。它包括要求的信号,附加的背景噪声,以及其它CDMA用户或无线电信号源的干扰。接收信号通过将信号与原来用于扩频的码进行相乘而恢复出来。这一过程使需要的接收信号反扩频恢复成原来的发射数据。然而,所有与所用PN码不相关的其它信号变得更加扩展。然后(d)中的所需信号被滤波出来,而去掉扩频干扰和噪声信号。 CDMA信号发生

CDMA通过用伪随机序列(PN码)调制数据信号来实现,PN码的码片频率高于数据的比特率。PN序列是一系列随机交替的1和0(称为码片)。数据通过与PN码序列做模-2加法被调制。也可以通过信号相乘得到,只要数据和PN序列都用1和1表示而不是1和0。图5.7是一个基本的CDMA发射器。

用于数据扩频的PN码可由两种主要类型。短的PN码(典型长度10~128码片)可用于调制每一个数据比特。短的PN码对每一比特数据重复使用,可实现接收机的快速和简单的同步。图5.8显示一个使用10个码片的短码CDMA信号的产生。另外也可以使用长码。长码的程度通常有几千乃至几百万码片,因此不经常重复。因此他们更难以解码,所以有益于增加安全性。 CDMA前向连接编码

CDMA系统中从基站到移动电话的前向连接可以使用称为Walsh码的特殊正交码来将同一信道的多用户分开。这些码基于Walsh矩阵,它是由二进制元素构成的方阵,其阶数是2的幂,由一个基Walsh(1)=W1=0和下式生成:

WWnW2nnWWn n其中Wn是n阶Walsh矩阵。例如

00W20120 / 156

文档可能无法思考全面,请浏览后下载!

00W400010100110110

Walsh码是正交的,就是说任何两行间的点积都是0。这是因为任何两行之间都有一半的比特相同,另一半不同。

Walsh矩阵的每一行都可用作CDMA系统中一个用户的PN码。这一处理过程使每一用户的信号与所有其它用户的信号正交,因而相互之间没有干扰。不过为了使Walsh码能起作用,所有用户的码片都必须同步。如果一个用户使用的Walsh码在时间上相对于其它所有Walsh码偏移了超过约十分之一的码片周期,就失去了正交性,导致用户间干扰。对于前向连接所有用户的信号源自基站,因此它们很容易同步。 CDMA反向连接编码

反向连接不同于前向连接,因为从各用户发出的信号并不像前向连接那样由同一个源产生。由于传播延迟和同步误差,不同用户发射的信号在不同时刻到达。由于用户之间不可避免的定时偏差,Walsh码几乎没用,因为它们之间不再正交。由于这一原因,用不相关而又不正交的伪随机序列作为各用户的PN码。

由于调制方法的不同,前向和反向连接的容量是不同的。反向连接是非正交的,导致用户间的严重干扰。由于这一原因,反向信道限制了系统的容量。

Unit 5-2

第二部分: 正交频分复用

正交频分复用(OFDM)——从本质上来说和编码的OFDM(COFDM)是一样的——是一种数字多载波调制方案,它使用大量的相隔很接近的正交子载波。每个子载波都用传统的调制方案以一个低的符号率进行调制(如正交幅度调制),保持在同一带宽内其数据率和传统单载波调制方案相同。 在实际应用中,OFDM信号通过快速傅里叶变换算法产生。

OFDM已经成为具有广泛应用的宽带数字通信系统中的受欢迎的方案。OFDM与单载波方案相比的主要优点是不需要复杂的均衡滤波器就能应对严重的信道问题,如:在长铜线中的高频衰减,窄带干扰以及由于多路径而引起的频率选择性衰落。信道均衡被简化了,因为OFDM可以看成是使用许多慢调制的窄带信号而不是一个快速调制的宽带信号。慢的符号率使得符号间可引入保护间隔,使之能处理时间扩展和消除符号(码)间干扰(ISI)。

OFDM一个主要的缺点是高峰值平均功率比,这就需要更昂贵的发射机电路,而且还有可能降低功率效率。此外,它还对多普勒频移以及频率同步问题很敏感。 正交性

在OFDM中,选择彼此正交的子载波频率,这就意味着子信道之间的串扰被消除了,而且不需要载波之间的保护频带。这就大大简化了发射机和接收机的设计。与传统的FDM不同

21 / 156

文档可能无法思考全面,请浏览后下载!

的是,对于每个子信道不需要单独的滤波器。

22 / 156

文档可能无法思考全面,请浏览后下载!

正交性也使频谱利用率提高到接近于Nyquist频率。几乎整个可用频带都能被利用。OFDM信号一般具有“白的”频谱,使之在与其他用户使用同一信道的情况下具有良好的抗电磁干扰性质。

正交性允许用FFT算法实现高效的调制和解调。尽管OFDM的原理以及所带来的好处在20世纪60年代已被知晓,但是直到能高效计算FFT的低成本数字信号处理器件的出现,OFDM才在当今宽带通信中广泛使用。

OFDM需要发射机与接收机之间有非常精确的频率同步,如果出现频率偏移,子载波将会不再是正交的,这会导致载波间干扰(ICI),也就是子载波之间的串扰。频率偏移典型地是由发射机与接收机振荡器之间的不匹配造成的,或者是由于移动产生的多普勒频移。只有多普勒频移时可以用接收机来补偿,而当多普勒频移和多径结合在一起时,情况就变得更糟,因为反射会出现在不同的频率偏移上,这种偏移很难校正。当速度增加时,这种影响会变的更坏,这是OFDM在高速车辆中的使用受到限制的重要原因。一些抑制ICI的技术已被提出,但是它们可能增加接收机的复杂性。 消除码间干扰的保护间隔

OFDM的一个关键的原理是因为低符号速率调制方案(也就是与信道时间特性相比,符号的持续时间相对较长)很少受到由多径引起的符号间干扰的影响,并行地传输许多低速率数据流要比传输一个高速率数据流有利。因为每个符号的持续时间都很长,所以在OFDM符号之间插入保护间隔是可行的,这样就可以消除符号间干扰。

保护间隔也不再需要脉冲整形滤波器,这也能减低对于时间同步问题的敏感程度。 一个简单的例子:如果用传统的单载波调制在一个无线信道上每秒传输100万个符号,那么每个符号的持续时间将会是1微秒或者更短。这就对同步要求很高并需要去除多径干扰。如果将每秒100万个符号分散到1000个子信道上传输,为满足正交性并保持同样的带宽,每个符号的持续时间可以增大1000倍,即1毫秒。假设一个长度为符号长度1/8的保护间隔被插入到每个符号中,如果多径的时间扩展(接收第一个和最后一个回应的间隔时间)比保护间隔更小,即125毫秒,那么此时就可以避免符号间干扰的产生。这就等价于传播路径之间最大存在37.5千米的差异。每个符号最后的125毫秒被复制,然后作为循环前缀在每个符号之前发送。

在保护间隔里传输的循环前缀是由复制到保护间隔中的OFDM符号的尾部组成,保护间隔是在OFDM符号之前传输的。保护间隔由OFDM符号尾部的复制构成的原因是为了用FFT实现OFDM解调时接收机能在每个多路径的整数个正弦周期上积分。

尽管保护间隔仅包含冗余数据,这意味着它减低了容量,但是一些基于OFDM的系统,如:一些广播系统,故意地使用长时间的保护间隔,目的是使得单频率网络(SFN)的发射机之间能有较大的间距,而且越长的保护间隔允许越大的SFN蜂窝尺寸。根据经验方法SFN发射机之间最大的间距等于一个信号在保护间隔内传输的距离——例如:一个200微秒的保护间隔能够允许发射机之间间距为60千米。 简化均衡

22 / 156

文档可能无法思考全面,请浏览后下载!

如果子信道带宽足够窄,即子信道数量足够多,OFDM子信道中频率选择性信道状况的影响,比如由于多径传播所引起的衰落,可以看成是一个常数。这就使得OFDM接收机的均衡相比传统单载波调制要简单很多。均衡器只需要将子载波乘以一个常数或者是一个几乎不变的值。

在我们的例子中:对于每个OFDM符号,OFDM均衡器需要N = 1000次复数乘法,即接收机每秒需要进行100万次乘法。FFT算法需要对每个OFDM符号进行

23 / 156

文档可能无法思考全面,请浏览后下载!

Nlog2N = 10000次复数乘法,即无论是在发送端还是接收端,每秒都需要进行1000万次乘法。相比之下,在单一载波调制下,每秒发送100万个符号,使用FIR滤波器125微秒的时间扩展均衡将会需要对每个符号做125次乘法,即每秒1.25亿次乘法。

部分OFDM符号中的某些子载波可能会携带导频信号,用于测量信道状况即每个子载波的均衡系数。导频信号也可以用于同步。

如果对每个子载波应用不同的调制,如:DPSK或者DQPSK,那么就可以完全不用均衡,因为这些方案对于缓慢变化的幅度和相位失真都不敏感。 信道编码和交织

OFDM总是和信道编码(前向纠错编码)联合使用,并几乎都会使用频率和/或时间交织。 频率(子载波)交织可以增强频率选择性信道状况如衰落的抵抗能力。例如,当一部分信道带宽衰落时,频率交织将确保由带宽衰落部分的那些子载波产生的比特误差会分散在整个比特流上而不是集中起来。同样地,时间交织将确保在原来比特流里集中在一起的比特在发射时分开,这就使得当比特流以一个很高的速率传输时可能产生的强烈衰落有所缓解。

然而,时间交织对于缓慢衰落信道却没有好处,如:平稳接收信道。而频率交织对于平衰落(整个信道带宽同时衰弱)的窄带信号也没有好处。

交织在OFDM中的用处是分散比特流在纠错解码器中的错误,因为当这种解码器接受到集中的错误时将无法纠正所有的比特错误,于是就会出现突发性的未纠正的错误。基于OFDM系统常用的一种纠错编码是卷积编码,通常与RS编码一起使用。卷积编码作为内部编码,Reed-Solomon作为外部编码——通常在两层编码之间还会使用另外的交织(除了上面提到的时间和频率交织)。这两种纠错编码结合使用的原因是,当错误集中度高时,卷积解码使用的Viterbi解码器会产生突发的持续时间很短的错误,而这种错误很适合用Reed-Solomon编码来纠正。

Unit 6 移动通信

Unit 6-1

第一部分:移动通信

一个移动通信系统是指用户在这个系统中可以一边和别人互相通信,一边在物理位置上进行移动。例如:传呼机、蜂窝电话和无绳电话。移动性使得射频通信功能强大而且广为流行。用户所持的收发器叫移动单元、终端或手持单元。无线基础设施的复杂性往往要求移动单元只通过一些固定的、较昂贵的称为基站的设备进行通信。每个移动单元通过两个射频信道接收来自基站的信息并向基站发射信息,这两个信道分别称为前向信道或下行链路,以及逆向信道或上行链路。我们大多数讨论的是移动单元,因为和基站相比,手持单元构成市场极大的一块,它们的设计更接近于其他射频系统。 蜂窝系统

23 / 156

文档可能无法思考全面,请浏览后下载!

对于一个有限的可用频谱(例如:900MHz附近的一个25MHz的频谱),数十万人如何在拥挤的城区里相互通信?为了回答这个问题,首先考虑一种较简单的情况:几千个FM电台可利用88-108MHz的频带在一个国家里广播。这是可能的,因为在物理位置上相隔足够远的电台可使用同一载波频率(频率重用),而相互干扰可以忽略。两个电台的中间位置除外,这里接收到的两个电台信号强度相近。两个可以使用相同载波频率的电台的最小距离是由每个电台发射的信号功率所决定的。

在移动通信系统中,用蜂窝结构来实现频率重用概念,其中每一个蜂窝是六边形的,其周围环绕着6个其它的蜂窝,如图6.1(a)所示。频率重用概念是:如果位于中央的蜂窝使用频率f1进行通信,那么与其相邻的6个蜂窝就不能使用这个频率,但外面不直接相邻的蜂窝可再次使用这个频率。实际上,更有效的频率分配方式是如图6.1(b)所示的“7蜂窝”重用模式。注意:实际上每个蜂窝是使用了一组频率。

图6.1(b)中的每一个蜂窝中的移动单元都有一个基站提供服务,而所有的基站则有一个移动电话交换机构(MTSO)来控制。 同信道干扰

在蜂窝系统中,一个重要的问题是两个使用同一频率的单元之间的干扰有多大。这种干扰叫做同信道干扰,这一效应依赖于两个同信道单元之间的距离与单元半径之比,而与发射功率无关。给定频率重用方案,对于图6.1(b)所示的7蜂窝模式,这个比大约是4.6。可以看出,这个值导致信号-同信道干扰比为18dB 切换

当一个移动单元从蜂窝A漫游到蜂窝B时将会发生什么事情?因为从单元A的基站接收到的功率电平不足以维持通信,手机必须将服务器更换为单元B的基站。而且,由于相邻的蜂窝并不使用同一组频率,因此,移动单元还必须更换信道。这一过程叫做切换,是由MTSO来完成的。一旦基站A接收的电平低于某一阈值,MTSO将手机切换到基站B,希望后者足够近。这种策略失败的可能性比较高,会导致通话的中断。

为了改善切换过程,第二代蜂窝系统使手机能测量接收来自不同基站的信号电平,当到第二个基站的路径损耗足够低时进行切换。 路径损耗和多径衰落

在一个移动通信环境里,信号的传播是相当复杂的。这里只简单描述一些重要的概念。在自由空间里传播的信号会有功率损耗,其值正比于离开发射源的距离d的平方。然而实际上,信号是同时沿着直接路径和间接的反射路径进行传播的,如图6.2所示,在这种情况下,可以看出损耗随距离的四次方增大。在一个拥挤的区域里,实际的损耗情况可能对于某些距离是与d成比例,而对于另一些距离是与d成比例。

除了图6.2描述的总的损耗情况之外,还有一种机制会引起接收信号的强度随着距离而波动。由于图6.2所示的两个信号通常经受不同的相移,因此有可能到达接收端时相位相反,而幅度却大致相等,这样净接收的信号就可能非常弱。这种现象叫做多径衰落,当接收机移动波长的几分之一,会引起信号强度的很大变化。实际上,由于发射信号被许多建筑物和运

24 / 156

2

4

文档可能无法思考全面,请浏览后下载!

动的汽车反射,这种起伏是很没规律的。

25 / 156

文档可能无法思考全面,请浏览后下载!

分集

信号的衰落效应可以通过在发送或者接收信号时增加冗余来减小。“空间分集”或“天线分集”是采用两个或更多的天线,间隔为波长的几分之一,这样便能以较高的概率接收到无衰落的信号。

频率分集是指使用多个载波频率的情况,其思想是:在两个相距足够远的频率上不太可能同时发生衰落。

时间分集是另一项技术,数据被不止一次地发送或接收,以克服短期衰落。 延迟扩展

假设在一个多径环境里的两个信号有大致相同的衰减,却有不同的延时。这是可能的,反射或折射材料的吸收系数和相移相差很大,使得两条传播路径很可能呈现相同的损耗和不同的延迟。

在多径环境中,许多信号以不同的延迟到达接收机,产生的均方根延迟扩散可大到几个微秒,因而衰落带宽达数百千赫。这样,整个通信信道可能因这一个衰落而受抑制。

大的延迟扩散还引起另一个困难:如果延迟扩散可与数字调制波形的比特周期相比,则会收到延迟量不同的多个副本,导致相当可观的符号间干扰。 交织

多径衰落的性质,以及用于减轻这一问题的信号处理技术使得差错以比特串的形式出现。为了减小这些差错的影响,发送机中的基带比特流在调制前要先进行“交织”。交织器实质上根据接收端已知的某种算法打乱比特位的时间顺序。交织也可以看作是一种没有额外开销的时间分集(尽管它需要一定的等待时间)。

Unit 6-2

第二部分:第三代无线网络

数字网络使用的扩展已经导致了设计新的更大容量通信网络的需要。在欧洲,蜂窝型系统到2000年的需求预计将达到1500至2000万户,而美国(1995年)已经超过了3000万户。无线通信服务正以每年50%的速度增长,目前的第二代欧洲数字系统(GSM)预期在21世纪初达到饱和。随着更广泛的业务需求如视频会议、互联网服务、数据网络、多媒体等的发展,电信工业也在变化之中。对更大容量网络的需求导致了第三代通信系统的发展。

已提出的第三代通信系统之一是通用移动电信系统(UMTS),其目标是提供更大的灵活性,更大的容量,以及更紧密集成的业务。本节集中讨论UMTS的业务和目标。国际上也正在开发其它系统,不过预计其中许多技术将会整合到UMTS中来。

万维网(WWW)已成为重要的通信媒体,在过去几年内它的应用有了戏剧性的增长。这就产生了计算机网络业务需求的增长。为满足(适应)这一发展,电信系统正在被用于计算机网络、互联网访问和话音通信。一项WWW调查显示,60%以上的用户从他们的居住地访问互联网,那里的带宽常限于

25 / 156

文档可能无法思考全面,请浏览后下载!

28.8kbps。这就限制了互联网的使用,不能实现音频和视频的实时传输。也有更高的传输速率,例如综合业务数字网(ISDN)。这些技术提供快5倍的数据率,但访问成本也高得多。这就需要有更加综合的业务,提供更快的数据速度,以及对于各种业务更通用的接口。重点已经从提供固定话音业务转移到提供一个通用的数据连接用于各种各样的应用如话音、互联网访问、计算机网络等。

对计算机网络和互联网日益增强的依赖已经导致对“任何地方、任何时间”连接需求的增长,从而发展为对无线系统需求的增长。这种需求促使发展新的大容量、高可靠性的无线电信系统。

开发和部署第三代通信系统的目标在于通过提供大容量和综合无线网络克服现有无线系统的缺点。目前有好几个第三代无线通信标准,包括UMTS,cdmaOne,IMT2000,IS-95。 电信系统的发展

全世界已经提出了许多移动无线标准,看来还会出现更多的标准。

大多数第一代系统都是八十年代中期开始使用的,他们以模拟传输和采用频分多址(FDMA)这样的简单多址技术为特征。第一代电信系统例如先进移动电话业务(AMPS)仅提供话音通信功能。还存在用户容量小的问题,同时由于所用的无线电接口简单,也不够安全。

第二代系统出现于二十世纪90年代初,全部使用数字技术,使容量增加了三倍左右,这是通过发送前将话音波形压缩而实现的。

第三代系统是在复杂性方面对第二代系统的扩展,预计将于2000年以后推出。系统容量预计将扩大到原来第一代系统的10倍以上。这将通过使用复杂的多址技术如码分多址(CDMA)或者TDMA的一种扩展技术,以及改进已有业务的灵活性来实现。

表6.1和表6.2列出了北美和欧洲的一些主要蜂窝式移动电话标准。

图6.1给出现有业务和网络向融入一个统一的第三代网络这一目标的发展情况。当今许多分离的系统和业务例如无线电寻呼、无绳电话、卫星电话、公司的私人电话系统等将互相结合,由第三代电信系统来提供。 UMTS的总体目标

UMTS的主要目标是在无线和有线环境下提供更加统一的大容量网络。UMTS将使固定业务和无线业务融合在一起。将有三个不同容量的主要信道连接:移动数据率144kbps,可携带数据率384kbps,室内数据率2Mbps。它能提供2Mbps以下速率的业务和功能,否则这样的功能是由固定网络提供的。因此,UMTS必须提供按需的、可变的带宽分配。它还将把一系列用于个人、公司、居民区的应用结合起来,包括无绳电话、蜂窝式移动电话以及移动数据网络。 远程业务

UMTS有许多业务,可根据所要求的数据率、服务质量、可靠性和允许的误码率(BER)、实时传输速率来分类。每一种业务在延迟宽容度和允许的误码率方面有不同的特性。表6.3列出某些UMTS业务的特性。

数据性质将决定最适合的传输方式。与各业务相关的数据类型决定了可支持该业务的环

26 / 156

文档可能无法思考全面,请浏览后下载!

境类型。 UMTS环境

27 / 156

文档可能无法思考全面,请浏览后下载!

UMTS的目标是提供“任何地点、任何时间”的服务,因此工作环境将随用户位置而变化。无线系统必须在其中工作的环境影响系统的容量以及可提供业务的种类。表6.4列出一些UMTS将要求提供覆盖的环境。

每一种环境所支持的最大数据率与对该环境提供足够覆盖所要求的蜂窝单元大小有关。 蜂窝单元的类型

需要使用蜂窝网络以保证UMTS提供一个大容量的网络系统。和任何蜂窝系统一样,网络的总容量依赖于所用蜂窝的大小。蜂窝愈小总容量愈大。不过蜂窝大小受到可建立的基础设施的数量限制。蜂窝单元的大小也决定了每个蜂窝的最大信道容量,因为传播效应如多径和衰落迫使大的单元只能使用较低的数据率。大的单元还必须为大量用户服务。由于单元容量大致上是固定的,每个用户只能使用相对于小单元的低数据率。为了优化蜂窝网络有三种类型的蜂窝单元,即微微蜂窝,微蜂窝,宏蜂窝。三种蜂窝在蜂窝大小和总容量以及业务之间实现折衷。表6.5给出UMTS中使用的三种蜂窝单元以及一些蜂窝的性质。

每种蜂窝单元的覆盖范围大小和类型导致所面临的无线电传播问题。这将决定所用的最适合的无线电发射技术。 无线电接口

UMTS的目标之一是提供可与有线连接相当的无线电接口。在一个大范围无线环境中提供灵活、传输容量按需分配的2Mbps宽带业务将要求无线电接入技术方面的变革。

当前正在对无线电接口进行大量科研,涉及到对CDMA和TDMA性能比较的研究。现在看来CDMA最有可能成为支持所要求高数据率的候选技术。然而其它技术如COFDM和混合解决方案也有可能适合于UMTS。 卫星网络

UMTS的目标之一是提供“任何地点、任何时间”的接入。然而限于高昂的基础设施成本,蜂窝网络只能覆盖有限区域。由于这个原因,卫星系统构成UMTS网络的一个主要的部分。卫星将对边远地区、空中和海上提供延伸的无线覆盖。无线系统与地面蜂窝网络的结合程度正在研究之中。一个完全结合的解决方案将要求移动电话是双重模式的,同时允许与轨道上运行的卫星和地面上的蜂窝式系统通信。低地球轨道(LEO)卫星是提供全球覆盖的最可能候选技术。

目前正在部署多种低地球轨道卫星系统用于提供全球电信服务,包括Teledesic系统,它有288个卫星,计划于2002年底投入运行,向世界实际上所有地方提供大带宽的双向通信。然而Teledesic系统将无法满足20%的需求,因此提出了宽带(broadband)无线网络的要求。 系统实现时间表

世界各地都在向实现第三代系统前进。日本期望到2000年建立系统并投入运行。这是由对移动通信的需求变得如此巨大,因而第二代蜂窝网络正在开始超出容量极限这一事实所驱动的。预期欧洲到2005年将出现宽带CDMA系统。美国预计在2000到2010年之间的某一

27 / 156

文档可能无法思考全面,请浏览后下载!

时间实现第三代系统。

制造商正在制定好几个标准以满足世界各地的需求。至今大多数系统是基于CDMA标准的。在基础设施方案公布以前,第三代系统的发展将是基于地区的。

28 / 156

文档可能无法思考全面,请浏览后下载!

这一过程正在得到国际电信联盟(ITU)制定IMT2000标准的指导。ITU将于2000年完成IMT2000标准,其目的是将地区性系统纳入统一的标准。 结论

未来通信将由提供更加综合的大容量和广泛覆盖的业务这一需求所推动。对于21世纪的用户,理想的情况是在移动和固定网络接入的服务能力方面应该没有区别。这将通过使用包括卫星通信、先进的无线网络技术、高速固定网络在内的许多技术来实现。

Unit 7 卫星通信

Unit 7-1

第一部分:通信卫星的应用

通信卫星(有时缩写为comsat)是为了通信而停留在太空中的人造卫星。现代通信卫星使用多种轨道,包括对地静止轨道、椭圆形轨道、低地球轨道(过极地和不过极地)。

对于固定的(点对点)服务,通信卫星为海底通信光缆提供了技术补充。它们也可用于如船、车辆、飞机和手持终端的移动通信,用于电视和无线电广播,以及应用其它技术,比如电缆,是不现实或不可能的地方。 电话

通信卫星第一次也是历史上最重要的应用是国际电话。固定电话将通话传输到地面站,在那里再发射到对地静止卫星上。接着在向下链路中是类似的路径。相反,移动电话(船和飞机上接收和发送的)必须直接连到设备上把信号上传到卫星,又能确保在有干扰时的卫星指向,如船上的电波干扰。

海底通信电缆的改进导致了20世纪后期用于固定电话的卫星应用有所下降。在城市中使用的手机不使用卫星通信。相反它们接入地面上用于接收和发射的星罗棋布的基站群。 卫星电视和无线电台

电视成为主要市场,其对相对很少的大带宽信号同时传送给很多接收机的要求更好地匹配了对地静止通信卫星的性能。北美电视电台使用两种类型的卫星:直播卫星和固定服务的卫星。

直播卫星是一种通信卫星,它直接向小型DBS卫星天线发射(通常直径为18到24英寸)。直播卫星通常工作在微波Ku波段的较高部分。直播技术用于直接到家的卫星电视服务。

固定业务卫星用C波段和Ku波段的较低部分。它们通常用于向电视网和加盟的地方电视台馈送或收集广播节目,也用于中小学和大学的远程教学、商业电视、视频会议和一般商用通信。固定服务卫星也可用来把国家有线电视频道分发给中央控制单元。

FSS(固定业务卫星)与DBS(直播卫星)的不同之处在于固定业务卫星具有更低的射频功率输出,需要更大的碟形卫星接收天线(对于Ku波段直径为3到8英尺,对于C波段直径为12英尺以上),收发器的射频输入和输出也都采用线极化(而直播卫星采用圆极化)。

28 / 156

文档可能无法思考全面,请浏览后下载!

固定业务卫星技术在美国从20世纪70年代后期到90年代初期,以TVRO(仅电视接收)接受器和天线的形式最初用于DTH卫星电视。

29 / 156

文档可能无法思考全面,请浏览后下载!

1994年,当第一个美国DBS提供者(Direct TV)开始运行,一切都改变了,它夺去了FSS卫星技术在DTH节目方面的风头。但是FSS卫星在C波段和Ku波段仍然用在有线和卫星电视频道中,例如CNN频道,天气频道,HBO(家庭影院)及其它方面,分配给有线电视数据转发器和DBS提供者,提供者把这些信道再分配给他们自己的系统。

免费的卫星电视频道也通常分配在FSS卫星的Ku波段。在北美的国际通信卫星美洲5号,银河10R和AMC三颗卫星在他们的Ku波段收发器上提供相当多的FTA频道。

美国Dish网络DBS业务也使用FSS技术,由于传输地方电视台节目需要更大的容量,传输HDTV频道节目需要更大的带宽。现在已经发射了在Ka波段具有转发器的通信卫星。NASA(国家航空航天局)近来也发射了使用Ka波段的实验卫星。

北美以外的地区,尤其是欧洲,固定业务和直播卫星的定义显得有点模糊。欧洲大部分用于直播的卫星使用与北美DBS级同样级别的功率输出,却使用与FSS卫星一样的线性极化。因此,FSS和DBS这两个术语更多地在整个北美洲这样用,而在欧洲却很少。 业余无线电

业余无线电爱好者有权使用被设计成承载业余无线电通信流量的OSCAR卫星。大多数这样的卫星作为太空中继器,通常被装备UHF或VHF设备并使用高度方向性天线如八木天线或抛物面天线的业余无线电接入。由于地面业余设备限制,大多数业余卫星发射到低地轨道上,并设计得只能在任何给定时刻进行有限次数的简短接触。有些卫星用AX.25或相似的协议来提供数据转发业务。 卫星宽带

20世纪90年代以后,卫星通信技术通过宽带数据连接被用来作为连接因特网的一种方式。这对于位于边远地区,不能接入有线宽带网络或拨号上网的用户非常有用。

Unit 7-2

第二部分:卫星因特网接入

卫星因特网服务用在地面因特网不可用和频繁移动的地方。通过卫星的因特网连接在全球均可实现,包括海洋中的船只和陆地上移动的车辆。有三种卫星因特网服务:单向多播卫星接入,地面回传单向卫星接入和甚小口径(天线)终端(双向)卫星接入。 单向多播

单向多播卫星因特网系统用于IP多播数据、音频、视频的发布。在美国,仅仅上行站需要联邦通信委员会的许可证,用户不需要。注意,大多数互联网协议不能在单向接入情况下正常工作,因为它们要求一个回馈信道。互联网内容如Web页面仍能通过单向系统发布,这是通过将内容“推”向终端用户的局域存储器实现的,尽管不能实现真正的交互性。这很像电视或无线电内容,提供很少的用户界面。

29 / 156

文档可能无法思考全面,请浏览后下载!

系统硬件组成:类似于单向地面回传,卫星互联网接入可包括与公共交换电话网之间的接口用于内部通话。不需要因特网连接,但许多应用包括一个文件传输协议(FTP)服务器以将待广播的数据排成队列。

系统软件的组成:多数的单向多播应用需要远端的客户编程。远端的软件必须对数据进行过滤、存储、提供选择界面并显示。发射站的软件必须提供数据的接入控制、按优先级形成队列、发送、封装。 地面回传单向接入

单向地面回传卫星因特网系统与传统的拨号接入互联网一起应用,通过电话modem将数据传出,而通过卫星以接近宽带互联网接入的速度进行下载。在美国,仅对上行站需要联邦通信委员会的许可证,用户不需要。 系统硬件组成

发射站(也被称为电讯港,首端,上行设备或集线器)有两个部分:

— 因特网连接:互联网服务提供商的路由器连接到代理服务器,对用户流量实行并保证服务质量(QoS)带宽限制。接着再连接到DVB封装器上,其连接DVB-S调制解调器。来自DVB-S调制解调器的射频信号连接到上变频器,上变频器通过馈线连接到室外单元。 — 卫星上行链路:块上变频器(BUC)和可选择的低噪声变频器,用波导联到一个接在馈电喇叭上的可选直接式收发转换器,它被用金属支撑安装在卫星天线和支架上。 在远端(地面站)的设置组成:

— 户外单元(具有底座、馈电喇叭、Ku波段通用的LNB和馈线的卫星天线)

— 室内单元(计算机内部的DVB-S外围组件互连卡,或者DVB外置式调制解调器,通过以太网端口或USB端口连接到计算机)。

根据提供商的合同条款,使用单向卫星互联网的一种低成本的方法是用通用分组无线业务(GPRS)作为返回链路。通过使用标准GPRS提供的9600bps连接,上传量很小。此外由于该项业务不是按时间计费,而是按上传数据流量计费的,用户可以宽带速度进行浏览和下载。有些公司提供速度可达24Mbps。用GPRS作为回传的另一个理由是由卫星提供业务时的机动性,卫星发射场在50dBW到53dBW之间。使用33厘米宽的卫星天线、一台笔记本和配有正常GPRS的GSM手机,用户在任何地方都可以获得宽带。 系统软件组成部分

远程节点在提供认证和设置代理服务器时要求最少的编程,DVB卡驱动器通常提供过滤功能。

通常,用非标准IP堆栈解决卫星连接中的潜伏期和非对称问题。通过卫星链接的数据发送通常被加密,因为否则拥有卫星接收器的任何人都可获得。

许多卫星IP的实现在终端使用成对的代理服务器,这样客户端和服务器就不必承受卫星连接中固有的延迟。因为类似的原因,有用于卫星链接而设计的专门的虚拟专用网(VPN)实现,因为标准的VPN软件不能处理长包传输次数。

上传速度受制于用户的拨号modem,延迟量很大,对任何基于卫星的互联网业务都是如

30 / 156

文档可能无法思考全面,请浏览后下载!

此。下载速度相比拨号来说是很高的:通常提供1Mbps、4Mbps和16Mbps的包。

31 / 156

文档可能无法思考全面,请浏览后下载!

工作原理

卫星调制解调器的后面板,具有输入输出信号的同轴连接,和一个以太网端口连接到因特网。

在地面发送站远地使用代理服务器,其设定为向服务质量服务器发送所有的外传数据,服务质量服务器确保用户不超过分配带宽或每月的通信流量限制。流量被发送到封装器中,把IP包放入DVB包中。DVB包被送到DVB调制解调器中,接着被送到发送器。 双向

双向卫星互联网服务通过卫星把数据从远程站点发送到一个网络集线器(Hub),然后再把数据发送到因特网。每个位置的卫星天线必须精确地放置以避免和其它卫星的相互干扰。一些雷达探测器的振荡器会引起这些系统的干扰。同样,每个位置都必须使用功率管理来调节发射功率以补偿像降雨衰落这样的情况。有几种双向卫星互联网服务,如时分多址或单路单载波(SCPC)。

每个远程位置也装备有电话调制解调器;这种连接与传统的拨号ISP一样。双向卫星系统当延迟比带宽更重要时在两个方向均会使用modem信道传输数据,而为下载保留卫星信道,因为此时带宽比延迟更重要,例如对于文件传输。

上行速度很少超过1Mbps,而延迟可达到1秒。卫星电话服务在相对较低的2400 bps速度下也可提供数据服务。

国际移动卫星组织提供了三种双向卫星因特网服务:宽带全球局域网(BGAN)、宽带全球区域网和移动包数据交换业务,它们都不需精确地调整,但速度要比基于碟形卫星天线的系统低,而且带宽花费也更大。BGAN有着最高的数据速率。

在2006年,欧洲委员会赞助了UNIC项目,其目的是发展一个端到端的科学测试基地,用于通过低成本双向卫星将新型宽带交互式电视中心服务传送到真正的家庭终端用户。UNIC结构对下行链路采用DVB-S2标准,上行链路采用DVB-RCS标准。

Unit 8 光通信

Unit 8-1

第一部分:电磁频谱

仔细研究表8.1中的频率表可以看到各种用于信息传输的光学技术的潜力。

人们所感兴趣的“现代”常规通信系统的信息传播速率通常相应于电话系统中的音频、商用广播系统中的无线电频率、或是最先进的视频节目分配系统中的数字电视数据率。这些数据率通常低于几个吉赫兹(GHz)。如果传输这样的信息不是将它加载到光纤上,而是加载在略高于最大速率的射频载波上,则此射频载波就会是厘米波或是波长更长一些的波。用光载波则有很大的优越性。一个明显的优点就是光纤的低损耗和方向性。载波的数据率显然必须高于信息速率。通信系统的一个基本原则是频率愈高,技术就愈复杂。处理微波就比处

31 / 156

文档可能无法思考全面,请浏览后下载!

理无线电波更困难。随着波长减小到接近于电路元件的尺寸,电路单元就不再是集总的,导线可起到反射元件以及(或)天线的作用,集总单元则成为电磁谐振器。这通常意味着当发送的信息较多时,代价也较高,因此在较高的信息率要求较高的频率这层意义上,要考虑

32 / 156

文档可能无法思考全面,请浏览后下载!

传输信息的每个bps的成本问题。于是,观察上述频率表得到的第一个结论就是,对于频率为数百特赫兹(THz)的光载波而言,信息的带宽在某种意义上是免费的。就是说与大多数器件相比,光的波长是如此之小,以至于所用技术与电和微波有根本的不同。一旦我们具备了这样的技术,则无论信息率有多高,再也没有必要改变载波了,因为载波频率高于任何现实信息率所能达到的程度。不过带宽也不是完全免费的,因为编码器和解码器必须工作在相应于信息率的频率上,而系统其余部分大都只需要处理载波和调制。如果一个元件可以工作在510Hz的频率上,在这个频率信息偏移千分之一(相应于500吉赫兹的信息率)对器件的性能将没有什么影响。因此,只要系统已经建立起来,大体上就可以随意升级系统而不会涉及常规系统中改变电磁载波所需付出的那种代价。

光波的宽频带一个结果就是光载波可以同时携带许多不同电话信号和电视节目等。通常实现这种同时传输多路信息的过程(至少以同步格式实现)称为时分复用。其原理是:如果要复用16个1 Mbps的不同信道,可将每一比特所占时间除以16,然后将16个数据比特交织成一个持续1微秒的复合比特(即比特率为1 Mbps),这一复合比特实际上带有16比特的信息。电话通信所用的数据率是64kbps,光载波数百个Tbps带宽使实现TDM有了极大的可能。当然,TDM并不是人们可以使用的唯一复用方案。可以设想将相隔几个吉赫兹的若干子载波加载到光载波上。其中每一个载波又可以信息频率被调制,然后在输出端按其不同的载波波长重新分离。根据实现方法,这种方案称为波分复用(WDM)或子载波调制。现在有许多随着不断增大的信息流量而扩大链路吞吐量的方案,都涉及到将许多TDM信号与WDM载波结合的技术。实际上,WDM密度所受到的限制并不是带宽而是功率。就是说,每个信道要求有一定的功率。于是信道愈多所需功率也愈大。在达到一定的功率时光纤的非线性变得重要起来,这种非线性往往使信号混合在一起。目前正在进行大量的研究,努力寻求对这种非线性的均衡处理。

光载波极高的载波频率也有缺点,当它通过光速与光的波长相了解时尤其如此。光波的周期不到2毫微微秒(210

15

14

秒)。这意味着对相位的控制要达到毫微微秒级以下的时间

间隔。虽然这种技术正在出现,但它们十分复杂,比处理微波或射频的波形复杂得多。因为这样,相干光的接收至今仍然是一项实验室技术。随着信噪比的提高,看来稀土金属掺杂光纤放大器的发展使通信系统中不再需要用相干技术。

光波的周期短还意味着半微米左右的短波长。光波波长之小使发射和接收模块得以小型化,这就使光通信系统的尺寸、重量以至价格与相应的微波、无线电波通信系统相比都大为降低。在微波情况下,开放的微波信道排列的密度愈高,窜音就愈严重。另一方面,无论将光纤包装得多紧密,只要包层设计得当基本上就不会有窜音。这导致光纤可用作空分复用(SDM)极佳媒体这样的优良性质,就是说,可将多个传输不同信息流的信道紧密地封装在一起。

虽然相干光通信系统的所有优点还有待于落实在具体成果中,光辐射的另一性质却使目前的光通信系统不利于应用。这里,重要的性质是光子能量的属性。如表8.1所示,光子能量大约在2eV到4eV之间。看起来这是效率方面的一个优点。不过,具有这样的光子能量需要付出高昂的代价。因为单个光子是可检测到的,发射/接收过程必然具有颗粒性。如所周

32 / 156

文档可能无法思考全面,请浏览后下载!

知,即使在一场稳定的降雨中,雨滴落地的概率(作为时间的函数)服从Poisson分布,这意味着有成串的雨滴。一滴雨更会在前一滴落下之后立即落下。雨滴是缺乏耐心的,不会等待。几乎以同样的方式,即使在恒定偏置电流条件下激光也发出光子束。这就产生一种噪声,通常称为散粒噪声或量子噪声。在发射/检测过程中,这一问题对于模拟通信变得相当严重,尽管在数字通信中要轻微得多。

33 / 156

文档可能无法思考全面,请浏览后下载!

由于单个光子是可测量的,光量子检测器能在室温下工作。因此如果散粒噪声受到限制,光的直接检测会十分灵敏。另外,直接检测与强度调制方案完全兼容,在这些方案中光源实质上只是简单地接通和断开。这种调制方案最容易实现。光的波长很小,可以使用小型的光源和检测器以及微米级的波导,于是用直接检测方案可实现在许多领域具有竞争力的小巧的宽带系统,这些领域中特别引人注目的是当前电信传输中的应用,尽管无数其他应用也在不断涌现出来。如前所述,(线路)成本并非电信系统中真正重要的考虑因素,通信设备的成本主要受到其他因素的制约,因此这些应用比预料的出现得慢。在消费电子学中,我们不必操心通路的权利或安装问题。现在用光技术将相距几米的个人计算机连接起来是如此昂贵,使得光纤还未能进入消费市场。但是在这种情况下连接的高昂成本并不是根本性的问题,而是一个历史阶段性的问题。目前在毫米级纤芯塑料方面的发展就是一个采用比玻璃光纤便宜得多的技术的实例。光纤连接的元件成本和封装成本正在下降,新的应用也正在出现。

Unit 8-2

第二部分:光纤

光纤是一种玻璃的或塑料的纤维,用来沿其长度方向引导光,把尽可能多的光限于一种传播形式。在具有大的纤芯直径的光纤中,这种限制是基于全内反射。在小的纤芯直径的光纤中,(广泛用于200米以上的大多数通信链接)限制是依赖于建立波导。纤维光学是应用科学和光纤工程的结合。光纤广泛应用于光纤通信,它允许长距离传输和数据速率比有线和无线通信的其它形式更高。它们也被用来构成传感器及其它的各种应用。

光纤一词涵盖了各种不同的设计,包括渐变折射率光纤和阶跃折射率光纤。基于光在光纤中的传播方式的不同,光纤分为单模光纤和多模光纤,其中单模光纤包括非零色散位移光纤和色散位移光纤。一根光纤根据其设计和在其中传播的光的波长,可以是单模的也可以是多模的。由于较常见的玻璃光纤的机械特性,需要用特别的方法熔接光纤以及把它们连接到其它设备。光纤制造过程是将化学掺杂的预制棒部分融化,并在一个拉丝塔上拉长流动的原料。根据使用方式,光纤可做成不同类型的光缆。 光纤通信

33 / 156

文档可能无法思考全面,请浏览后下载!

由于光纤的柔韧性以及可捆扎成光缆,所以它可以用作通信和网络的媒介。对于长距离通信特别有利的,因为光在光纤中的传播相比于电缆具有极小的衰减。这使得长距离通信只需要很少的中继器。此外,在光纤中传播的光信号可以调制到高达40 Gbps的速率,每一根光纤能作为许多独立的信道,每个信道用不同波长的光来调制(波分复用)。总体上, 单根光缆可携带数据高达14.4 Pbps(大约1400万Gbps)。对于短距离,如大厦内部的网络,光纤可以节省电缆管道的空间,因为单根光纤比单根电缆可携带更多数据。光纤也不会受电干扰的影响,防止了不同光缆中信号之间的串话以及环境噪声的介入。此外,相比电连接窃听是更困难的,有防窃听的双芯光纤。因为光纤是不用电的,它能横跨很高的电位差,能用于存在爆炸烟雾的环境下而没有燃烧的危险。

虽然光纤可用透明塑料、玻璃、或两者的结合制成,但用于长距离通信的光纤都是玻璃的,因为其光衰减较低。多模和单模光纤都可用于通信,多模光纤大都用于短距离(到500米),而单模光纤用于长距离的链接。由于将光耦合到单模光纤或在单模光纤之间耦合(纤芯直径大约为10微米)的允差较小,单模发射器、接受器、放大器和其它元件的价格通常比多模元件的贵。 光纤传感器

光纤可用作传感器来测量张力,温度,压力和其他参数。 小的尺寸以及在偏远位置不需要电力使得光纤传感器在某些应用上要优于传统的电传感器。

光纤可用作地震或声纳应用中的水听器。已经开发出了每根光缆带有一百多个传感器的水听器系统。水听器传感系统可用于石油工业以及少数国家的海军。船底装有水听器阵列和拖缆系统已投入使用。德国公司森海塞尔已经开发了一种与激光和光纤一起工作的微型麦克风。

温度和压力光纤传感器已经开发出来,用于油井的井下测量。光纤传感器非常适合这种环境,因为它能工作在对半导体传感器而言太高的温度下。

光纤用作传感器的另一个应用是光学陀螺,可用在波音767和一些汽车模型(导航目的)以及氢微传感器中。

光纤传感器已被开发用来以很高的精确度同时测量同一点的温度和张力。这一点对于从小的复杂结构中获取信息是特别有用的。 光纤的其它应用

光纤广泛用于照明应用。它们被用来作为医学和其它应用中光导,在这些应用中只需要明光照亮目标而不需要一个清晰的直线路径。在一些建筑物中,光纤将房顶的阳光引入到建筑物的其它地方。光纤照明也可用于装饰性的应用,包括标志,艺术和人造圣诞树等。 光纤也被用于成像光学。光纤的相干光束,有时和镜头一起用于长而薄的成像设备,称为内窥镜,它可以通过一个小孔来观察目标。医学内窥镜用于微创探测或外科手术(内窥镜检查法)。工业内窥镜用于检查任何难以达到的地方,如喷气发动机内部。

掺杂某些稀土元素如铒的光纤,可作为激光或光放大器的增益介质。掺杂稀土的光纤可以通过一小段掺杂光纤熔接到正常(非掺杂)光纤将信号放大。除了信号波外,耦合到光纤

34 / 156

文档可能无法思考全面,请浏览后下载!

线路的另一个激光波长被泵浦(注入)到掺杂介质的光纤中。两个光波长在掺杂光纤中传输,第二个泵浦波长向信号波传输能量。这个放大过程是受激发射。

光纤可用于给处于用电困难环境的电子设备提供低的功率(约一瓦特)。例如,高性能天线单元的电子设备和高压传输设备中的测量装置。

35 / 156

文档可能无法思考全面,请浏览后下载!

工作原理

光纤是一个圆柱形的电介质波导,通过全内反射沿其轴传播光。光纤由一个被包层包围的纤芯组成(图8.1)。为了将光信号限制在纤芯中,纤芯的折射率必须大于包层的折射率。纤芯和包层之间的分界线在阶跃折射率光纤中是突变的,在渐变折射率光纤中是逐渐变化的。 多模光纤

纤芯直径大(大于10 μm)的光纤可用几何光学加以分析。根据电磁分析,这种光纤称为多模光纤。在阶跃折射率多模光纤(图8.2)中 ,由于全内反射光线沿光纤纤芯传播。当光线射到纤芯和包层之间界面的角度(与垂直于边界的直线之间的夹角)大于临界角时,光线被完全反射。临界角(全内反射的最小角)是由纤芯和包层材料折射率的差异决定的。以小角度射到分界面上的光线被折射,从纤芯进入包层,它们并不沿着光纤传输光,因而也不传输信息。临界角决定了光纤的接收角,通常记为数值孔径。大的数值孔径使光能以接近于轴线的方式沿光纤传播,也能以不同的角度传输,从而使得光能有效地耦合进入光纤。然而,大的数值孔径增加了色散的总量,因为以不同角度传播的光线具有不同的光程长度,因而化了不同的时间穿过光纤。所以小的数值孔径是我们希望的。

在渐变折射率光纤中(图8.3),纤芯的折射率在轴线和包层之间连续减小。这使得光线到达包层时是平滑地弯曲,而不是在纤芯包层边界上突然反射。由此产生的曲线路径减小了多径色散,因为大角度光线更多经过低折射率的纤芯外围,而不是高折射率的中心。我们要选择使光纤中不同光线的轴向传播速度差异最小的折射率曲线图。这个理想折射率曲线图是折射率和离开轴线的距离之间十分接近抛物线关系。 单模光纤

纤芯直径小于传播光波长10倍左右的光纤不能用几何光学来建模。而它必须作为电磁结构通过解Maxwell方程组来分析,Maxwell方程组可化为电磁波的波动方程。我们也需要电磁分析来理解譬如相干光在多模光纤中传播时出现斑点。作为光波导,光纤支持一个或多个光能沿光纤传播的受限横模。仅支持一个模式的光纤被称为单模光纤。大纤芯的多模光纤可以使用波动方程建模,这表明这种光纤支持一个以上的传播方式(由此得名)。多模光纤这样建模的结果和几何光学的预测大体是一致的,如果光纤的纤芯足够大可以支持多过几个模式。

波导分析表明,光纤中的光能并不完全局限在纤芯。相反,尤其是在单模光纤中,束缚

模中相当一部分能量作为渐逝波在包层中传输。

最常见的单模光纤的纤芯直径为8至10 μm,并设计用于近红外区。其模式的结构依

赖于所使用的光波长,以致这种光纤实际上只支持在可见光波长的少量的另外模式。相比之下,多模光纤的纤芯直径可小到50微米,大到数百微米。

35 / 156

文档可能无法思考全面,请浏览后下载!

Unit 9 数字信号和信号处理

Unit 9-1

第一部分:数字信号处理

36 / 156

文档可能无法思考全面,请浏览后下载!

数字信号处理(DSP)是研究数字表示的信号以及这些信号的处理方法。数字信号处理和模拟信号处理是信号处理的子领域。数字信号处理包括音频及语音信号处理、声纳和雷达信号处理、传感器阵列处理、谱估计、统计信号处理、图像处理、通信信号处理、生物医学信号处理等子领域。

数字信号处理的目标通常是测量连续的真实世界的模拟信号或对其滤波,因此,第一步常常是使用模数转换器将信号从模拟形式转换成数字形式。通常,要求的输出信号为另一个模拟输出信号,这就需要数模转换器。

数字信号处理的算法有时通过使用专用计算机来实现,它们(专用计算机)利用被称为数字信号处理器的专用微处理器(简称DSP)。这些数字信号处理器实时处理信号,通常是针对具体目的而设计的专用集成电路(ASIC)。当灵活性和快速开发比大批量生产的成本更重要时,DSP算法也可以用现场可编程门阵列来实现。 数字信号处理域

在数字信号处理中,工程师通常在下面几个域的一个域中来研究数字信号:时域(一维信号),空域(多维信号),频域,自相关域以及小波域。他们按照某些依据来猜测(或试验不同的可能性)那一个域能够最好地表示信号的本质特性来选择在其中进行信号处理的域。从测量设备得到的样本序列产生(信号的)时域或空域表示,而离散Fourier变换则产生频域表示即频谱。自相关定义为信号与其自身经过时间或空间间隔变化后的互相关。 信号采样

随着计算机应用的增长,数字信号处理的使用和需求日益增多。为了能够在计算机上使用模拟信号,必须使用模数转换器(ADC)对其进行数字化。采样通常分两步实现:离散化和量化。在离散化阶段,信号空间被分割为相等的区间,用相应区间的代表性信号值代替信号本身。在量化阶段,用有限集中的值来近似代表性的信号值。

为了能够正确地重建被采样的模拟信号,必须满足奈奎斯特-香农采样定理。定理规定:采样频率必须大于两倍的信号带宽。实际应用中,采样频率通常远大于信号带宽的两倍。最常用的带宽是:DC~BW(基带);以及fcBW,即以载波频率为中心的频带(直接调制)。

数模转换器(DAC)用来将数字信号转换回模拟信号。数字计算机的使用是数字控制系统的关键因素。 时域和空域

时域和空域中最普通的处理方法是用一种叫做滤波的方法增强输入信号。滤波通常由在输入或输出信号当前样本周围的许多样本的某种变换组成。有很多表示滤波器特性的方法,例如:

 “线性”滤波器是对输入样本的线性变换;其他的滤波器为非线性的。线性滤波器满足

叠加条件,就是说,如果输入是不同信号的加权线性组合,输出就是(各信号)相应输出的同样加权线性组合。

 “因果”滤波器仅使用以前的输入或输出样本,而“非因果”滤波使用将来的输入样本。

通常“非因果”滤波器可以加延迟使其成为“因果”滤波器。

36 / 156

文档可能无法思考全面,请浏览后下载!

 “时不变”滤波器对时间具有不变的性质,诸如自适应滤波器等其它滤波器随时间而改

变。

 有些滤波器是“稳定的”,其它的是“不稳定的”。稳定的滤波器产生的输出信号随时间

收敛于一个不变的值,或在有限的时间间隔内保持有界。不稳定滤波器的输出是发散的。

37 / 156

文档可能无法思考全面,请浏览后下载!

 “有限脉冲响应”(FIR)滤波器仅使用输入信号,而“无限脉冲响应”(IIR)滤波器同

时使用输入信号和以前的输出信号样本。FIR滤波器总是稳定的,而IIR滤波器可能是不稳定的。

 多数的滤波器可以通过传输函数在Z域(频域的扩展集)中描述。滤波器也可以用差分

方程或一组零极点表示,对于FIR滤波器还可以用冲击响应或阶跃响应表示。对于任何给定输入,FIR滤波器的输出可以通过输入信号和冲击响应的卷积来计算。滤波器还可以用结构图来表示,它能用来推导样本处理算法,以便使用硬件指令实现滤波器。 频域

信号常常通过Fourier变换从时域或空域变换到频域。Fourier变换将信号信息变换成每个频率的幅度和相位成分。Fourier变换常常被变换成功率谱,它是每个频率分量平方的幅度。

用频域对信号进行分析的最一般的目的是分析信号的特性。工程师可以研究频谱来得到输入信号中有哪些频率信息,而哪些频率是没有的。

有一些常用的频域变换。例如倒谱用Fourier变换将信号转换到频域,取对数,然后再作第二次Fourier变换。这就强调了幅度较小的频率成分同时保持了频率分量的数量级。 应用

数字信号处理的主要应用是音频信号处理,音频压缩,数字图像处理,视频压缩,语音处理,语音识别,数字通信,雷达,声纳,地震学和生物医学。具体的例子有数字移动电话的语音压缩和传输,高保真音乐的空间匹配均衡和语音加强应用,天气预报,经济测报,地震数据处理,工业过程的分析控制,电影中的计算机动画整理,医学成像如计算机断层扫描和磁共振成像,图像处理,高保真扬声器分频和均衡,以及电吉他扩音器所使用的音效。 实现

数字信号处理通常使用专用的微处理器来实现,如MC56000和TMS320。它们通常使用定点算法处理数据,尽管也有一些使用浮点算法,运算能力更强大。比较高速的应用可选用FPGA来实现。从2007年开始,已经开始出现DSP的多核实现。对于使用量大的高速应用,可以专门设计ASIC。对于低速应用,速度较慢的传统处理器如微控制器就能处理。

Unit 9-2

第二部分:数字信号处理的基本概念

数字计算机和用来实现各种信号处理功能的专用数字电路的应用需求非常大,这些功能过去都是使用模拟设备来实现。便宜的集成电路的不断发展产生了许多微计算机和小型计算机来实现各种信号处理功能。现在有可能在比以往全模拟系统小得多,而且成本也低得多的限制下构成专用数字处理器。

37 / 156

文档可能无法思考全面,请浏览后下载!

我们将讨论数字信号处理的基本概念,为此,适当地讨论一些常用术语和假设。可能之处,定义和术语将依照IEEE音频和电声小组的推荐。

模拟信号是定义在连续时间上的函数,其幅度取值是连续的。一些通常的例子有正弦函数,阶跃函数,麦克风输出信号等等。“模拟”这一术语显然是来自于模拟计算领域,其中电压和电流用来作为物理变量,但它的用处已经扩展了。

连续时间信号是定义在连续时间上的函数,但是它的幅度可能是连续值也可以是有限的可能值。本文中,我们将模拟信号看成是连续时间信号的一个特例。然而实际应用中,“模拟”和“连续时间”这两个术语可以随意互换使用,通常表示同一个意思。由于“模拟”一词与物理类比的关联,已经确立了优先使用“连续时间”这一术语。不过有时为了清楚起见也用“模拟”一词,特别是与“数字”相了解时。

术语“量化”描述了用一组离散值来表示变量的过程。经量化的变量只能取离散值。 离散时间信号是定义在某些特定时间值上的函数。这意味着独立变量时间被量化了。如果离散时间信号的幅度可以取连续值,那么函数称作采样数据信号。采样数据信号可以在离散时间值上对模拟信号采样得到。

数字信号是时间和幅度都被量化的函数。数字信号总是使用一系列数来表示,其中每个数用有限个数字表示。

“离散时间”和“数字”这两个术语在实际中经常互换,表示同一个意思。许多基于离散时间信号的定理适用于纯数字信号,因此没有必要总是对两者作严格的区分。理论发明更多地用到“离散时间”这一术语。而“数字”这一术语则更多地用来描述软硬件的实现。

根据使用的硬件或软件的类型和当前信号的类型,一个系统可以用任意的前述术语来描述。可参考模拟系统,连续时间系统,离散系统,数字系统等。

线性系统可使用叠加原理。线性系统可以用线性的微分或差分方程来描述。线性时不变系统就是参数是不变的,不会随时间变化而变化的系统。

集总系统是由有限非零元素构成,满足常微分(或差分)方程的系统,与满足偏微分方程的分布式系统相对应。

数字信号的数字处理的标准形式是二进制数字系统。二进制数字系统仅使用0和1来表示所有的可能值。m值可用n位二进制数字来表示,m= 2。反过来,如果m是要求的等级数,所需的比特数是大于等于log2 m的最小整数。

实现数字处理的过程将用一个简化系统来说明,假定信号在0V到7V之间变化,以1V为增量,用8种可能的值表示成二进制数。图9-1显示了方框图,图9-2画出了我们所感兴趣的一些波形。首先,信号通过连续时间的预采样滤波器,稍后我们将讨论它的函数。然后信号以T秒为间隔由采样器读入。接着这些样本必须量化为一种标准电平。尽管量化过程有不同的策略,我们在这里所用的是一种常用的方法,采样值取最接近的电平。于是,采样值为4.2v被量化成4v,而采样值为4.6v则被量化成5v。

图9.2说明了对于给定信号的处理过程。令表示信号的脉冲变得很窄来说明在空的间隔可以插入或复合其它信号。这些脉冲被表示成二进制数字。为了使这些数字可以从图中看到,将每组都显示在给定间隔的空档处。实际应用中,如果要插入其它信号,用来表示二进制数

38 / 156

n文档可能无法思考全面,请浏览后下载!

的比特数的脉冲可以很短。一个给定的二进制数就可以在采样周期开始的很短间隔内读到,这样就给其它信号留出了大部分的可用时间。

39 / 156

文档可能无法思考全面,请浏览后下载!

模拟样本被量化并转换成二进制数的这一过程称作模数转换。通常,信号的动态范围要和所用的A/D转换器相一致,为了达到所要求的精确度,要使用足够的比特数。

现在信号可以根据适合所要应用的单元类型来处理。这个单元可以是通用计算机或小型计算机,也可以是为专门用途而设计的专用单元。无论如何,它们都是由可以完成加减乘等各种算术函数的标准数字电路组成的。此外,还有逻辑和存储能力。

在处理器的输出端,数字信号可以再转换回模拟形式。这通过数模转换过程来实现。在这个步骤中,首先要将二进制数字接连地转换回连续时间脉冲。脉冲间的空隙由重建滤波器填充。此滤波器由保持电路组成,它是专门设计用来保持连续采样值之间的脉冲值的电路。在某些情况下,可设计保持电路,将输出信号在连续样点之间按照设定的曲线拟合方法进行内插。除了保持电路,使用基本的连续时间滤波器在采样点之间进行额外的平滑处理。

一个可能出现的基本问题是,在这个过程中会不会造成一些信息的丢失。毕竟,信号仅仅在离散的时间间隔处被采样。在介于时间间隔内是否有一些信息丢失了呢?而且,在量化的过程中,真实的幅度值被最接近的标准电平所代替,这就意味着幅度中可能存在着误差。

关于采样的问题,我们将表明,如果信号带宽有限,并且采样率大于等于最高频率的两倍,理论上信号就能从离散的样本恢复。这相当于在最高频率上,每周期有两个样本的最少值。实际应用中,为了能够保证可实现性,采样率往往选择比最低频率更高一点(比如说,三倍或四倍的最高频率)。例如,模拟信号的最高频率是5kHz,理论上最小采样率为每秒10000个采样值,而实际系统中会采用更高一些的频率。常将输入的连续时间信号通过一个低通模拟预采样滤波器,以确保最高频率落在信号能够完全恢复的界限之内。

如果信号没有以足够快的速率采样,就会产生混叠现象。混叠会导致在恢复时一个频率被误作为完全不同的频率。例如,假设频率为直流到5kHz的信号,以6kHz进行采样,显然这太低了不能确保信号的恢复。如果进行恢复,原始信号中5kHz的分量将出现在1kHz,产生错误的信号。一个普通例子就是我们称之为“车轮效应”的现象,就是读者在西部电影中也许注意到的车轮看起来向后转动的情况。因为影片的每一帧相当于一次离散的采样,如果相对于电影帧频而言轮辐越过的给定角度过大,轮子看起来就会向后转动或以很慢的速度转动。采样前预滤波消除了这种对系统而言频率过高的伪信号被错误地当作适当频率范围内的另一信号的可能性。

关于量化误差,可以看到如果使用任意多的比特数,可使误差任意小。当然,由于实际的最大限制,有必要允许这一现象所产生的某些误差。即使是连续时间系统,也可能会有噪声出现,在实际幅度值上引入不确定。实际上,数字采样过程中产生的不确定称为量化噪声。

令Emax 和 Emin,分别表示信号的最大和最小值,q表示连续量化电平的垂直距离。n,m如上文中定义,于是得到:

qEmaxEminEmaxEmin2nm 假设两个连续量化电平之间的样本赋以最近的量化电平。峰值量化噪声以及峰值百分比量化噪声的值为:

39 / 156

(9-2)

文档可能无法思考全面,请浏览后下载!

峰值量化噪声q2

峰值百分比量化噪声100%2m 在许多情况下,量化噪声的方差比最大值更为重要。方差和与噪声有关的平均功率成正比。如果信号假定为在量化电平间均匀分布,统计分析显示噪声方差2

2q212

噪声分量的均方根(或标准偏差)为:

q23 比较式(9-6)和 (9-3),可以看到RMS噪声分量是峰值噪声分量的1/3。

鉴于前面的讨论,如果采样速率足够高的话,采样操作就不会造成信息丢失,并且通过选择足够的比特数来表示每个二进制数可以将量化误差降低到小到可以忽略不计的程度。这些概念让我们可以用一系列的离散二进制数来表示连续时间信号,可以直接用数字电路来处理。

包括A/D转换,处理和最后的D/A转换在内的这些过程,看似花了很多努力为了处理一个信道。确实,在许多情况下,如此复杂的过程对单一信道从经济角度来说是不可行的。数字概念的一个很大优势就是可以用同一个算术单元处理许多信道。这可以通过一种被称为时分复用(TDM)的过程来实现。在图9.2中显示的采样信号中可以看到,在信号连续的样本之间有一段比较长的周期。在这段周期内,另外信号的样本被送入处理器。

图9.3解释了这个概念。以一种连续的顺序读每个信道,相应的值以同样的顺序被转换成二进制数。这些数输入处理单元,经过适当的处理之后以适当的顺序在输出端输出。这种复合的数字信号必须先用与输入采样信号同步的多路信号分离器将其分离成原始的不同信道。为了输出要求,信道随后进行D/A变换。

在前面的讨论中,我们假定系统的起始和结束信号都是连续时间形式的。实际上,在许多系统中,其中之一或两者都已经是数字形式的了。在这些情况下,可以不用到A/D转换器和/或D/A转换器,这样就简化了系统。例如,假设许多连续时间遥测信号需要由数字单元处理,但是输出数据需要以数字形式保存,用以进行科学数据压缩和计算。在这种情况下,输入端需要A/D单元,但在输出端不需要转换器。

40 / 156

(9-3)

(9-4)

(9-5)

(9-6)

文档可能无法思考全面,请浏览后下载!

Unit 10 数字音频压缩

Unit 10-1

第一部分:MP3

41 / 156

文档可能无法思考全面,请浏览后下载!

随着互联网时代的到来,希望通过电话线传输越来越多的信息。音频信息是一种愈来愈多被下载的(多媒体)形式,无论是乐队的唱片选曲,无线电节目,还是视频伴音。因为电话线的带宽有限,所以需要对信息(包括音频)进行压缩。

用于CD和数字电视中存储数字音频的传统方法是每秒抽取并记录一定次数的声音幅度值。幅度值的精度是由用于存储幅度的比特位数决定的。所以,音频信号消耗的带宽(或者内存)由以下三个因素决定:每秒钟的采样次数(频率),用于存储幅度的比特位数(比特深度)以及信号的长度(时间)。当这三个参数已知时,很容易的计算出所用内存: 内存=频率比特深度时间

此外,如果信号是立体声的,内存就乘以二,因为立体声实际上用了两个信号。

这个等式能用来说明为什么在互联网上传输高品质音频信号时需要压缩。CD音频采用44,100 Hz采样率的16比特立体声。这就意味着1分钟的音频信号需要使用44,10016602 = 84,672,000比特,或略超过10兆字节。一个标准的56 kbps的调制解调器需要84,672,000/57344 = 1477秒,或大约25分钟。等待1分钟的音频要25分钟这么长的时间,因此必须有另一个选择,这个选择就是MPEG 音频第3层,或MP3。 编解码器

人的耳朵仅能听到有限的频率范围,因此编解码可去除这个范围之外的所有声音。因为这些声音是不可能被人听到的。

对声音应用一种心理声学模型。在播放音调高的声音时,要提高使低频声能被听到的临界分贝数(分贝阈值)。心理声学模型能去除所有通过这种方式“隐藏”的声音。 下一步就是联合立体声。人脑无法估计低频声音的方向,所以这个阈值之下的声音都用单声道编码。如果信号某些部分仍然高于所需的比特率,这些部分的音质就会下降。最后,应用哈夫曼编码,该编码将所有比特码字根据其出现的频率换成独特的变长比特码。例如:最常出现的比特模式编码成“01”,而次常出现的编码成“010”,下一个被编码成“011”,依此类推。 社会和经济效应

MP3所带来的社会效应是无法被低估的。它允许新的、未签约的乐队在互联网上发布免费音乐。具有非主流口味(喜好)的人获取实验性或不同寻常的音乐比以往容易得多,主流唱片店一般不经销这些流派的音乐。便携式硬件MP3播放器现在售价很低,而且还在降低。一些网站如:MP3aaa发布着众多未签约乐队的免费MP3。另外一些网站销售未签约乐队的专辑,用一些专辑上的免费MP3音乐让消费者在购买之前进行试听。为了提升专辑,一些主流艺术家也会在网上发布一些免费MP3。然而,不幸的是,这种革命存在它的阴暗面。非法网站发行从已成名艺术家的唱片中非法窃取的音乐,这些艺术家因而失去版税。

MP3对经济的影响与其社会效应是紧密相关。主要的唱片公司差不多因为这可能产生的社会影响而惊恐万状。它们拒绝销售MP3专辑,除非艺术家有足够的影响。他们急欲建立一种“安全”音乐格式标准,使之不能用于一台以上的机器(仅能在一台机器上播放)。微软最近进行了这样的尝试,但失败了。它们的格式WMT4,在发布之后不到24小时就被破解了。

41 / 156

文档可能无法思考全面,请浏览后下载!

实际上,用于破解WMT4的相同技术可以用于破解任何音乐格式,无论这种格式有多么安全。人们相信,MP3可能是传统唱片公司的末日。然而,大多数人预见到,唱片公司意识到它们无法打赢这场特殊的战争,它们也开始发布MP3专辑。实际上,在这个时代,MP3在安全性上大概并不比CD差很多。

42 / 156

文档可能无法思考全面,请浏览后下载!

结论

总之,MP3能以高因子对数字音频进行压缩,这使得在互联网上发布音频很理想。它对一些未签约的以及实验性的乐队相当流行,还有一些提倡这种技术的已成名艺术家。尽管唱片公司拒绝对其进行支持,但是它们也没办法阻止这个潮流。它们发现它们自己完全处于丹麦克努特大帝的处境,尽管从长远来说,这种状况必然会改变。

MP3文件格式是一种效率极高的压缩标准,它已经赢得(告别)了WMT4和其他对手发起的挑战。由于其非常宽松的许可条款,MP3似乎不大可能丧失它的流行性。

Unit 10-2

第二部分:数字音频压缩标准AC3 前言

因认识到迅速有效地制定一套相互协调的国家标准对于美国电视业今后的发展至关重要,由学会协调联合委员会(JCIC)的成员组织组成了美国先进电视系统委员会(ATSC)。

ATSC的工作之一是寻求对ATV(先进电视系统)的非强制性国家技术标准的需要并在适当的情况下协调这种开发工作。ATSC执行委员会将起草美国ATV标准的工作交给了“发布技术委员会”(T3)下设的一系列专家组。ATV音频标准由音频专家组(T3/S7)负责起草。

本文件最初是音频专家组作为制定美国ATV广播标准的一部分而准备的,于1994年9月26日获发布技术委员会批准,后来又于1994年11月10日获ATSC全体成员批准成为ATSC标准。附件A“MPEG-2复用中的AC-3基本流”于1995年2月23日由发布技术委员会批准,并于1995年4月12日由ATSC全体成员批准。附件B“IEC958接口的AC-3数据流”以及附件C“AC-3卡拉OK模式”于1995年10月24日由发布技术委员会批准,并于1995年12月20日由ATSC全体成员批准。ATSC标准A/53“HDTV传输的数字电视标准”引用了本文件,叙述了本文件所述的音频编码算法应如何用于美国ATV标准。

在本文件公布之时,本文所述系统尚未经过由独立开发的编码器到分别开发的解码器之间进行信号传输的验证。 动因

为了更有效地广播或记录音频信号,需要减少用于表示音频的信息量。对于数字音频信号,用于精确重建原始脉冲编码调制样本所需要的数字信息量可以通过数字压缩算法来减少,由此产生原信号的数字压缩形式。(压缩一词在这里是指压缩必须存储或记录的数字信息量,而不是压缩音频信号的动态范围。)数字压缩算法的目的是产生一个音频信号的数字表示,在解码和回放时给出与原始信号相同的听觉效果,而其压缩(或编码)形式使用最少的数字信息量(比特率)。本文件所述AC-3数字压缩算法可以将1至5.1声道的PCM形式音频源信号编码为32kbps至640bps的串行比特流。0.1声道是指用于传输低频信号(低音扬声器)的窄带声道。

图10.1给出了该算法的一个典型应用。在这一实例中,用AC-3编码器将5Mbps以上码

42 / 156

文档可能无法思考全面,请浏览后下载!

率(6通道

43 / 156

文档可能无法思考全面,请浏览后下载!

48kHz18比特=5.184Mbps)PCM形式的5.1声胜道音频节目转换成384kbps码率的

比特流。卫星发射设备将比特流转换成射频,送到卫星收发器。AC-3数字编码器使发射所需要的带宽和功率下降了13倍以上。从卫星接收到的信号被解调到384kbps的串行比特流,然后由AC-3解码器解码,得到原来的5.1通道音频节目。

只要减少表示音频信号的数字信息量具有经济效益,数字音频压缩就是有用的。典型的应用有卫星或地面音频广播,经过电缆或光缆传输音频,以及在磁、光、半导体或其他存储介质上存储音频信号。 编码

AC-3编码器接受PCM音频,产生符合本标准的比特流。编码过程的具体细节并不是本标准的规范要求。然而编码器必须生成与第5节所述句法相匹配的比特流,该比特流在按照第6节和第7节解码后,产生针对具体应用音质足够好的音频信号。第8节包含关于编码过程的有用信息。以下简述编码过程。

AC-3算法通过对音频信号的频域形式进行粗量化实现高的编码增益(输入输出比特率之比)。图10.2是这一过程的方框图。编码的第一步是将音频信号从一系列PCM时域样本形式转换为一系列频率系数的块。这由分析滤波器组完成。相互有重叠的512个时域样本块被乘以一个时间窗函数,转换到频域。由于样本的重叠,每一个输入的PCM样本反映在两个相邻的频域块中。然后以因子2抽取频域样本,使得每一块数据包含256个频域系数。频域系数用二进制指数形式表示,有一个二进制指数和一个尾数。指数集编码为信号频谱的粗放表示形式,称为频谱包络。频谱包络用于核心比特分配例程以确定对每一尾数编码时所需要的比特数。将6个音频信号块(1536个样本)的频谱包络和粗量化尾数格式化,组成一帧AC-3数据。AC-3比特流就是一系列的AC-3帧。

实际的AC-3编码器比图10.2更复杂,还包括以下未出现在图中的功能。

1. 在每一帧前面加上帧头,其中包含与编码比特流实现同步并将它解码所需的信息,

如比特率、采样频率、编码声道数等。

2. 插入检错码以使解码器确认接收到的数据帧中没有误码。

3. 分析滤波器组的频谱分辨率可以动态地改变以便更好地匹配每一音频信号块的时

频特性。

4. 可以用不同的时间/频率分辨率对频谱包络编码。

5. 可以进行更复杂的比特分配,可以修改核心比特分配例程的参数以生成更优的比特

分配。

6. 可在高频端将各通道相互耦合以实现低比特流工作时更高的编码增益。

7. 在双声道模式中,可以选择执行一个重新进行矩阵变换的过程以便提供附加的编码

增益,并在使用矩阵环绕声解码器解码双声道信号时给出改进的效果。

解码

解码基本上是编码的逆过程。图10.3所示解码器必须与编码的比特流同步,检查有无误码,将各种数据如编码的频谱包络和量化的尾数解格式。运行比特分配例程,将其结果用

43 / 156

文档可能无法思考全面,请浏览后下载!

于将尾数解包和解量化。将频谱包络解码生成指数。将指数和尾数转换到时域,产生解码后的PCM时域样本。

实际的AC-3解码器比图10.3更复杂,还包括以下未出现在图中的功能。 1. 检测到误码时可使用错误隐藏或静音功能。 2. 对高频成分耦合的通道必须解耦合。

44 / 156

文档可能无法思考全面,请浏览后下载!

3. 当各通道被重新进行矩阵变换时,必须进行解矩阵变换。

4. 必须以编码时分析滤波器组所用的同样方式动态地改变合成滤波器组的分辨率。

Unit 11 数字图像处理

Unit 11-1

第一部分:二维数字图像

图像是表示一些物理参数空间分布的二维信号,典型的物理参数是光强,而更普通的是能量的任一种形式。例如,运动图像以及多光谱的遥感图像是三维或者是更高维的信号。现代数字技术使得处理多维信号成为可能,所使用的系统可从简单的数字电路到先进的并行计算机。这种处理的目的可以分为3类:

- - -

图像处理:输入图像输出图像 图像分析:输入图像输出测量数据 图像理解:输入图像输出高层次的图像描述

我们将介绍的重点集中在图像处理的基本概念上。篇幅所限,我们只能对图像分析以及图像理解进行一些介绍性的说明。另外我们将限于讨论二维图像处理,尽管将要描述的大部分概念和方法很容易扩展到三维或更高的维数。

我们从一些基本定义开始。在“真实世界”中定义的一幅图像可以看成是两个实变量的函数,例如:以a作为在实坐标位置(x, y)处幅度(亮度)的图像a(x, y)。一幅图像可以看成是包含许多子图像,这些子图有时称之为感兴趣区域,ROI,或者仅仅是图像中的区域。这一概念表明图像通常包含许多对象,每一个对象可以是一个区域的主要部分。在一个复杂的图像处理系统中,应该能对于选择的区域进行特定的图像处理运算。于是图像的一部分可以进行抑制运动模糊的处理,而另一部分可以作改进色彩渲染的处理。

一幅给定图像的幅度几乎总是要么是实数,要么是整数。后者通常是量化的结果,将一个连续的范围如0到100%转换为离散的(灰度)级。然而,在某些图像形成过程中,信号可能涉及到光子计数,这意味着幅度本来是量化的。其它的图像形成过程,如磁共振成像,直接的物理测量会产生一个复数,具有实的幅度和实的相位。除非另有说明,我们认为幅度是实数或者是整数。

一幅二维离散空间中的数字图像a[m, n]是由二维连续空间中的模拟图像a(x, y)通过采样得到的。采样过程常称为数字化。对采样过程的数学表示将在稍后介绍。现在,我们来看一些和数字图像有关的基本定义。图11.1显示了数字化的效果。

2维连续图像a(x, y)被划分成N行M列。一行一列的交叉点被叫做一个像素。整数坐标[m, n]被赋予的值是a[m, n],其中:m = 0, 1, 2, ... , M1 ,n = 0, 1, 2, ... , N1。

实际上,大多数情况下,我们认为是射到二维传感器表面的物理信号a(x, y)实际上是许多变量的函数,包括深度、颜色、时间。除非另作说明,本文我们考虑的是2维的,单色的静止的图像情况。

44 / 156

文档可能无法思考全面,请浏览后下载!

图11.1的图像被划分成了N = 16 行以及M = 16列。赋予每个像素的值是像素的平均亮度,其四舍五入到最近的整数。将二维信号在给定坐标位置的幅度表示成具有L个不同灰度级的整数值的过程通常称为幅度量化,或简称量化。

45 / 156

文档可能无法思考全面,请浏览后下载!

在数字图像处理中,某些工具是非常重要的。这些包括数学工具,如:卷积、傅立叶分析以及统计描述,和处理工具,如:链式码与游程码。在这里我们介绍这些工具没有任何特别的动机,在后面的章节中我们会对此予以介绍。

许多图像处理应用是要产生被人观察的图像,而不是比方说为了自动的工业检验。因此,了解人类视觉系统的特征和限制是很重要的,即要了解二维信号的“接收器”。一开始就认识到以下几点是很重要的:1)人的视觉系统尚未被充分了解;2)不存在与人眼评价相当的判断图像质量的客观度量;3)不存在所谓“典型”的观察者。然而,感知心理学的研究已经对视觉系统提供了一些重要的见解。

Unit 11-2

第二部分:数字图像——定义和应用

图像无处不在,这毫不足怪,因为我们人类依赖于图像,我们用眼睛的感知超过所有其它的感知刺激。我们吸收的几乎所有的信息都是图像的形式,不论是看一张照片,看电视,欣赏一幅画,或是读书,这一切都利用了图像。图像对于我们是如此自然,因而总是尽力将几乎任何信息都转换为图像。例如电视天气预报用图像表示某一地区的温度分布,以不同颜色代表不同的温度,医学扫描装置可将人的新陈代谢活动显示成图像,用亮点表示强的活动性,等等。此外,我们的视觉通常是我们感官中最有效的:举例来说,考虑一个电脑键盘。每个键的功能都用了一个小图像(一个字符)表示。我们也可以通过一个特定的凹凸纹理来识别每个按键,但它的效率远不及前者。我们甚至可以尝试给每一个按键一个特定气味,但很容易想象在打字时我们的麻烦。

我们也擅长于许多图像处理任务。举例来说,我们眼睛的聚焦:当我们看东西时,我们的眼睛传递给大脑的第一个图像可能是未聚焦的,然后大脑试图通过调节眼睛晶状体纠正这一点,一个新的图像就会从眼睛发送到大脑,等等。这种反馈过程是如此之快,甚至我们没有意识到这一点。另一个例子是立体视觉:我们的眼睛将两幅二维图像传到大脑,而大脑能在瞬息之间将它们合成为一幅三维图像。

图像处理技术将人类使用图像的自然方式和数学结合起来。这就提供了独特的混合,因为可用严格数学方法描述图像和图像处理又不失图像的直观性。

图像处理可以定义为:图像中信息的处理和分析。当然这个定义是非常宽泛的,包括自然的和人为的处理,从一副眼镜的使用到哈勃望远镜传输的图像的自动分析。我们可以发现身边图像处理的简单方式,包括:

- 使用眼镜或隐形眼镜

- 亮度,对比度等,电视或监视器的控制 - 用相机拍摄和冲洗照片

- 大自然的例子:水面上景色的反射,水雾中景色的失真,等等。 高级图像处理的应用例子包括:

- 司法科学:视频监控摄像机图像的增强,图像中的脸,指纹,DNA码等的自动识

45 / 156

文档可能无法思考全面,请浏览后下载!

别和分类。

46 / 156

文档可能无法思考全面,请浏览后下载!

- 工业:检验生产部件,应用于CAD /CAM。

- 信息处理: 手写和印刷文本(经常被称为OCR;光学字符识别)的识别,印刷图像的扫描和分类。

在医学中,使用病人的一幅或多幅医学图像,可以发现图像处理的许多应用,例如: - 可视化。 例如:在我们整理一个三维物体的三维可视化之前,我们首先需要从二维图像中提取物体的信息。

- 计算机辅助诊断。 如:现在通常为超过一定年龄的女性定期拍乳房X光片,以发现早期的乳房癌。实践中图像数量如此巨大,因而用自动计算机图像处理来完成部分筛选工作十分有益。

- 图像分割即将图像分割为有意义的结构。例如:将脑图像分割为这些结构:脑白质、脑灰质、脑脊髓液、骨质、脂肪、皮肤等。从改善可视化到肿瘤生长的监测,在许多工作中分割是有用的。

- 图像配准,即同一病人两幅或更多图像的严格对准。若要将这些图像中包含的信息结合起来形成一幅有意义的新图像,这种对准是十分必要的。

图像处理应用可以有很多目的。大多数时候,目的是在一个或几个这些类别中: - 图像增强,例如,减少噪声或图像锐化。

- 模式识别,例如,图像中某种形状或纹理的自动检测。

- 将数据量减少为更容易处置或解释的信息,例如将图像减小为一幅较简单的图像、一组对象或特征、或者一组测量结果。 - 图像合成,如由二维照片重建三维场景。

- 图像拼接。当从同一个场景获取两种不同形态(类型)的图像时,将它们拼接起来涉及配准,其后是数据减少和图像合成。

- 数据压缩。为了缩小包含图像的计算机文件的大小,以及加快网络中图像传输的速度,数据压缩常常是必需的。

我们关心的只是数字图像处理,而不是模拟处理,理由是,模拟处理需要专用的硬件,这使得建立一个特殊的图像处理应用成为一项艰巨的任务。此外,在许多图像处理领域中模拟硬件的使用正在迅速地成为过去,因为它常常能被更具灵活性的数字硬件(计算机)所取代。

但究竟什么是数字图像呢?数字图像获取与处理的示意图如图11.2所示。顶部有某个成像设备,如摄像机,医疗扫描仪,或其它任何可将物理现实的量度转换为电信号的设备。成像设备产生一个连续的电信号。因为这种模拟信号不能直接用计算机处理,信号通过数字化仪转换为离散形式。最后产生的图像便可直接用于数字图像处理应用。

数字化仪完成两个任务:采样和量化(见图11.3)。在采样过程中,图像中连续信号的值在特定位置被采样。在量化过程中,真实值被离散化为数字数值。量化后的图像我们称为数字图像。这样就回答了本节开头的问题:数字图像只不过是一个数值的矩阵。每个矩阵元素,即已量化样本,被称为图像元素或像素。对于三维图像则称为体积元素或体素。 我们可以用两个坐标(x; y)表示图像中每个像素的位置。按照惯例,(0; 0)像素,即原

46 / 156

文档可能无法思考全面,请浏览后下载!

点,是在图像的左上角,X轴是从左向右,Y轴自上而下(见图11.4 )。这可能要用一点功夫去习惯它,因为它不同于常规的二元函数的数学表示法,也不同于常规的矩阵坐标。如果一幅数字图像仅仅是一个

47 / 156

文档可能无法思考全面,请浏览后下载!

数值矩阵,有人可能会说:数字图像处理只不过是一种对矩阵进行运算的数学算法的集合。幸运的是,现实情况远非所说的那么枯燥乏味,因为在实际中,我们很少使用图11.3所示的矩阵表示,而是对图11.3的中间图像进行处理,实际上是同一幅图像,但将光强度赋予每一个数,对人而言它通常更有意义。你会发现图像处理算法将被描述为数学算子作用于像素值或像素矩阵,这些算法的运算结果也将被用图像形式显示出来。

Unit 11-3

第三部分:图像处理引言

图像由各种物理设备产生,包括照相机和摄像机、X光设备、电子显微镜、雷达、超声设备等,并用于各种目的,包括娱乐、医疗、商务、工业、军事、民用、安全、科学。各种应用的目的都是使观察者(人或机器)提取被成像的场景中的有用信息。

原始图像通常并不直接适合于这一目的,必须以某种方式进行处理。这种处理称为图像增强;而观察者从图像中提取信息的处理则称为图像分析。增强和分析根据其输出性质即输出的是图像还是关于场景的信息来区分,也根据所面临的挑战和所使用的方法来区分。

图像增强通过化学、光学、电子方法实现,而分析则主要由人工和电子方法实现。用于观察者的(视觉)增强方法或用于(计算机)自主分析的数字图像处理技术在成本、速度、灵活性方面具有优越性,随着个人计算机价格的急剧下降和功能的快速提升而成了实用的主要方法。 挑战

图像并不是被观察的物理对象性质的直接测量,而是诸多物理因素相互作用的结果:光照强度及其分布、光照与构成景物的物质之间的相互作用、反射光或透射光从三维空间到二维图像平面的投影几何关系、以及传感器的电子特性。不像某些其它工作例如编写编译程序那样有正式理论为基础的算法,可将高级计算机语言翻译成机器语言,不存在从图像中提取感兴趣的景物信息如位置或某一制成品质量的算法和可比的理论。

这种困难常被初学者低估,因为人的视觉系统似乎可轻而易举地从景物中提取信息。人的视觉通常比我们目前乃至可预见的未来能够设计制造的任何东西复杂得多。于是我们必须注意,不要根据人们对某一数字图像处理应用的印象来评估其难易程度。

一个首要的指导原则也许是人类更擅长于判断而机器更擅长于测量。因此,比方说在传输带上确定一个汽车零件的确切位置和大小很适合于数字图像处理,而要对苹果或木材的质量定级却更具挑战性,尽管不是不可能的。按照这些原则,需进行大量计算而极少需要判断的图像增强就是很适合于数字处理的。

对处理时间的严格要求常使问题变得更复杂。很少用户在意电子表格的数据刷新时间是300毫秒而不是200毫秒;但是,譬如说大部分工业应用却必须在机器周期所要求的严格限制以内完成操作。还有许多应用如超声图像增强、交通监控、摄像机防抖动等要求对视频流进行实时处理。

为了具体了解对处理速度的挑战,设想一下,一台标准黑白摄像机的视频流每秒有1000

47 / 156

文档可能无法思考全面,请浏览后下载!

万个像素。在撰写本文时,一台典型台式PC也许可在处理每个像素所允许的100ns时间内执行50条机器指令,而能用区区50条指令完成的处理十分有限。

此外,许多图像处理应用还受到成本的严格限制,因此我们经常面临工程师们望而生畏的三重难题:要求设计的产品同时具备性能优良、运行快捷、价格便宜的优点。

48 / 156

文档可能无法思考全面,请浏览后下载!

图像获取

所有图像处理应用始于某种形式的照射,典型的是光线但广义的是某种能量。有时必须使用环境光线,但更为典型的是根据具体应用设计照明。在这些情况下事情的成败往往就在于此:任何高明的软件都无法将因为照明不良而丢失的信息恢复出来。

照相机就是一个能将辐射能量分布转换为存放在RAM中的数字图像的装置。过去这一过程分成两步:将能量转换为电信号即照相机的功能;用数字化设备将信号转换成数字形式并存储。现在两者之间的界线正在变得模糊,照相机将通过USB、以太网、IEEE 1394接口直接将图像送入计算机。

照相机技术以及所产生的图像特性几乎无例外地受到最大实际应用量的驱动,其中之一是消费电视。因此大多数的摄像机具有半个多世纪以前电视广播标准所制定的分辨率和速度特性。

典型的可见光单色摄像机的分辨率为640480,每秒输出30帧图像,并支持电子快门和快速复位(任意时刻回复到一帧初始状态的能力,从而可避免在开始捕获一帧新图像前的等待)。这种摄像机是基于CCD传感器技术的,能产生优良的图像,但相对于其它具有同样数量晶体管的多数芯片而言其价格很高。

随着大容量个人计算机多媒体应用的激增情况首次发生了变化。首先影响到的是显示器,它已有相当一段时间给我们提供了比广播更高的速度和分辨率。人们可期待照相机/摄像机也随之跟上,包括由民用数字照相机所推动的高速度、高分辨率器件,娱乐业、互联网远程会议和用户视觉界面应用所推动的低分辨率和极低价格的设备。

廉价器件可能会产生更大的影响。这些是基于新出现的CMOS传感器技术的,其生产工艺与大多数计算机芯片相同,因而得益于生产批量大而价格低廉。目前它的图象质量还达不到CCD标准,但随着技术的成熟是注定会改进的。 图像增强

数字图像增强算法大致分为两类:点变换(像素映射)和邻域运算。 1. 点变换

点变换产生的输出图像中每个像素都是一个相应输入像素的某种函数。这一函数对于每个像素都相同,通常是由图像的全局统计特性导出的。点变换一般运行很快,但仅限于进行全局变换,例如调整整幅图像的对比度。

点变换包括许多可用于分等级值像素的图像增强。这些算法常由基于查找表的单一软件程序或硬件模块实现。查找表的运行速度快,可以编程用于实现任何功能,以合理的速度提供最终的普适性。而MMX以及类似的处理器则能以比查找表快得多的速度通过直接计算来执行各种功能,其代价是软件复杂性的提高。当某种功能是通过图像全局统计特性来计算时,像素映射是最为有用。例如人们可以处理一幅图像,在输入信号的均值和标准偏差,或者最小值和最大值的基础上,获得所要求的增益和补偿(偏移)。

直方图指标是一种有效的像素映射点变换,对输入图像进行处理使之具有与某一参考图像同样的像素值分布。其像素映射关系很容易从输入图像和参考图像的直方图得到。直方图

48 / 156

文档可能无法思考全面,请浏览后下载!

指标是进行图像分析前的一种有用的增强技术,这种分析的目的是对输入图像和参考图像进行某种比较。

49 / 156

文档可能无法思考全面,请浏览后下载!

阈值分割是一种常用增强技术,其目的是将图像分割成目标和背景。计算阈值,大于(或小于)阈值的就当作对象,否则就是背景。有时用两个阈值来确定对应于目标像素的一个范围。阈值可以是固定的,但最好是根据图像的统计特性计算得到。也可以用邻域处理进行阈值分割。在所有这些情况下得到的结果都是一幅二值图像,即只有黑白两色而没有灰阶。

颜色空间转换用于转换不同的颜色表示方法,例如将照相机提供的RGB空间转换成图像分析算法所要求的HIS(色调,亮度,饱和度)空间。由于精确的颜色空间转换涉及的计算量很大,在对时间有严格要求的应用中常采用粗略的近似。这些近似方法十分有效,但在选择一种算法以前应该对速度和精度间的权衡有所了解。

时间平均是处理反差极低图像最有效的方法。像素灰度映射对信号和噪声的作用相同,因此对于提高图像增益的作用很有限。邻域运算可以降低噪声,却会损失图像的保真度。降低噪声而不影响信号的唯一方法是对不同时间的多幅图像求平均。不相关噪声的幅度以参与平均的图像数目的平方根被衰减。将时间平均与扩大增益的像素映射法相结合可处理反差极低的图像。时间平均的主要缺点是用照相机获取多幅图像需要花费较长的时间。 2. 邻域运算

在邻域运算中,每一个输出像素都是一组输入像素的函数。这组像素通常围绕一个对应的中心像素的某个区域,因此称为邻域,例如33邻域。邻域运算可实现频率滤波和形状滤波,以及其他复杂的增强操作,但是运行起来较慢,因为对于每个输出像素而言,邻域内的像素必须重复计算。

由于有了可追溯到200年前Fourier信号理论的广泛数学框架,线性滤波器是邻域处理中最容易理解的。线性滤波器有选择地放大或衰减空间频率成分,可达到平滑和锐化等效果,通常是重采样和边缘检测算法的基础。

线性滤波器可用卷积运算定义,其输出像素由邻域内各像素乘以叫做“核”的同样形状区域内的相应值,然后将乘积相加得到。线性滤波器可直接由卷积实现,也可以利用FFT在频域实现。尽管频域滤波在理论上更为有效,实际上几乎总是用直接卷积的方法。由于使用小的整数运算和时序存储器寻址,卷积比起FFT来与数字硬件更加匹配,更容易实现,在边界条件的处理方面几乎没有问题。

边界检测有相当长的历史和大量的文献资料,从简单的边缘检测到更适合于图像分析中考虑采用的复杂算法。我们可以有点随意地将边缘检测看成是一种图像增强,因为其目的是突出感兴趣的边缘特征,而将其他一切都衰减掉。

图像中由目标产生的阴影是目标特性中最不可靠的因素,因为阴影是由照明、表面特性、投影几何学、感光器件特性这些因素复杂地结合而成的。而另一方面,图像中的不连续区通常直接对应于目标表面的不连续性(例如边缘),因为其他因素不易导致不连续性。图像中的不连续性即使在光度学方面不一致,在几何即形状方面通常却是一致的。因此作为边缘检测目的,不连续部位的确定和定位是数字图像处理中最重要的任务之一。

粗糙的边缘检测器只是标出相应于梯度大小的峰值或二阶微商过零点处的像素。精密复杂的边界检测器则给出有序的一串边界点,以及亚像素位置和各像素处的边界方向。最商用的边缘检测器还可以在一个很宽的范围内调节空间频率响应,并以高速运行。

49 / 156

文档可能无法思考全面,请浏览后下载!

设计成可以通过或阻止指定形状而不是空间频率的非线性滤波器在数字图像增强中十分有用。我们首先考虑的是中值滤波器,它在每个像素位置的输出是相应输入邻域的中值。粗略地讲,中值滤波器的作用是将小于邻域尺寸的图像内容衰减掉,让大于邻域范围的图像内容通过。

50 / 156

文档可能无法思考全面,请浏览后下载!

数字重采样是指照射到传感器上的能量连续分布被重新采样的情况下估计图像的过程。不同方式采样,用不同的分辨率或以不同方向采样常常是有用的。

另一类重采样算法是坐标变换,能产生亚像素数量的偏移、旋转和改变图像尺寸、在直角坐标系和极坐标系之间相互转换。输出像素的值由输入值的邻域内插得到。三种常用方法是:速度最快的最近邻法,更精确但速度较慢而且会损失一些高频分量的双线性法,非常精确但是最慢的三次卷积法。

Unit 12 生物识别技术

Unit 12-1

第一部分:指纹识别

在所有的生物技术中,指纹识别是最早期的一种技术。我们知道,每个人都有自己独特的、不可变更的指纹。指纹是由手指表皮上的一系列峰谷组成的。指纹的独特性是由这些峰谷的形状以及指纹的细节点所决定的。指纹的细节点是指纹局部凸起处的一些特性,这些特性出现在凸起的分叉处或是凸起的截止处。

指纹匹配技术可以被分为两类:基于细节的指纹匹配技术和基于相关性的指纹匹配技术。基于细节的指纹匹配首先要找出细节点,然后在手指上对应出与它们相关的位置,如图12.1所示。但是,使用这种方法存在一些困难。要精确地提取指纹的细节点是很困难的。而且,这种方法不能很好地考虑指纹峰谷的整体形状。基于相关性的指纹匹配技术可以解决部分基于细节的指纹匹配方法存在的问题,但它也存在一些自身的缺陷。基于相关性的匹配技术需要给出已注册过的特征点的精确位置,并且该方法会受图像平移和旋转的影响。

图12.1 基于细节的指纹匹配

基于细节的指纹匹配技术在匹配不同大小的细节模型时(未注册过的)会存在一些问题。

指纹上局部的凸起结构不能完全由指纹细节实现特征化。我们可以尝试另一种表达指纹的方法,它可以获得更多的指纹局部信息并且得到固定长度的指纹编码。于是,我们只需要计算两个指纹编码之间的欧几里得距离,匹配过程有望变得相对简单。

50 / 156

文档可能无法思考全面,请浏览后下载!

研发对于指纹图像中噪声更稳健并能实时提供更高精度的算法是重要的。商用指纹(身

份)认证系统对给定的错误接受率要求具有很低的错误拒绝率。在这点上,任何一项简单的技术都很难实现。我们可以从不同的匹配技术中汇总多个证据从而提高系统的总体精确度。在实际应用中,传感器、采集系统、性能随时间的变化是关键因素。为了评价系统性能,我们有必要对少数使用者在一段时间内进行现场试验。

每天我们可以从法医鉴定、出入口控制、驾驶证登记等多个方面的应用中采集并保存大

量的指纹。基于指纹的自动识别系统需要把输入的指纹与数据库中大量的指纹进行匹配验证。为了缩短搜索时间、降低计算复杂度,要以准确而一致的方式将这些指纹分类,从而使输入的指纹只需与数据库某一子集中的指纹进行比对。

指纹分类是将指纹划分入多个预定义指纹类型中的一类中的一项技术。这些预定义的指

纹类型是由提供索引机制的文献建立的。图12.2表示了不同类型的指纹。它们有螺纹状的、右旋状的、左旋状的、弓形的、帐篷形的。输入指纹首先粗略地被匹配为预定义的类型中的一类,随后,输入指纹仅与这一大类指纹库中的子集作更精细的比较。

图12.2 不同类型的指纹

指纹自动匹配中关键的一步是自动并且可靠地从输入指纹图像中提取出细节。然而,细

节提取算法的好坏很大程度上依赖于输入图像质量的好坏。为确保自动指纹识别或确认系统的性能对于不同指纹图像质量具有稳健性,必须在细节提取模块中加入指纹增强算法。快速指纹增强算法能根据对局部指纹脊方向和频率(密度)的估计自适应地改善输入指纹图像中脊和沟结构的清晰度,如图12.3所示。实验证明加入增强算法可以显著增强指纹认证的精度。

图12.3 指纹增强

Unit 12-2

第二部分:说话人辨认介绍 介绍

现代安全系统范围很广, 通常要通过多层系统才能完全被突破。除了标准的锁和警报系

统以外,还有很复杂的方法来保护重要资料。其中多数的方法为可以允许或者不允许一个特

51 / 156

文档可能无法思考全面,请浏览后下载!

定人员获取资料——计算机系统必须能够检测出指纹、读取个人眼孔图样、或者确定说话者的真实身份。最后一点是本文讨论的重点

52 / 156

文档可能无法思考全面,请浏览后下载!

——说话人辨认。说话人辨认经常会与其他类似的术语混淆。以下对这些术语的精确定义做出解释。

说话人识别:确定是谁在说话。

说话人辨认:初始情况下不知道说话人是谁,必须在与模板比较后确定说话人的身份。

通常会有很多相关的模板。

说话人确认:确定说话者是否就是他(她)自称的那个人。仅将说话者的话音与一个样

板进行比对,即他(她)自称的那一个。

语音识别:识别出人们说话时的语句。换句话说,识别出一个人在说什么而不是谁在说

话。这个术语经常与声音识别相混淆。声音识别是识别出说话人。 关键问题

通常来说,语音识别问题是很复杂的,涉猎很广的。其中主要的一个问题是语音信号的

复杂度很高。在如图12.4所示的语音信号中,很难对大量系统做出解释并提交给系统。

图12.4 直流偏置改变后的diablo的波形图

一个明显的问题在于信号不规则。自然的语音信号始终起伏不定。语音模型的另一个自然特性是信号的音量和幅度起伏不定。不同的人会用不同的方法来强调音节、字母和单词。如果两路信号音量不同,它们就很难进行比较。同样,语音信号在很短的时间内会有很多峰值,它们对应于人们说话时每个单词的音节。尖峰的增加使两个信号的比较变得更为困难,因为结果容易偏向于高的峰值,导致对那些结果的解释发生错误。提供给系统的输入信号的速度高低是另外一个问题。使用者说自己的名字时语速不同于他们平常的讲话速度,这可以改变识别结果,因为这时是将同一模式的两个不同版本进行比较。问题在于他们讲话经历的时间长短不同,这必须考虑在内。最后一个问题,当使用语音认证的方法来测试一个信号的时候,某个人可以尝试模仿另一个人的语音。如果说话者有很好的模仿能力,那么这个说话者很有可能被系统接受。

为了处理信号的不规则以及周围环境对信号的噪声影响这两个问题,必须先让信号通过平滑滤波器。滤波器要完成两项任务:消除过度的噪声和消除高频起伏,仅仅保留信号的大小。这样,你就可以得到容易辨识处理的清晰信号了。

为了解决说话者音量不同的问题,信号在被测试前必须用相同的音量归一化。每个信号都要被归一到零的附近,这样每个信号都会有近似相等的最大值和最小值。

为了测试每个人的语音峰值点,我们在平滑信号以后使用包络函数来检测信号中的峰值

52 / 156

文档可能无法思考全面,请浏览后下载!

点。如果信号通过某个门限,我们将检测它并把它与数据库中的相关信号做比对。这个过程将对共振峰进行分析而不会分析整个信号。每个人语音信号中的共振峰、或是元音声都可以被拿来做测试以区分说话人身份。

53 / 156

文档可能无法思考全面,请浏览后下载!

为了处理输入信号速度的多变性问题,我们要同时使用共振峰分析和包络函数分析法。我们可以通过信号峰值的包络来确定哪个元音是有用的。对应的实际共振峰本身也将不发生变化。要解决语音模型的模仿问题,我们再一次地分析个人语音信号的共振峰。从而我们可以实际确定说话人是否是他声称的那个人。在大多数情况下,模仿者的共振峰信号不能完全匹配存放在数据库中的原始共振峰信号,这样,模仿者将被安全系统所拒绝。 包络检测

当系统从声音信号中实际读取某些值时,最重要的一件事是指出怎样把信号截断。一个很显然的方法是用音节来中断一个单词或是一连串词组。尽管因为音节中仍含有辅音而有些难以解读,但元音(总是)构成音节的主要部分,更不要说信号中较响亮的部分了。总而言之,用音节来中断单词是一个很好的开始。

当我们把信号通过一个平滑滤波器以后,就会得到清晰的波峰。然而,问题依然存在——我们如何得到这些峰值中的一个呢?这么做的目的是在开始读取信号的时候选取一个正确的门限。最重要的是要设法在保持每个信号的峰值的同时区分出多个峰值。例如,当门限设得太低时,噪声将进入系统。不过更有可能的是在阈值取得太高的情况下某些音节可能被忽略掉。

这使我们的问题有了一个很好的解决方案——门限切断了信号的采样值而不是时域值。我们需要时域值来对结果的频率进行分析,这样,我们就可以在每个音节中考虑共振峰声音了。于是回到最初的时间(时域)信号而不是采样信号,我们得到如图12.5所示的所需结果,其中每个包络的起点和终点对应于音节起点和终点。

图12.5 带包络的语音信号

这样一来,信号的大部分被保留,所有的元音也被保留,信号中去掉的大部分都是辅音。现在,我们有很多几乎完全是元音的信号。这样,我们又回到最初的那个问题——我们如何来分析这些元音呢?更进一步地,我们如何通过分析元音来解读一个信号呢? 共振峰分析

要解读一个信号,我们先要从确定一个信号等式开始。做到这一点的最好的方法是使用自回归模型。自回归模型就是通过已知输入信号值搜索当前信号估计值的一个简单模型。该模型的等式如下所示:

53 / 156

文档可能无法思考全面,请浏览后下载!

54 / 156

文档可能无法思考全面,请浏览后下载!

这个模型由三部分组成:常数部分、误差或噪声部分、自回归和形式。回归和表示当前的输入值仅取决于先前输入的那些值。变量p是这个模型的阶数。阶数越高,这个表达式的精度就越高。因为系统的阶数可以趋向无穷大,所以我们几乎可以得到这个(信号)系统的一个精确表达式。 搜索共振峰

一旦有了传递函数,就只需要取出包络所包含的音节,使它们通过这一传递函数(所代

表的滤波器)。当你得到传递函数的频率响应之后,你就可以得到一张很好的输出图像。这提供我们一些可以实际去解读的东西。特别是你可以很清楚地看到元音的共振峰,这意味着你可以很清楚地得到频率响应的峰值。这些峰值可以区分元音。例如,观察同一个人发出的这些元音,它们在外观上有明显的差异(见图12.6)。

图12.6 不同元音的共振峰样本 左边是“a”,右边是“ee”

观察前两个共振峰,对每个元音它们的频率和大小有明显的差异。甚至是同一个元音,不同的人(说)也会有不同地峰值。例如,比较不同的说话者发(cat中的)“a”(见图12.7)。即使频率响应的结构相似,(不同讲话人所发的)元音各自具有稍微不同的共振峰,在出现的频率和达到的高度方面有所不同。因此,我们终于有了可以分析信号的方法。现在只剩下最后一步——把这些共振峰与整个组中的共振峰做比较。

图12.7 说话人元音比较:两个说话人发“a”这个音(的频谱图)

最后一步:辨认说话人

当所有的事情都完成之后,系统剩下来要做的事情是很简单的一部分——将输入共振峰

和数据库中的共振峰作一个简单的比较。第一步是要确定我们实际讲的是哪个元音。就是对前两个共振峰的位置的简单测试。如果它们在某个元音的前两个共振峰的范围内,那它们就

54 / 156

文档可能无法思考全面,请浏览后下载!

表示这个元音。这个范围储存在数据库中。这些范围对每个独立的元音都有很好的定义,并且(这个范围)可以适用于组内的所有成员。例如元音的第一个共振峰落在某一范围内,此范围包括组内恰好高于最高频率的第一共振峰和恰好低于最低频率的第一共振峰。如果它不在元音的范围内,那么这个元音就是错误的,系统将继续尝试下一个元音。这个过程将被重复直到找到一个元音(与输入元音一致)或者所有在数据库中的元音都尝试完。如果某个共振峰不属于系统中的所有的共振峰,那么这个元音将被忽略掉。

55 / 156

文档可能无法思考全面,请浏览后下载!

第二步是实际比较。输入元音的频率响应是与每个先前存储在系统里的元音的频率响应

的标量积。这里的元音是指在第一步中确定的元音。得分矩阵是由标量积产生的。得分矩阵将输出一个介于0和1之间的值,1表示完全匹配,0表示完全不匹配。

这个过程对单词中的每个元音重复操作。再把得分矩阵加在一起,然后系统把得分最高

的一个认定为说话人。但是,如果这个人的语音信号没有通过门限值,那么系统将给出没有匹配的系论。

Unit 13 信息安全

Unit 13-1

第一部分:信息安全——介绍和简史

信息安全就是保护数据,防止被未授权地访问、使用、披露、破坏、更改或扰乱。信息安全,常与计算机安全及信息保障这些术语替换使用,因为这些领域之间都是互通的,并且有着一个相同的目标——保护信息的机密性、完整性及可用性。然而,它们之间有着细微的差别,主要表现在选择的切入点、采用的方法、以及关注的领域上。信息安全关注的是信息的机密性、完整性及可用性,对于信息的类型,比如电信号、印制品或其他类型,没有限制。

长久以来,国家和军队的首脑们就意识到信息保护的重要性以及必要性,包括军事能力、军队数量及军事行动。一旦这些信息落入敌人之手,后果将是灾难性的。政府、军队、金融机构、医院和私人企业收集了大量关于雇员、顾客、产品、研究以及金融状况的机密信息。其中大部分的信息通过电脑收集、处理并存储,然后在互联网上传输到其它计算机。万一有关商业客户、财务状况或新生产线的机密信息落入竞争者手中,这样的安全事故就可能导致商业的损失,商务诉讼,甚至企业破产。保护机密信息是一种商务需要,很多情况下也是道德和法律要求。至于个人,信息安全对隐私有着重大影响,这在不同的文化里有着不同的理解。

在书信交流的早期时候,国家和军队的首脑们就意识到,使用特定的机制来保证书信通信安全以及运用特定的方法来检测篡改是很必要的。从书信交流的早期以来,人们理想的安全交流要有蜡做的封口和其他的密封方式,从而表明文件的真实性,防止篡改,同时保证交流的安全性。

据信是朱利叶斯•恺撒发明了恺撒密码,用来防止他的机密消息万一落入敌人手里时被解读。

第二次世界大战给信息安全带来了很大的进步,同时标志着信息安全作为一个专业领域的开始。二战见证了在信息的物理保护上的进步,表现为用设置路障和护卫兵的方式将信息送到信息中心。同时它也见证了数据形式化分类的引入,这种分类建立在信息敏感性和谁能接触它的基础上。二战期间还在准许(当事人)接触机密信息以前进行背景审查。

从20世纪早期到21世纪早期的这几年里,电信业、计算机硬件、软件、以及数据加密产业有着迅速的发展。人们容易获得体积更小,功能更强,价格更低的计算装置,使得电子

55 / 156

文档可能无法思考全面,请浏览后下载!

数据处理能够被小公司和家庭用户所用。

56 / 156

文档可能无法思考全面,请浏览后下载!

通过被广泛称为互联网或万维网的网络,这些被计算机迅速地连接起来。

电子数据处理和互联网电子商务的迅速增长和扩展,同时伴随大量国际恐怖事件的发生,激起了寻求更好的(保障信息安全)方法的需求,以保护这些计算机及其存储、处理、传输的信息。出现了计算机安全,信息安全、信息保障这些学科领域以及各种专业机构,都以保证信息系统的安全性和可靠性为共同目标。

Unit 13-2

第二部分:信息安全的基本原理

20多年来,信息安全的核心原理一直由3个关键概念构成:机密性、完整性、可用性。我们称之为CIA三要素(confidentiality, integrity and availability)。 机密性

通常当我们要办驾照、租房、医保或者申请贷款等时候,想要不暴露自己的个人信息事实上是不可能的。诸如姓名、位置、电话号码、出生日期、社保号、婚嫁状况、子女数量、娘家姓、收入、工作、病史等等,这些都是我们非常个人和隐私的信息,但经常我们仍需要提供这些信息来进行商业活动。我们通常信任向他们透露这类个人信息的人员、公司、机构会采取措施确保我们的信息将得到保护,不会无意或有意向未被授权者披露,同时这些信息将仅仅被有权并且真正需要得知该信息的人所分享。

具有机密性的信息必须只能被授权的人访问、使用、复制和披露,并且应当仅在需要的时候进行访问、使用、复制和披露。当被认为是具有机密性质的信息已被(或者可能已被)未受权接触该信息的人所接触、使用、复制、披露时,即发生了泄密。

例如:当你在处理机密文件时,让一个没有得到授权的人从背后偷看你的屏幕,而屏幕上正显示机密数据的时候,即发生了泄密;如果包含有100000个雇员津贴信息的笔记本电脑被从车里偷了(或者在eBay上卖了)也会造成泄密,因为这些信息到了没有授权的人的手上。把机密信息通过电话告诉给未授权者也是泄密。

所以机密性是对那些持有他人个人资料的机构维护他人隐私的一项要求。 完整性

在信息安全中,完整性意味着未经授权,数据不能被创建、修改、或者删除。这也意味着存储在数据库系统中某一部分的数据与存放在该系统另一部分(或另一系统)的其它有关数据相一致。例如:当数据服务器电源突然中断或者执行了未经维护的不当关机,就会造成对完整性的破坏。当雇员不小心或者恶意删除了重要数据,也是一种对完整性的破坏。当网上购物者能修改他们所购买产品的价格时,信息的完整性就被破坏了。 可用性

56 / 156

文档可能无法思考全面,请浏览后下载!

信息可用性是指当需要某一信息时,信息本身、用来处理信息的计算机、保护信息的安全控制都处于有效可用的状态,并且功能正常。反之则是服务拒绝(DOS)。 结论

信息安全是一个以应有的关注和认真态度对信息和信息系统不断进行(保护)的过程,使之不被非授权者接触、使用、披露、破坏、修改、扰乱。信息安全这一永无止尽的过程包含不断的训练、评估、保护、监视和检测、对事件的响应和修复、形成文档、检查。

1989年,卡内基梅隆大学建立了信息网络学院,美国的第一家致力于信息网络的研究和教育的中心。该学院与一些职业化组织在20世纪末和21世纪初对电脑安全、信息安全以及信息保障进行规范和整合。

可通过自学、高等院校学习、为期仅一周的强化训练营进入这一领域。很多学院、大学和培训公司提供在线的培训项目。信息安全职业对安全专业人员的需求日增,这些专业人员具有网络安全审核、入侵测试、数字取证调查方面的经验。

Unit 13-3

第三部分:入侵检测系统

入侵检测系统(IDS)通常检测主要通过英特网对计算机系统所做的有害的操作,这些操作可表现为破译者的攻击。人们使用IDS来检测多种无法被传统防火墙检测的恶意的网络数据流和对电脑的占用。这包括针对脆弱业务的网络攻击,由数据驱动的对应用程序的攻击,基于主机的攻击如特权扩大、非授权登录并访问敏感文档、恶意软件(病毒,特洛伊木马,蠕虫)。

IDS由几个部分组成:产生安全事件的传感器,一个用来监控事件和警告并控制传感器的控制台,一个由传感器记录事件到数据库,并且用一规则系统通过收到的安全事件产生警告的中央引擎。按传感器类型和位置以及引擎产生警告的方法可用多种方法对IDS进行分类。在很多简单的IDS实现中,这三个部分都被整合在一个单独的设备或装置中。 入侵检测系统的类型

在以网络为基础的入侵检测系统中,传感器位于被监控网络的瓶颈处,通常是非武装区域DMZ或者是网络的边界。传感器捕获所有网络数据流并且分析每个独立包的内容来检查恶意数据流。在系统中使用基于协议的入侵检测(PIDS)和基于应用协议的入侵检测(APIDS)来监测传输和协议的非法或不当数据流,或者语言(如SQL)的收缩。在以主机为基础的系统中,传感器通常包含一个监控所有主机活动的软件代理。也会有这两种系统的混合模式存在。

——网络入侵检测系统是独立的平台,他通过测试网络数据流并且监视操控主机来辨识入

侵。网络入侵检测系统通过连接到集线器、配置过端口镜像的交换机或者网络分接头来获取网络访问。Snort就是一个网络入侵检测的例子。

——基于协议的入侵检测系统包含一个系统或代理,典型情况下该系统或代理位于服务器前

57 / 156

文档可能无法思考全面,请浏览后下载!

端,监控并分析连接设备(用户PC或系统)之间的通信协议。

——基于应用协议的入侵检测系统有个通常和一组服务在一起的监控并且分析在特定协议

上的应用的系统或者代理。例如,在一个带有数据库的web服务器中,当它访问数据库时,这将

58 / 156

文档可能无法思考全面,请浏览后下载!

监测中间件/商务登录的特定SQL协议。

——基于主机的入侵检测系统有一个代理在主机上,它能够通过分析系统调用、应用日志、

文件系统修改和其它主机活动及状态来识别入侵。

——混合型入侵检测系统组合了两种或多种的方案。主机代理数据和网络信息整合后形成一

个对网络的认知。Prelude就是混合型的例子。 被动系统与反向系统

在被动系统中,入侵检测系统传感器探测潜在的安全漏洞,记录信息并且对控制台及(或)使用者发出报警。在一个反向系统(又称为入侵防止系统IPS)中,IDS对可疑行为做出反应,将连接复位或重新对防火墙编程以阻止网络数据流受到疑似恶意来源的影响。这样的情况可能自动发生或有操整理控制。

尽管他们都与网络安全相关,但入侵检测系统与防火墙是不同的,防火墙通过对外部的观察来防止入侵的发生。防火墙限制网络间的访问防范入侵,并且不会对网络内产生攻击报警。入侵检测系统会衡量可疑的入侵,一旦发生就发出报警。入侵检测系统也同时监视系统内部的攻击。

这在传统上通过检查网络通信,确定常见计算机攻击的启发和模式(常称为标识),采取警示操整理的方法来实现。会中断链接的系统被称作入侵保护系统,是应用层防火墙的另一种形式。

物理入侵(被动)检测系统由他们以几英尺的精度准确定位入侵企图绝对地点的能力来区分。系统报告企图入侵突破的坐标位置,可用于激活相应的监控摄像机预置状态或人员派遣。

入侵检测规避技术

入侵检测系统的规避技术通过对IDS和目标计算机制造不同的状态来躲过检测。对手通过自己操纵攻击或者操纵包含攻击的网络流量来达到此目的。

Unit 14 远程医疗和生物医学信号处理

Unit 14-1

第一部分:远程医疗

远程医疗可以简单到两名医务工整理通过电话讨论病情,或者复杂到通过卫星技术和视频会议系统在两个不同国家的医学专家之间进行实时的医疗咨询。同时这种医疗也包含使用无人操纵的机器人。通常,远程医疗指的是通过通信和信息技术来进行临床保健。

远程服务(也称为缺席服务)是一项古老的业务,通常通过通告来实现;缺席医疗服务具有漫长而成功的历史,由于有了现代通信技术,它已发展成为现在我们所了解的现代远程医疗。

在其早期的表现中,非洲的村民们使用烟作为信号警告人们离开村庄,避免严重的疾病。

58 / 156

文档可能无法思考全面,请浏览后下载!

在20世纪初,生活在澳大利亚偏僻地区的人们用由自行车踏板驱动的发电机提供能源的双向无线电来与澳洲皇家飞行医生服务进行通信。

有时,电子保健和远程保健这些概念会和远程医疗混淆起来。就像医疗和保健两个词有所不同一样,远程医疗通常仅指提供临床服务,而远程保健可以指临床和非临床的服务,后者如医学教育、行政管理和研究。

59 / 156

文档可能无法思考全面,请浏览后下载!

电子保健这个概念特别在英国和欧洲通常是一个总括词,包含远程保健、电子医疗记录、和其他保健信息技术中的元素。 远程医疗的类型

远程医疗基于两个概念来实行:实时(同步)和保存并转发(异步)。

实时远程医疗可以像电话那样简单,也可以像机器人外科那样复杂。它的实现需要双方同时在线,并在他们之间有通信连接,允许实时交互发生。电话会议设备就是当前同步远程医疗中运用最广泛的类型之一。另外还有外部设备可以接到计算机或视频会议设备上,在交互检查中提供帮助。就好比,远程耳镜可以让远方的医师“观察”病人耳中情况,而远程听诊器可以让咨询医师听到病人的心跳。有助于这种咨询的医学专科包含精神病学、内科医学、康复学、心脏病学、小儿科学、妇产科学以及神经学。

保存并转发的远程医疗包含获取医学数据(如医学图像、生物医学信号等等),然后在方便的时候将这些数据发送给估计不在线的医生或医学专家。该方式不需要双方同时在线。皮肤医学、放射医学和病理学是有益于异步远程医疗的一些普遍专科。一个结构适当、更适宜电子形式的病史档案将是这种转发中的一个必要因素。.

远程医疗对于那些生活在孤立社区或偏远地区的人群最为有帮助,而且事实上目前正应用于所有医疗领域。有关远程医疗的运用都有一个特性,就是用”tele”(远程)做前缀,比如,放射学家使用的远程医疗就被称为远程放射学。同样的,心脏病学家使用的远程医疗就被称为远程心脏病学,等等。

远程医疗也是全科医生与远地专家之间有用的交流工具。

远程医疗的焦点主要是咨询,意味着全科医生向专家咨询,或者一位专家向另一位专家咨询。使用已知的设备,如血压计,在家中监控病人并把信息传给看护人员的方式正成为一项快速发展的服务。这些远程监控方案主要是针对当前高发病率的慢性病,并主要在第一世界中运用。发展中国家正在出现一种新的远程医疗实施方法,常称为“基本远程诊断访问”,通过该系统用设备对病人进行检查,而实际上由另一个国家的联线医生来进行检查和治疗。这一新的医疗实践技术和原则,给一些问题的解决,比如向非洲南部区域提供基本保健服务的问题,带来了一大希望,因为基本远程诊断咨询不仅可监测已诊断出的慢性病,还可对病人通常会求助于全科医生的疾病进行诊断和管理。 远程放射学

远程医疗是指远距离的传输保健方法和交流保健信息。远程放射学则是一种将射线图像(X光)从一处传到另一处的功能。要实现这个过程,需要三个基本要素:一个图像发送站点、一个传输网络、和一个接收/图像重新检查站点。

远程放射学的实现从图像发送站点开始。这个第一步需要射线图像和一个调制解调器。图像进行扫描,然后发送到调制解调器。

传输网络可以是电线、光缆或微波。在数字信号发送到调制解调器之后,电脉冲会通过传输网络发送到接收/图像重新检查站点。接收/图像重新检查站点由一个调制解调器、一台有充足存储容量的计算机,一台显示器组成,有时也有一台打印机以给终端用户提供硬拷贝。

59 / 156

文档可能无法思考全面,请浏览后下载!

通过传输网络生成的电脉冲由重新检查站点的调制解调器接收。在到达重新检查站点后,这些脉冲将会转换为原始的数字图像,然后这些图像将被存储,并可在诊断时通过显示器观看。硬拷贝被打印出来以提供更多的便利。

60 / 156

文档可能无法思考全面,请浏览后下载!

显然,随着关注远程医疗仪器的公司数量的增加,以及这些公司专业度的上升,可以预见在不远的将来,远程医疗将成为医师、医院及兽医诊所运作的一种重要的方式。

Unit 14-2

第二部分:计算机层析成像

层析成像指的是通过从许多不同方向照射物体,根据透射或反射的数据对物体断面成像。这一技术对诊断医学的影响是革命性的,因为它使医生能以前所未有的精度看到体内的器官,并且对病人来说是安全的。层析成像最初的医学应用是用X射线对组织进行成像,这是基于X射线被人体组织的衰减系数实现的。后来利用放射性同位素、超声、磁共振也成功地实现了医学成像,在每一种情况下用不同的参数成像。

还有大量的非医学应用也可使用计算机层析成像方法。研究者已经将此方法用在许多方面,例如通过钻孔成像测绘地下资源,无损检测中断面成像的某些特殊案例,确定天球面上的亮度分布,以及电子显微镜三维成像。

层析成像基本上是一个由投影重建图像的问题。严格来说,某一角度的投影是图像在该角度所指定的方向上的积分,如图14.1所示。然而在宽泛的意义上,投影是指物体从某一角度受到照射时由发出的能量所形成的信息。若辐射源是衍射性的如超声波或微波,可使用“衍射投影”一词。

虽然从纯数学的角度,对于如何根据投影数据重建图像这一问题的解要追溯到1917年Radon的论文,但当前在断层成像方面令人激动的成就源自Hounsfield发明的X光CT扫描,他因此项发明而于1979年获得了诺贝尔奖。他和与独立发现某些算法的Allan Cormack分享这项大奖。他的发明显示,尽管投影数据并未严格满足高效实现重建算法赖以成立的理论模型,仍有可能计算精度达千分之一的高质量断面图像。该项发明同时也表明,有可能通过用相当复杂的数学运算处理大量测量数据(现在对X射线CT接近100万之多),仍然可获得非常精确的图像。

可以说自从Hounsfield的发明以来,X光CT图像改进的快速度在很大程度上要归功于重建算法方面的发展。Hounsfield用代数方法重建了大小为80

80的噪声颇大的图像,精

度为百分之一。随后是卷积反向投影算法在这种成像中的应用,这些后来的算法最初由Ramachandran和Lakshminarayanan发展起来,以后Shepp和Logan使之被广泛采用。这一算法大大减少了重建所需的处理时间,得到的图像在数值上也更为精确。其结果是X射线层析成像扫描装置的制造商开始生产能重建256256和512512图像的系统,所形成的形态细节清晰可辩,并与解剖结果完全一致,在这一意义上这些图像几乎达到了照相术上完美的程度。

在X射线CT取得巨大成功的情况下,近年来更多的注意力集中于将这一成像技术进行扩展,一方面扩展到核医学和磁共振中,另一方面扩展到超声和微波领域。在核医学中,我们的兴趣在于重建人体内放射性同位素分布的断面图像;在磁共振成像中,我们希望重建对象的磁学性质。在这两个领域都可以建立起如图14.1中这类投影来重建图像的问题。用超

60 / 156

文档可能无法思考全面,请浏览后下载!

声波和微波作能源时,尽管其目的和X射线CT相同,即重建某一参数(例如衰减系数)的断层图像,但情况却有所不同。X射线是非衍射性的,也就是说它们沿直线传播,而微波和超声却具有衍射性。当使用衍射源照射物体时,尽管当场的不均匀范围远大于波长并用折射率作为成像参数时,可以满足于直线传播的假设,波实际上是向四面八方散射的。对于必须考虑衍射效应即由波散射引起不均匀性时,层析成像原理上可以用基于Fourier衍射定理的算法实现。

61 / 156

文档可能无法思考全面,请浏览后下载!

Unit 15 遥感

Unit 15-1

第一部分:遥感技术综述

在150多年前,现代遥感技术伴随着照相机的发明应运而生。尽管一开始,很早期的照片是地面的静态图片,19世纪40年代,为了绘制地形图,当照相机被放在系留气球上来拍摄照片,俯视地球表面的想法和实践开始了。19世纪末最新的平台也许是在欧洲作为新奇事物的著名的鸽子群。到了第一次世界大战,安装在飞机上的照相机能够提供相当大表面区域的俯视图,这在军事侦察方面是价值无量的。从那时到20世纪60年代早期,航空照片是从垂直或倾斜角度描绘地球表面的唯一标准工具。

人造卫星遥感技术可以追溯到太空时代早期,实际上,它最初是在太空飞船上使用多种传感器对表面成像的方法。20世纪60年代,随着太空计划出现,环球轨道宇航员很像旅行者通过太空船的窗口进行拍照。

现在“遥感”这个词被普遍用来描述在不与目标直接接触的情况下,对目标进行识别、观察和测量的科学技术。这一过程包含检测和测量从远处目标反射回来或发射出来的不同波长的辐射,由这些辐射,可按种类、物质、空间分布对目标进行识别和分类。 辐射

除非是绝对零度(273C),物体总是以一种特殊的方式反射、吸收和放射能量。这种能量,被称为电磁辐射,它以波的形式发射,其能量能够从一个地方传输到另一个地方。例如,树,空气,太阳,地球和所有的恒星和行星都一直反射和放射大范围的电磁波。这些波是由亿万个振动的电子、原子、分子发出的,它们以独特的波长组合发出和吸收电磁辐射。一个物体发射电磁波的量主要依赖于它的温度。物体温度越高,电子振动就越快,发射出的电磁波峰值波长就越小。 电磁波谱

电磁现象的基本单元是光子,它是某一波长的电磁波能量可能的最小量。独个光子能以波的形式运动,速度可达光速300,000 km/sec,就像波浪在海洋中传播一样。一个光子的能量决定该光的频率。光子的能量越大,该光的频率就越大,反之亦然。

完整的电磁波排列组成电磁波谱。之所以称其为电磁波是因为它们包含了当带电粒子(电子)加速时产生的组合的电波和磁波。电磁波谱划分成几个区域并分别命名。在高频端是γ射线和x射线。在紫外线区域的电磁波的波长范围大约从1纳米到0.36微米。可以很方便地用以下两个单位度量频谱的中频段:微米,它的长度相当于

61 / 156

文档可能无法思考全面,请浏览后下载!

一米的百万分之一,或者是纳米,它的长度相当于一米的十亿分之一。可见光区域的范围从0.4微米到0.7微米。红外波段的范围为0.7微米到100微米。红外线在其较短波长上(接近0.7微米)可以用特殊的薄膜探测,而在其较长的波长上感觉是热量。

以毫米到米为单位来测量较大波长区域。微波区域从1毫米到1米,它包含了用于雷达系统的所有波段,雷达系统是自己主动产生辐射,发射到感兴趣目标并从感兴趣目标反射回来。频率最低的区域,波长大于1米,称为无线电波。 吸收带和大气窗口

有几种电磁辐射很容易地穿过大气层,而其他的则不能。大气层允许辐射穿越的能力随辐射波的波长或类型而变化。构成大气层的气体吸收某些特定波长的辐射而允许另一些波长的辐射通过大气层。

能够被水蒸汽,二氧化碳和臭氧等大气层气体吸收的电磁波谱区域称为吸收带。吸收带传输量很低,对应于特定的波长范围。

对比于吸收带,有些电磁波谱的区域,大气对于特定的波长是透明的。这些波段称为大气窗口,因为它们能让辐射很容易穿过大气到达地面。

大多数装在飞机或太空平台上的遥感仪器工作在一个或多个这样的“窗口”范围里,这是通过将其检测装置调谐在能穿透大气层的特定频率(波长)上而实现的。当遥感仪器的视距覆盖到正在反射太阳光或放射热量的物体时,这种装置就收集和记录辐射的能量。然而大部分的遥感系统都被设计用来收集反射能量,某些传感器,特别是那些气象卫星上的传感器,直接测量吸收现象。大气对部分中红外和所有的远红外波段的电磁波辐射几乎是不透明的。相比之下,在微波段的大部分辐射不受阻碍,因此雷达波能到达地面。 像素,比特和颜色

利用无线电波,从地球轨道卫星得到的数据能以一种常规的方式发送到具有适当装备的地面基站。当接收到这些数据后,它们被转换为能够在电脑屏幕上显示的数字图像。卫星图像由许多小方块组成,每一个方块拥有不同的灰度或颜色。这些方块称为像素,表示那部分图像记录的相对的反射光能量。

每一个像素描述图像上的一个正方形区域,它是传感器分辨不同尺寸对象的能力的度量。比如,在Landsat卫星7上的增强型专题制图仪拥有最大为15米的分辨率,因此每个像素描述的区域为15米*15米,或者225m。较高的分辨率意味着传感器能辨别更小的对象。通过合计一幅图像的像素数目,能够计算某个场景的范围。例如,如果你能计算在人造彩色图像中的绿色的像素点数目,你就能计算整个植物带的覆盖范围。

太空船使用8位二进制数字,它的范围为00000000 到 11111111(即十进制中的0到255)。用8比特的数据,我们将图像中最暗的点赋值为0,最亮的点赋值为255。这就在黑和白之间产生256个灰度值。正是这些二进制数字使得太空船可以发回各行各列的像素,而通过电脑能明白每个像素数值。

大多数遥感图像的另外一个重要因素是颜色。虽然变化的黑白图像具有较大的信息量,但人眼能区分的不同灰度色调局限在大约20到30级。另一方面,人眼能区分20000或更多

62 / 156

2

文档可能无法思考全面,请浏览后下载!

的色彩,这使得目标物体内小的但往往是重要的变化会被辨别出来。

63 / 156

文档可能无法思考全面,请浏览后下载!

因为不同的频带(或波长)拥有不同的对比度,计算机能从黑白遥感数据中产生彩色图像。计算机屏幕能使用蓝光,绿光和红光显示三种不同的图像。结合这三种光波长将产生我们眼睛能看见的彩色图像。这是通过显示黑白卫星图像完成的,它与蓝,绿,红光的不同波段相对应来实现波段间的相对对比度。最终,当这三种颜色结合在一起,一幅彩色图像,称为伪彩色图像,就产生了。 遥感方法

有两种遥感仪器——被动的和主动的。

被动仪器检测从观测场景反射或发出的自然能量。被动仪器只感知被观测对象发出的辐射或来自某个源而不是仪器的被对象反射的辐射。反射太阳光是被动仪器最常检测的外部辐射源。科学家们常使用各种各样的被动遥感仪器。

1.辐射计:一种在频谱某些波段上定量测量电磁辐射强度的仪器。辐射计通常又按其覆盖的频谱范围来区分,例如可见光、红外、微波。

2.图像辐射计:一种具有扫描能力,能提供用以生成图像的像素二维阵列的辐射计,称为图像辐射计。扫描可以机械实现或用探测器阵列电子实现。

3.分光计:一种设计来检测,测量和分析入射电磁辐射光谱成分的仪器,称为分光计。通常,图像分光计用光栅或棱镜分散辐射来分辨光谱。

4.分光辐射计:一种能测量在多重波长段中辐射强度的辐射计。这些频带经常具有高分辨率,是为特定参数的遥感而设计的,如海面温度、云地特性、植被、大气层的微量化学成分等。

主动仪器自己提供能量(电磁辐射)来照射要观察的对象或场景。它们从传感器向目标对象发送一个脉冲能量然后接收被对象的反射或反向散射的辐射。科学家们使用许多不同种类的主动遥感仪器。

1.雷达(无线电探测和搜索):雷达用一个工作在射频或微波频率的发射机来发出电磁辐射,用一个方向性天线或接收器来测量从远处目标反射或反向散射回来的辐射脉冲的到达时间。由于电磁波以光速传播,到达对象的距离就能被确定。

2.散射仪:散射仪是一种高频微波雷达,专门设计用来测量反向散射辐射的。海平面上在微波频谱区域对反向散射辐射的测量能够获得海平面风速和风向图。

3.激光雷达(光检测和搜索):激光雷达利用激光发射机发射光脉冲,带有敏感检测器的接收机来测量反向散射或反射光。到达对象的距离通过记录在发射的和反向散射的脉冲之间的时间决定,并用光速来计算传输的距离。激光雷达能测定气体中的悬浮微粒,云层和大气的其他成分的大气概图。

4. 激光测高计:激光测高计利用激光雷达测量仪器平台离开表面的高度。通过独立地获取平台相对于平均地球表面的高度,就能确定地表面的地形图。

Unit 15-2

第二部分:使用遥感技术监控全球变化

63 / 156

文档可能无法思考全面,请浏览后下载!

为了适当地反应自然和人为因素对湿地的影响,资源管理者必须考虑他们的方法和评价,遥感技术是一种重要工具来监控湿地对于全球气候变化和海平面上升造成的在水文情势和水质方面的变化的反应。

64 / 156

文档可能无法思考全面,请浏览后下载!

大片的湿地,沼泽和红树林覆盖美国大部分的海岸线。海岸湿地除了作为营养物的重要来源以外,它还是鱼类和虾类的繁衍地以及许多鸟类,毛皮动物的栖息地。它们对沿海休闲也是重要的,并且能保持水质,成为防止海岸侵蚀的屏障。

在美国,湿地萎缩是由沼泽的填充,开挖水渠、河道,河流淤泥向海面转移造成的。土壤保持的实践和防洪结构,比如说大坝和防洪堤,都防止沉淀物到达湿地。夹杂着这些人类因素的作用,海平面的上升更是对海岸湿地会造成严重的影响。值得关注的是,海平面在全球以每年1mm到2mm的速度上升。然而,预测这种上升的速度还在继续增长并且到2100年海平面将升高50cm。这些问题特别切合于海岸湿地,在那里横跨内陆每一公里的海拔高度上升可能只有10厘米。 如果温室效应被证实是全球气候变化的部分原因,还要超出这些(上升的)水平。

海岸水文地理学受控于表面形貌学,地表水系,土壤特征和本地潮汐动态学。随着海平面上升速度的加快,潮汐动态会对低的海岸湿地的水文变化起主导作用。对这些湿地的影响将导致土壤盐分水平,洪水持续时间和频率以及海水质量也发生变化。因此预测这些变化会对目前和未来湿地动植物种类分布造成怎样的影响是必要的。为了做这些预测,首先确定沼泽地类型和水文地理学的关系是必要的。美国地理调查局科学家们所进行的遥感研究集中于将地面和卫星测量结合起来,开发测量和监视对确定这些了解极为重要的工具。他们也开发了一些技术以形成海岸地形来模拟基于无覆盖连接和海平面上升的假设造成的未来湿地变化。 湿地类型

结合从Landsat TM卫星、彩色红外照片、ERS-1卫星雷达上获取的数据,构建了沼泽和森林体系的累进分类,改进了分类精度,导致佛罗里达州几乎单一黑色的沼泽地中有差异地区的细致区分。在植物特征和水文地理学间的关系能准确描述之前,这类对海岸地形区分的改进是必要的。 植被量

与生物数量有关的植被指数是由被动的微波数据和Landsat TM卫星数据产生。基于红光和近红外光波长的光学TM植被指数主要是与单位面积的绿色物体数量变化相关联。基于测量在6cm 和21cm微波波长发射的能量的微波植被指数,主要是反映植被水含量。图像是非常的相似。如果微波仪器被证实是能够合理评估这些湿地中生物数量的仪器,就能根据这全天候天气和昼夜工作的传感器来开发一个监控项目。 监测洪涝

卫星雷达用于绘制潮汐流地图,这是对海岸植被分布重要的控制。雷达图像直接将沼泽地洪涝与低落的雷达回波了解起来,这些图像是在几乎连续不断的一段时间里对地面水文学测量的记录。结合洪水和表面地形的各点测量,全天候的,昼夜工作的仪器允许动态地监测洪水状态和洪水深度水面的生成。 水面微地形学

64 / 156

文档可能无法思考全面,请浏览后下载!

用三个洪水范围向量和两个海拔高度等高线构建了低矮海岸沼泽的地形学表面模型,洪水范围向量由卫星图像数字化得到,等高线由美国地理调查局的地形四边形得到。除了突变的边界和超出给定等高线范围的地形高地和低地,747点的测量结果和建模的海拔高度平均约

65 / 156

文档可能无法思考全面,请浏览后下载!

14厘米,但更常见的是平均约8厘米。这个地形精度比当前用于这片区域的150cm地形学方案改善了5/9。 土壤湿度和深度

通过测量微波区域内发射的能量,海岸沼泽和森林系统中地下水层的深度和土壤湿度能被绘图。然而这些结果是初步的,水文地理参数的空间图案是与海岸湿地系统的知识一致的。如果可以证明它是用来测量土壤湿度和地下水深度的可靠评估器,这种技术就能使我们了解这些因素是如何与保持湿地功能相关联的。

通过遥感,就能够动态收集湿地特征状况的信息,这些信息使我们能快速地并反复地评估大片区域的变化。通过提供高速的、低成本的、更新的数据,遥感技术就能提供重要信息来管理由于自然或人为因素影响造成变化的海岸湿地。

Unit 16 计算机:系统和编程

Unit 16-1

第一部分:照管好你的电脑

退到DOS系统时代,计算机相对地容易照管。那你最担心的事情不过是硬盘崩溃或文件列表的破坏。是的,硬盘变成了碎片,不过早期硬盘很小。在那些年(1985-1991),我拥有20兆字节的硬盘。Windows变得越来越普遍,计算机开始演化,很多事情变化很快。计算机小了,硬盘大了,价格低了。

即使今天,计算机仍是一项重要的投资,你应该照管好这项投资。仅需要一点关心,你就可以用很长时间。很容易去做,不需要花费很长时间。长久来看,如果你能照管好计算机,你将会更加喜欢它。因此,让我们看看你能做哪些事情让你的计算机健康,平稳地运行。 整理碎片

无需复杂的解释-硬盘会分成碎片!安装和卸载软件担保它这样。不久会出来“关于…”的文章,但是现在只要知道你的硬盘是注定要分成碎片的。碎片涉及到程序和数据的路径文件,记录在硬盘上。它与你的硬盘在物理上变成碎片不同,但是如果你的硬盘变得太碎,看起来就好像崩溃一样。

当你的硬盘变成碎片的时候,使得你的硬盘工作困难。你的计算机似乎较慢。有时似乎是很慢。不同于其他类型的软件,处理磁盘碎片的软件数量较少。我个人选择Executive Software公司的软件Diskeeper Professional。连接到他们的服务网站,他们也有家庭和企业版的。令我喜欢它的原因是,它有一次设置,终身无忧的特点。在我所有的计算机上,Diskeeper通常每晚10点运行到次日上午4点。我喜欢它因为当我不工作的时候它可以运行,更重要的是我知道碎片整理的完成与否。当我很忙的时候也不可能忘记。因此,无论采取什么方式,都要使你的计算机进行碎片整理。那样会使你的计算机快速稳定地运行,也会使你的硬盘寿命更长。

65 / 156

文档可能无法思考全面,请浏览后下载!

病毒保护

有很多计算机病毒在传播。也有蠕虫、特洛伊木马和炸弹。此处,我们把这一切都叫做“病毒”。摧毁你的计算机最快的方法之一是没有病毒防护。然而一些病毒最初仅是骚扰性的,而许多非常有破坏性。它们能破坏你的文件和数据,甚至你的硬盘。要保持你的计算机处于最佳状态,只有运行反病毒软件并保持不断更新才是明智的。如果你有反病毒软件却不更新它,那是毫无意义的。就像拥有人寿保险单但不付钱一样。现在有许多反病毒软件:诺顿反病毒、F-Prot 反病毒软件、Windows下的Vexira 反病毒软件,McAfee病毒扫描软件。

我个人用的是McAfee病毒扫描软件,我的每个计算机都在订阅这个软件。我喜欢这个软件,因为联网时它会时时自动更新。它比较有效,迅速,全面。无论你用哪种反病毒软件,请记住最重要的是保持更新。 间谍软件防护

间谍和恶意软件最近成了热门话题。人们关心的是他们的隐私和权利。间谍和恶意广告软件都能够降低你的计算机速度,也能导致其他的问题。得到更多关于恶意广告软件的信息就查看名为什么是恶意软件的文章。当你查看名为什么是间谍软件的文章时,可以找到更多关于间谍软件的信息。重要的是通过运行软件将会排除这些威胁,保护你和你的计算机。仅包括一些程序:间谍软件医生,布鲁特反病毒软件,GhostSurf软件。

我个人喜欢GhostSurf 2006版,因为它能防止恶意广告软件和间谍软件,并且在网络上保护我的隐私。无论用哪种软件,请确保更新它。 注册清除和修复

Windows注册包括你计算机上的每一件事的总和。不幸的是,它有时也包括在你计算机里用过而没有被清除的东西。这些垃圾增大了注册的容量使其运行很慢。就像碎片硬盘一样。因此,为了使你的计算机处于最佳状态,我建议用程序清除注册。仅有几个软件可以应用,包括:注册机、注册急救、Windows注册修复SE、注册修复、混合程序。

现在有几种比较好的程序可以执行多种功能,使你的计算机稳定地运行。这些软件能清除注册,移动垃圾文件,改变Windows搜索和运行的路径及其他功能。我最喜欢的几个包括:TuneUp系统优化软件、高级系统优化、系统修理工。

我用的是最近发布的2006版TuneUp系统优化软件,它能够清除垃圾文件,清除记录,分析启动项以及做其它更多的事。 结论

你的计算机是你应该照管的一项投资。如果你好好照管它,它将会对你帮助很大,寿命更长。通过整理硬件驱动,病毒和间谍软件防护,清除注册,移除垃圾文件,你能够使你的计算机以它本来的速度运行。

66 / 156

文档可能无法思考全面,请浏览后下载!

Unit 16-2

第二部分:计算机导购指南——PC与苹果计算机

67 / 156

文档可能无法思考全面,请浏览后下载!

介绍

计算机是21世纪人类日常生活的一个重要部分。我们每天都把大量的时间用在计算机上,用它来工作、学习。我们所使用的绝大部分计算机都被称作个人计算机(简称PC)。随着IBM在1981年推出了PC,个人计算机市场的序幕也由此拉开。自那时起,市场上的计算机公司和计算机制造标准就不断地起起落落,兴盛交替。后来就形成了2套标准:由苹果公司制造的苹果计算机,以及由其他公司制造的PC。

在1984年,苹果公司设计制造了第一台名为Macintosh的个人计算机。自那时起,苹果公司就是唯一一家制造,销售和支持Macintosh个人计算机的公司。苹果公司拥有对Mac/Macintosh机中包括硬件和操作系统在内的完全控制权。

其他的就是那些我们所熟悉的电脑制造商,如Dell,IBM和Gateway等。在这个指南中的剩余部分,当提到PC时,指的就是这些公司制造的计算机,而不是苹果公司制造的计算机。这些公司出售由各外围设备公司提供部件而组成的计算机,将它们集成在微软视窗操作系统之上。没有一家公司拥有对PC中硬件的完全控制权。 过去

尽管对所有硬件和操作系统拥有完全的控制权看起来是一个好主意,但这一方针最初使苹果公司受挫。二十世纪80年代和90年代,PC的发展基本上主宰了个人计算机市场,使苹果公司所占市场份额远远落后。由于市场上苹果计算机的数量不够多,再加上苹果计算机的可选择软件少,许多常用软件都无法在Mac平台上使用,但是PC能够兼容各种软件。

封闭性的平台而没有竞争,加上可选择软件不足,使得许多有兴趣购买个人计算机的人对苹果计算机印象不佳。于是就有了苹果计算机不如PC兼容性好的看法。 现在

然而个人计算机市场从新千年开始就越来越有活力。更多的PC制造商能够进入这个市场,并保持竞争力。微软视窗操作系统和Intel奔腾处理器成为个人计算机的制造标准。尽管苹果公司仍通过对硬件和操作系统的完全控制权来保证Mac平台封闭,苹果计算机已具有自己的特色:极佳的稳定性和视觉效果。是否是封闭式平台没有关系,苹果计算机现在可以做PC能做的任何事情,因而摆脱了与PC不兼容的印象。

苹果计算机和PC很好共存于当今世界,硬件兼容,软件有效。 为什么要买PC?

几乎所有人都熟悉今天的PC。PC就是一台由Dell、Gateway、Compaq等公司所制造的带有微软视窗平台的计算机。微软视窗是一个标准的软件操作系统, 大量现有软件都是为这个操作系统设计的。如果你要用计算机来完成某些工作,你必然可以找到许多在微软视窗平台上工作的软件帮助你完成这个工作。PC是现在最常见计算机类型,对软硬件有极佳的兼容性。

购买PC的主要优势在于PC能够兼容个人计算机市场的所有软硬件。 为什么要买苹果计算机?

67 / 156

文档可能无法思考全面,请浏览后下载!

在过去的几年里,苹果计算机的质量和速度都得到很大提高。从Mac OS X及最新的iMac和G3/G4/G5系列苹果计算机发布以来,苹果公司在把计算机使用变得简单轻松方面取得巨大进步。现在苹果计算机的操作就很简便,而且平均出错率也低于PC。苹果公司也同样致力于提高可选择软件的数量,因此现在有大量软件可同时应用于PC和苹果计算机。

68 / 156

文档可能无法思考全面,请浏览后下载!

购买苹果计算机的主要优势在于苹果计算机更易操作,出错少,也可以做PC能做的任何事情。 结束语

当你购买一台计算机时,你要知道无论是PC还是苹果计算机都有它们各自的优缺点,没有一个明显的界限来帮你做出决定。

在做决定时,你要知道PC和苹果计算机能做相同的工作。无论是浏览因特网,收发电子邮件,即时聊天,创建文件或者演讲文稿,收听、编辑或创建一段音乐或视频,PC和苹果计算机同样可以做好这些事。

最终的决定往往还是由个人偏好决定的:你想要一台使用简单轻松的计算机,还是想要一台可以与市场上任何软硬件都兼容的计算机呢?

Unit 16-3

第三部分:面向对象编程语言

面向对象编程语言(OOPLs)实现面向对象设计的自然选择,因为它们直接支持类、继承、信息隐藏和动态绑定等对象概念。因为面向对象编程语言支持这些对象概念,这使面向对象的设计更易实现。用面向对象编程语言开发的面向对象系统,在系统的设计和实现上难度较小。这就提高了该系统的可维护性:通过改进软件系统及其组成,我们可以修改系统错误,提高系统性能或其他系统特性,使系统适应变化的环境。这项技术的根源可以追溯到19世纪60年代早期,Nygaard和Dahl开发了第一个面向对象语言Simula 67。19世纪70年代随着施乐公司的Smalltalk的开发,这项技术得到新的发展。现有的面向对象编程语言有C++,Objective C,Smalltalk,Eiffel,Common LISP对象系统,Object Pascal,Java 和 Ada 95.

传统编程语言和面向对象编程语言都可用以编写面向对象的应用软件,但在面向对象编程环境下编写会更简便。面向对象编程语言的专家把面向对象编程语言分为混合编程语言和纯面向对象编程语言两类。混合编程语言是在非面向对象模式的基础上,加入一些面向对象概念。C++(C语言的超集),Ada 95,CLOS(LISP的对象加强版本)都是混合编程语言。纯面向对象编程语言是完全基于面向对象准则的编程语言。Smalltalk,Eiffel,Java和Simula都是纯面向对象编程语言。

在应用数量方面,最流行的面向对象的编程语言是C++。它用于商业开发的一大优点就在于和人们熟知并已使用的C语言句法相似,从而降低了培训费用。此外,C++支持包括类,继承,信息隐藏,多态性和动态绑定等所有面向对象概念。C++的劣势在于它多态性和动态绑定的程度未达到大多面向对象程序员的期望。Ada 95 是一个可靠的标准化语言,适用于开发大型复杂可靠的系统。

除C++,Ada以外,另一个常用的编程语言就是Smalltalk。它的优势在于它的一致性和灵活性,其劣势在它不为大部分人所熟悉,这就提高了培训费用。此外它与现有系统不兼容,而与现有系统兼容恰恰就是C++的主要优势。

68 / 156

文档可能无法思考全面,请浏览后下载!

我们强烈推荐用面向对象语言来实现面向对象分析(OOA)和面向对象的设计(OOD)。AT&T贝尔实验室使用面向对象的设计和面向对象编程语言,在一个称为CADCS的大项目中实现了缩短产品开发时间、提高代码和分析设计所得结果的重用率。这个庞大的项目包含有超过三十五万行C++代码,这些代码可以在遍布美国的超过100个远程系统的一个中央处理器上运行。在CADCS项目两个版本的开发期间,与采用传统软件开发技术和编程语言的相似规模项目相比,OOD技术的应用和随后面向对象编程语言的实现减少了30%的开发时间,节省了20%的开发人力。

像贝尔实验室这样的机构发现,通过在导向和训练课程中引入面向对象的编程技术,开发者能够对OOPL构建进行适当(充分)的学习和实验。这就导致了面向对象技术的使用增加,如许多CADCS软件就可以在相似的项目上重复使用。

如Ada 95和C++等面向对象的编程语言都可用于开发传统的非面向对象软件。通过避开面向对象编程语言的特点就可以开发这些软件。有许多现有商业、国防部及政府的应用软件都是这种类型的。

对于用计算机辅助软件工程(CASE)开发工具产生的OOPL代码,开发者必须决定要产生哪种编程语言:C++,Ada 95,Smalltalk,Java还是CLOS。使用某个OOPL会限制CASE工具的选择范围,因为特定的某个CASE工具可能不支持某些编程语言。然而,要是不必考虑语言生成,那么可以基于功能和设计能力来选择CASE工具而不管用什么OOPL来实现。

不同的OOPL支持不同程度的对象概念,如继承,不同的OOD不一定完全按照OOPL来构造。因此我们可以根据使用OOD来选择使用哪一种OOPL。如果OOD还没有确定,那么使用哪种OOPL就由开发者的培训情况来决定。

OOPL在全球许多商业环境,国防部,政府应用及政府项目上得到广泛应用。每个OOPL都有许多相关的资料和培训课程。

在接受OOPL的专业培训和购买相应的编译器后,我们就可以使用OOPL技术了。完全培训开发人员的成本表明,只有对于新开发项目(而不是已有系统的维护),而且只有在试验性项目顺利完成后,才应该引入该项技术。

传统编程语言或面向对象编程语言都可用来开发面向对象和非面向对象的应用软件。为了完全实现对象概念的优势,直接用面向对象的编程语言来写应用软件要显得更为简单。

Unit 17 计算机和网络

Unit 17-1

第一部分:计算机的进展 计算机和信息技术的进展

计算机和信息技术的诞生可以追溯到许多世纪以前。数学的发展引起了计算工具的发展。据说17世纪法国的Blaise Pascal构建了第一台计算机。在19世纪,常被推崇为计算之父的英国人Charles Babbage设计了第一台“分析机”。该机器有一个机械的计算“工厂”,

69 / 156

文档可能无法思考全面,请浏览后下载!

类似于19世纪早期的提花织布机,采用穿孔卡片来存储数字和处理

70 / 156

文档可能无法思考全面,请浏览后下载!

要求。Ada Lovelace和他(Charles Babbage)致力于设计并提出了指令序列的概念——程序。到1871年Babbage逝世,这台机器还没有完成。

将近一个世纪以后,随着电子机械计算机的发展(程序)这一概念再次出现。1890年,Herman Hollerith采用穿孔卡片帮助美国人口普查局分类信息。与此同时,电报电话的发明为通信和真空管的发展奠定了基础。这一电子器件能够用于存储二进制形式的信息,即开或关,1或0。

第一台数字电子计算机ENIAC(电子计数积分计算机,见图17.1)是为美国军队开发的,并于1946年完成。普林斯顿的数学教授Von Neumann对(程序)这一概念作了进一步深入的研究,加入了存储计算机程序的思想。这就是存储在计算机内存中的指令序列,计算机执行这些指令完成程序控制的任务。

图17.1 ENIAC:第一台数字化电子计算机

从这一阶段开始,计算机和计算机编程技术迅速发展。从真空管发展到晶体管,大大减小了机器(计算机)的尺寸和成本,并提高了可靠性。接着,集成电路技术的出现又减小了计算机的尺寸(和成本)。20世纪60年代,典型的计算机是基于晶体管的机器,价值50万美金,并需要一个大空调房和一名现场工程师。现在相同性能的计算机只要2000美元,并且放在桌上(就可使用了)。随着计算机越来越小,越来越便宜,计算速度也更快——通过叫做芯片的单个集成电路来实现。 微处理器和微型计算机的发展

微型计算机随着集成电路(或芯片)技术的发展而发展。这一技术使得计算机逻辑被“烧入”芯片层中。一个面积为5 mm的芯片可以包含计算机处理器运行程序所需的所有逻辑。这一技术突破使得计算机的体积大大缩小,特别是相比于元件连接在电路板上的晶体管逻辑电路。尺寸的缩小使得每秒可以进行数百万次的逻辑转换。

20世纪70年代早期,大规模集成电路问世。这一发展使处理器能安在一个芯片上,也使芯片能用于存储器,代替昂贵的铁氧体磁芯存储器。这些进展导致了微型计算机(或个人计算机)的诞生,最初是针对爱好者市场。在20世纪70年代初,这种机器为家庭和办公使用而生产。所有早期的微型计算机中,苹果和IBM计算机系列幸存下来,并成为市场上主要的计算机。

2

70 / 156

文档可能无法思考全面,请浏览后下载!

图17.2 IBM公司出产的个人计算机

操作系统是在硬件(计算机本身)和用户之间提供界面的软件。它管理硬件,使用户能够操控计算机。微软公司为IBM计算机开发了第一个操作系统——微软的DOS系统(微软磁盘操作系统),是目前DOS和Windows操作系统的鼻祖。许多制造商开发了可运行微软公司DOS系统的IBM计算机的克隆(或复制品)。IBM系列是基于Intel 8086芯片系列,这一芯片系列后来发展成为高速奔腾处理芯片。与此同时,苹果计算机公司也创建它的计算机系列。Macintosh系列之后,Apple 2E计算机的问世首次广受市场欢迎,这都基于Motorola公司的68000微处理芯片系列。

随着技术的发展,集成在一个芯片上的电路数量增加了。超大规模集成(VLSI)芯片的转换速率是以每秒数亿次来计算的。VLSI技术使个人计算机的处理速度比早期芯片快数百倍。

增加的处理功能与存储芯片的容量和速度呈同步增长。此外,制造自动化和小型化是重要因素。外围设备(提供输入、输出、存储手段的硬件设备)也在速度和其他功能方面得到发展以保持与计算机本身功能的同步增长。显示器、打印机和存储设备都随已有技术的改进应用和新技术的引入而快速发展。甚至有了外围设备的新品种,如扫描仪和声音合成器,这些新产品进一步增强和拓宽计算机的使用方式。

例如,从仅仅用于文本输出显示的单色显示器到有图形显示功能的彩色显示器的变迁。磁盘驱动器的存储容量惊人地增加了,从原来的以千字节(1000 字节)计算到现在以十亿字节(1,000,000,000 字节)计算。

对于任何计算机主板是主要部件,它包括微处理器和存储芯片。它还包括总线,所有外围设备能连到你的机器的高速链接,以使外设相互通信以及和微处理器通信。有些外围设备是插入主板总线的电路板形式,而其它的是用电缆连接的外部设备。大多数外围设备都有一些主板逻辑。

在微型计算机功能和用途的巨大增长中最令人瞩目的事实是:这种增长在不提高用户承担的价格情况下实现,因为自动化和小型化使得制造工艺的改进成为可能。今天最新的个人计算机与1980年的价钱差不多,考虑到通货膨胀的话就更低。

随着计算机功能变得更加强大,所增加的大部分功能都在软件上得到充分发挥,结果使计算机更易使用。个人计算机的大规模销售依赖于它是用于办公场所或家庭的、不需要对用户进行大量培训的产品。软件发展是从XEROX公司开始,它开发了图形界面和鼠标来选择要

71 / 156

文档可能无法思考全面,请浏览后下载!

执行的操作,而不是使用命令键盘。苹果公司采用了图像用户界面(GUI)的概念并用在它的Mac计算机上。这些“点击”机器制定了一个可用性标准,现在用于每台个人计算机的Windows 图形用户界面仿效了这一标准。

微型计算机技术仍在发展中。以后的计算机可以适应话音的输入和输出。强有力的通信工具的开发和广泛使用使因特网大为普及,计算机网络的普及又引起了(计算机)工业和相关技术的新一轮发展高潮。市场的持续成功依赖于软件的不断开发,使机器更加易用和具有更多功能。微型机软件正朝着人工智能方向发展。一个例子是

72 / 156

文档可能无法思考全面,请浏览后下载!

“聪明”商务软件,它帮助用户分析行为模式数据并将这些模式用于新的情况,让用户据此做出决策。 使用微型计算机

在微机上广泛使用的最早工具是文字处理(软件)、电子表格、和数据库系统。因为用户无需专门编程知识,所以这“(软件)三巨头”使计算机很快变得有用。文字处理软件由简单的写信工具演变成一个具有桌面出版能力的产品。电子表格也已变成了集合统计和财务分析、客户编程和高质量图片整理的标准工具。微机数据库已从一个简单的文档管理工具发展成为在多文档之间处理复杂应用的工具。

像Microsoft Office这些集成包能使应用模块“互相交流”。有了这些软件包,你可以在文字处理器中创建报告,其中包括由电子表格所产生的图,电子表格又是根据数据库中选择的数据整理的。更有甚者,你现在可以创建“活”(随时可以修改的)文档。当电子表格中的数据发生改变,报告也改变。工具之间的链接嵌入在文档中。Microsoft公司的这种形式称作“对象的连接和嵌入”。你可以从图形库中添加其它图片,也可以用内建的通信软件通过因特网输入资料。整个文档可用文字处理器或多媒体显示管理器专业地显示。文字处理器也能检查拼写和语法,也可以创建目录和索引。集成包可能还包含专业的显示管理器,它允许你开发幻灯片,在计算机或任何屏幕上展示。

客户/服务器技术使不同的微机可以共享信息、数据库文件、打印机等,并可以互相通信。一种平行开发称作工作组计算,把重心放在软件上,软件使一个组织(机构)中的信息流自动化以方便电子会议和类似的活动。

此外,还有大量更专业的应用软件包,如为图形设计开发的Corel Draw软件;为设计绘图开发的AutoCAD软件;以及为自动记账和结算功能开发的财务软件,如ACCPAC。在医药、教育、艺术和每一个其它的人类活动领域,每天都发现计算机技术的新用途。 平台之间的兼容性问题正在解决。现在,大多数主要软件产品可以处理由主要竞争对手的产品所创建的数据。用户需要从旧版软件产品到新版软件的平稳过渡,因为它们往往在自己计算机的记录上投入很大。综上所述,新版的软件可以自动地转换早期应用软件产生的文件。

72 / 156

文档可能无法思考全面,请浏览后下载!

Unit 17-2

第二部分:局域网 局域网的需求

局域网的广泛应用背后的驱动力可能是计算机硬件价格惊人的不断下降,再加上计算机硬件能力的增强。计算机系统的价格一年一年地大幅下降,而性能和容量大幅上升。这一不断前进的科技革命已经能开发具有惊人复杂性和功能的应用。例如,需要当今基于微处理器系统的强大功能的桌面应用包括以下几种:  图像处理  语音识别  视频会议  多媒体整理

 文件的声音和视频注解

现在工作站系统支持极为复杂的工程和科学应用,也支持仿真系统,并将工作组原则用于图像和视频应用中。此外,商业事务正在依赖于愈来愈强大的服务器来进行交易和数据库处理,并支持已经取代了以往大型中央计算机的大规模客户/服务器网络。

以上所有因素导致功能增强的系统数量的增加,这些系统都在单个工作点:如办公大楼、工厂、操作中心等等。同时,完全需要互相连接这些系统以共享和交换系统间的数据以及共享昂贵资源。

共享数据的需求是(系统)互联非常强烈的原因。计算机资源的个人用户并非孤立操作。他们需要与其他用户交换信息,在准备文件或进行分析时访问多来源数据,与工作组其他成员共享与项目有关的信息。

对昂贵资源共享的需求是网络发展的另一大驱动力。处理器硬件的价格比海量存储设备、视频设备、打印机、以及其他外围设备成本的下降速度要快得多。结果是需要在大量用户间共享昂贵仪器来证明设备的成本(是合理的)。这种共享需要工作在连接用户和资源的局域网上的某种客户/服务器结构。 局域网的应用

局域网的应用种类非常广泛。为了对局域网所要满足的需求种类做进一步深入研究,以下部分讨论了这些网络的几个最重要的普通应用范围。 个人计算机的局域网

通常的局域网结构是支持个人计算机的。由于这种系统的价格较低,机构中个别经理人员常为本部门的应用如电子表格和项目管理工具、访问互联网而独立购买个人计算机。

但是一些部门级的处理器不能够满足机构的所有需求;(我们)仍旧需要中央处理设备。比如经济预测模型一些程序规模太大以至于无法在一台小型计算机上运行。公司范围的数据文件,例如清算帐目和职工工资册,都需要一个中央控制但又可以被大量用户访问的设备。

73 / 156

文档可能无法思考全面,请浏览后下载!

此外,还有些其他种类的文件,虽然是专用的,但必须被大量用户共享。而且有充足理由将各个智能工作站不仅与中央设备相联,还要彼此相联。一个项目或团队的成员需要共享工作和信息。因此,满足以上要求的最有效的方法就是建立一个网络。

74 / 156

文档可能无法思考全面,请浏览后下载!

部门局域网的所有用户可以共享像磁盘或激光打印机这些昂贵的资源。此外,这一网络(指部门局域网)可以连入更大的公司网络设备。例如,公司可能拥有一个大楼局域网和一个广域的专用网络。通信服务器可以控制(用户)访问这些资源。

支持个人计算机和工作站的局域网在各种机构中已经普及。即使是那些仍旧严重依赖主机的站点也已经将许多处理负荷转移给个人计算机网络。采用个人计算机方法的最好实例可能是实现客户端/服务器的应用。

个人计算机网络的一个关键要求是低成本。尤其是链接网络的成本必须大大低于链接设备的成本。因此,对于普通的个人计算机,链接成本在几百美金是合理的。对于成本更高、性能更好的工作站,较高的链接成本是可接受的。无论如何,这意味着网络的数据传输速率可能受限。总之,数据传输速率越高,成本就越高。 后端网络和存储区域网

后端网络是用来连接像主机、超级计算机和大型存储设备这类大型系统的。这里,它的关键要求是大块数据在小范围内有限数量设备间的传输。可靠性高通常也是需求之一。以下是(后端网络的)一些典型特征:

高数据传输速率。为了满足大容量的需求,每秒100Mb或以上的数据传输速率是必须的。

高速接口。在大型主机系统和大容量存储设备间的数据传输操作是通常通过高

速并行输入/输出接口实现的,而不是通过传输速率较慢的通信接口传输的。因此,站点和网络间的物理连接必须是高速率的。 

分布式接入。要使大量设备以高效和可靠的接入来共享媒体,需要某种分布式

媒体访问控制技术。  

有限的距离。在机房或少量相邻房间之间通常使用后端网络。

有限数量的设备。计算机房中昂贵的主机和大容量存储设备的数量一般以几十

台计。

后端网络通常被使用在需要大量数据处理预算的大型公司或研究机构。由于涉及的规模,工作效率的微小差别意味着百万美元的差异。

考虑使用专用主机的站点。这意味着相当大的一种或一系列应用。随着站点负荷的上升,现在的主机可能被性能更高的主机所取代,可能是一个多处理器系统。对于某些站点,单系统的替代可能无法跟上(负荷上升的脚步)。设备性能的发展速度会被需求的增长速度所超越。设备最终会需要多台独立的计算机。这些再次成为使设备相互连接的强烈原因。系统中断的代价是昂贵的,所以应该具有方便而快捷地将应用转移到备份系统的能力。它必须可能在不降低运行系统(的前提下)测试新的程序和应用。大型的块存储文件必须可以被不止一台机器访问。负载水平应该可能使利用率最大,性能最优。

显然,后端网络的某些关键要求与个人计算机网络的刚好相反。需要高传输速率来跟上

74 / 156

文档可能无法思考全面,请浏览后下载!

通常涉及到大块数据传输的工作。实现高速度的设备是昂贵的。幸亏考虑到联在上面的设备更要贵得多,这种价格还是合理的。

75 / 156

文档可能无法思考全面,请浏览后下载!

与后端网络相关的另一个概念是存储区域网络(SAN)。存储区域网络是处理存储需求的独立网络。存储区域网络解决特定服务器的存储任务,并创建一个共享存储设备跨接高速网络。整套网络化存储设备可以包括硬盘、磁盘库、和CD阵列。大多数存储区域网络采用光纤信道。有许多服务器也可能是主机的大型局域网设施中,每台主机和服务器都有各自的专用存储设备。如果客户端需要接入特定的存储设备,它必须通过控制这台设备的服务器。在存储区域网中,存储设备和网络间没有服务站点,存储设备和服务器直接链接网络。存储区域网的安装提高了客户存储的访问效率,也实现了存储端与存储端之间的直接通信来实现备份和复制功能。 高速办公网络

传统上,办公室环境包括从低速到中速数据转输需求的各种设备。然而,由于传统局域网的有限速度(最高传输速率为每秒10兆)不够了,办公室环境中的新应用已经开发。桌面计算机的图像处理器使网络数据流史无前例地增加。这类应用的实例包括传真机、文件图像处理器以及个人计算机和工作站的图形程序。考虑典型的一页(文档)上每英寸200个图像单元或像素,(即黑白的点)的分辨率(足够但不是高分辨率的),它产生3,740,000比特的数据,即8.8英寸乘以11英寸乘以每平方英寸40,000像素。即使采用压缩技术,这类(图像处理)仍产生极大的负荷。此外,磁盘技术和价格性能比也已经发展了,十亿字节的桌面计算机存储容量是典型的。这些新的需求提出了对高速局域网的要求,相比于后端系统,这种局域网能支持数量更大、地域分布更广的办公系统。 骨干局域网

分布式处理应用和个人计算机的愈来愈多带来了对局域网的灵活策略的要求。对整个公司范围内数据通信的支持要求具有这样的网络服务,它能够跨越所涉及的距离,并能将一座大楼(或一群楼宇)内的设备相联。虽然假设有可能开发单个局域网来互连所有数据处理设备,但在大多数的方案中这大概不是实际的选择。单个局域网策略有以下几点不足:

 可靠性。单个局域网中,一个服务中断,即使是短时的,都可能导致用户的严重破

坏。

 容量。单个局域网可能随着接入网络的设备的数量而饱和。

 成本。对于互连和通信的不同需求,单个局域网技术不是最佳的。大量低价微机的出现使得可以低价提供这些设备的网络支持。支持低价连接的局域网将不适合满足所有需求。

一个更具吸引力的选择是在楼宇或部门中采用更低成本、更低容量的局域网,并以高容量的局域网互相连接这些网络。后者(这种高容量的局域网)被称为骨干局域网。 工厂局域网

工厂环境正渐渐被自动化设备所主宰:包括可编程控制器、自动化材料处理设备、考勤系统、机器视觉设备和各种形式的机器人。为了管理生产或制造过程,必须将这些设备联在

75 / 156

文档可能无法思考全面,请浏览后下载!

一起。确实是这样,这些设备的性质本身就是能够提供这种互联。微处理器设备有从车间现场收集信息并接受指令的潜能。恰当地使用信息和指令有可能改善生产过程并提供精确的机器控制。

工厂越自动化,通信的需求就越大。只有将所有的设备互联,提供协同工作的机制,才能使自动化工厂运作。实现互联的方法是工厂局域网。工厂局域网的

76 / 156

文档可能无法思考全面,请浏览后下载!

关键特性包括如下几点:     

容量高。

能处理各种数据通信。 地域范围大。 可靠性高。

能够指定和控制传输时延。

总之,工厂局域网是瞄准机会的市场需求,是比典型办公室环境更灵活可靠的局域网。 总结

正如我们看到的,局域网用于支持各种需求和大范围的应用。然而,用于不同目的的基本技术是相同的。共同技术和标准的使用已促进了局域网大范围普遍的激增。

Unit 18 英特网和多媒体

Unit 18-1

第一部分:多媒体 多媒体

从前,“英特网”和“多媒体”两个单词很少出现在一句话中。虽然可以从FTP站点上下载GIF图片或声音文件在PC上观看或收听,但是这样的英特网体验离多媒体异乎寻常的娱乐表现还很远。确实,在万维网惊人的流行出现之前,访问英特网就好像是在阅读《华尔街日报》的头版一样:虽然可以获得很多有用的信息,但是形式很苍白,没有图片,单调得无法吸引人的眼球。

1993年,一个叫Mosaic的计算机程序改变了这一切。Mosaic是一个浏览器——允许用户使用英特网的程序。真正的多媒体(包括文字、图片、声音和电影的各种媒体的混合)第一次进入英特网。今天你不但可以下载那些类型的文件,还可以在线体验。你也可以在自己的网页上发布你的信息,包括混合的媒体。

互联网不断流行,但我们大多数只有有限的带宽资源,而在真正的多媒体世界里我们需要快得多的接入速度。在28.8kbps的速度下,下载一个几分钟的视频或音频文件需要很长的时间。所以如果你等着看《乱世佳人》或者听Wagner的《指环》,那还是放弃这个念头吧。用户厌倦长时间地等待文件下载。

由于这个瓶颈,人们只能从网站上获取文本和图形文件。文本和静止图像一般都比较小,因此你不需要等待太长时间就能看到它们,但是等待满是图片的网站,你很快就会意识到这种经历是多么令人沮丧。虽然网站上可能有音频和动画,但是需要快得多的连接速度来发送和接受大型的音频和视频文件,让我们能充分利用英特网多媒体。

76 / 156

文档可能无法思考全面,请浏览后下载!

请先稍等一下。我们所说的多媒体究竟是什么呢?不严格地说,多媒体就是多种媒体(比如文本、图形、声音、电影或计算机中的任何东西)的调和。当然,我们通过电影和电视早就和多媒体打交道了,但使用多媒体一词则几乎无例外地是与计算机技术有关的。比如数以千计的CD-ROM、电脑游戏和教育软件都提供了与视频、音乐和解说相结合的在计算机屏幕上看到的文本。

77 / 156

文档可能无法思考全面,请浏览后下载!

多媒体已在英特网上好多年了。但是由于图形,动画和声音文件太大了,往往有几兆,下载这些文件需要耗费大量的时间。因此几年前对于正常的用户来说,多媒体的可利用性被明显地限制了。

对我们来说,真正的多媒体从某种程度上来说就是能够让我们在没有长时间等待的情况下做到我们已经能够做到的一切。多媒体应该成为一个交互式的尝试,但是在低速连接的情况下,英特网多媒体不是真正的交互。真正的多媒体应该以足够快的速度传递信息,在将视频节目传送到你的计算机时不会有时间让你去喝杯咖啡。

多媒体和英特网的紧密结合是有意义的。人们喜欢电脑上的多媒体,多媒体是有吸引力的、有趣的,另外经常使复杂的计算机变得容易使用一些。确实它起作用了:一些多媒体教学程序有意要让那些还刚会走路的孩子们喜爱。一度难看而且只有文字的互联网当然需要有一些图片和声音,再加上容易点击,使它易于被大众理解接受。

比如,几年前使用英特网查询天气预报意味着你要知道如何登陆大型计算机或小型计算机,如何远程登陆到一台远程计算机,并浏览一系列基于文字的菜单或提示信息。一旦你掌握好了这个过程,就能很快查询到天气预报,但这种操练可不适合那些缺乏勇气或惧怕计算机的人。而现在为了获得天气预报你需要做的只是运行万维网浏览器然后点击。迎接你的不是冗长的天气趋势的描述而是天气情况的图解地图。这个例子仅仅是多媒体改变英特网的开始。大量消费产品和服务正在使英特网对于所有喜欢它的人更加容易。

大多数人会同意,互联网上多媒体的出现是好事,尽管(某些)老用户可能会争辩说现在互联网的使用方便使得网上空间对于他们的口味而言变得有点拥挤了。然而,英特网上的多媒体已呈现在我们面前。 交互性

交互性的概念非常重要,它提出了多媒体不常被提起的另一方面——实时多媒体。即使是最快、最漂亮、技术最先进的电脑游戏及模拟都是在整理时发生的,为了在特定时间和间隔发生,其多媒体被组合包装和编程。但真实世界是实时的,交互行为不断地发生,事物变化和适应的速度是以秒计的。那些交互怎么样?它们是如何在一系列连接着的计算机上发生的?互联网一开始是被设计成信息共享资源的,而不是一项实时通信技术,这种实时交互怎样才能通过互联网在全球范围实现呢? 这时,Mbone起作用了。

最初,Mosaic的神奇只对拥有强大工作站的用户们有用,但是很快互联网被大量用着普通计算机的普通用户接受。同样地,今天那些拥有强大的计算机工作站和足够宽带可消耗的人们正使用着最新最流行的多媒体工具——实现这些奇迹,如实时视频会议,共享虚拟“白板”的合作和媒体点播服务的程序。 什么是英特网

英特网是世界上最大的计算机网络,它收集了全世界的小型网络,计算机和其使用者。商务在线服务是英特网的重要部分。你的公司或学校的计算机是连在英特网上的。甚至,炸面圈店里坐在你旁边的人也有英特网账号。

77 / 156

文档可能无法思考全面,请浏览后下载!

英特网上的用户可以互相交换电子邮件,在计算机间复制文件(即使计算机间相隔几千英里),玩游戏,访问信息数据库,在电子酒吧里聊天,还有更多。实际上,在英特网上人们可以使用计算机以无数惊人的方式与其他人交流——从有用的到无用的。一些人每天花费很多时间浏览万维网或在新闻组里阅读和发布消息,只需简单登陆账户你就可能在网上买到从打印机到匹萨的所有东西。 多播和Mbone

在历史上,英特网经历了不只是革命的贡献。首先是使用电子邮件和用户网络的全球通信的革命,随后是FTP和Gopher彻底改革了信息共享,再后万维网改革了信息显示的方式。政府,杂志,电视网络,商业和许多其它组织都转向网络,使之成为联络观众的一种新方法。

但是所有革命中最重要的就是Mbone,它将使英特网成为实时多媒体通信的温床。实质上它已经成为一个标志,用于交互式会场、教室、电视、电影院、视频游戏以及只有在关于信息高速公路的鼓噪中才能梦想的那种寓教于乐。最终,Mbone能实现各种功能。如果我们愿意,就可以在没有联邦通信委员会的许可或发射机的情况下,开始我们自己的网上电视秀;或者可以在在线课堂中教来自十个不同州的学生;或组织全球的研究人员举行重要的在线会议。

传统上,英特网已经被建立成每次只给一个用户发送信息。发送的信息总有一个明确的目的地,如电子邮件信息,总是试图了解某个特定的同事。一个访问网页的请求被发送到一个单独的主机,然后主机将请求的信息发回给单个接收者。虽然计算机可以每秒处理上几百万个这类请求,但是信息的传输仍然是一对一的:一台计算机在发送信息,只有一台计算机在接收这个信息。

这样的安排好像很完美,直至你要同时给多个人发送信息时你考虑会发生什么事,比如考虑一个附有图形的邮件。如果你将这个消息发送给在英国的朋友,将占用一定的带宽。现在你可以同时将一封电子邮件发送给2人、3人、甚至20人。如果你将邮件发送给20个人,那么你将产生20倍的英特网传输量。因此,如果一个乐团要将他们的实况音乐会通过英特网传送给15万他们的密友,你可以想象很快英特网就会阻塞。

英特网下一代突破性的工具将是IP多播程序。Mbone程序正是IP(英特网协议)多播的实施落实。IP多播程序改变了道路规则,它使用户能向正在“收听”的任何人,而不是一个特定的个体或计算机,“广播”信息包。只发送一个信息包,它并非被分别传送给每个接收者,而是同时传送给所有的特定目的地。

为什么这么有趣呢?因为IP多播有一种全新的方法在英特网上发布信息。你可以用扩音器向每个想听的用户广播,而不是电子对等的一对一的交谈。而收听的人也可以马上发回信息,不仅仅给你,也发送给其他任何人。

Mbone正蓄势待发,它宣告着世界通信将发生彻底的不可逆转的变化,也可以说它正宣告着自身的革命。

78 / 156

文档可能无法思考全面,请浏览后下载!

Unit 18-2

第二部分:网络在多媒体应用中的作用

79 / 156

文档可能无法思考全面,请浏览后下载!

展示多媒体信息

在多数大学校园里,网络的可用带宽是有限的,一般是100Mbps以太网,这就意味着个人用户可用的最大可用带宽大约为10Mbps。随着时间的推移,可用带宽会逐渐增加,人们处理多媒体信息的能力也将更有保证。

有两种常见情景:一种是在教学场所展示多媒体,这些多媒体资料是由网络服务器提供,经局域网转发的;另一种是使用孤立系统。使用网络时有两种主要方法:通过基干网同时组播到许多节点,或是使用多点ISDN结构。无论哪种方案,教学过程都能传送到教学资源共享计划中相互协作的各分散节点上。

基干网(Mbone)技术在互联网上运行,它设计用来连接许多的节点,但是它使用通路(pathway)技术,通过在节点之间尽量共享路由使互联网上的数据流达到最小。Mbone技术可以交互使用,使得每个节点都能在教学过程中与其他所有节点进行交流。

这与同时在众多节点之间进行的多点ISDN会议不同,这里所有的节点都与中央多点控制单元(MCU)相连。MCU的切换通常是用话音驱动,这样有音频出现的节点就向所有接收点发送信息。直到不久以前,这个系统还要求所有节点以相同带宽工作(如ISDN-2的带宽128Kbps),这导致整个网络都以最慢节点的速度运行。最近的技术进展允许进行混合作业,从而使有些节点能在384Kbps速率下以高分辨率工作,同时又允许使用128Kbps设备的小节点也成为远程会议的一部分。

教学中使用的多媒体材料可以通过各种不同的网络传送给使用者,可以是内部或校园局域网,也可以是接到不同的区域和机构的广域网,其由教育网( JANET 和 MANs)或公共服务提供商如ISDN来支持。以上的每项技术都将在本文中讨论。

人们认为在教学中提供的支持信息越复杂,对学生来说越有利。复杂性越高要求整理的工作量越大,在展示中要求更复杂的仪器,所以教师总是应当寻求与所用材料相一致的最简单最清晰的表示信息方式。如果信息可完全用线条图表示,那么高分辨率图像对学生就没有什么优越性了。因为多媒体无论是整理还是展示都价格不菲,因此必须确认使用的必要性。高分辨率图像视觉效果优良,但是所添加的细节必须有利于学生知识的增长。

多媒体的优势在于将多种不同的媒体结合在一起,实现信息的同步比如影象和声音的结合,这在总体上使信息得到增强。要记住,“人们”自己就能以好几种媒体自然地传递信息,例如病人会提供有关症状的视觉、触觉、甚至嗅觉信息来表达一种具体的临床症状,同时还会进行描述,并接受有关疾病后果的询问。另一个例子是通过远程视频链路联接到教学场所,这种链路可提供远方的视频和音频信息,例如开放式远程学习技术的应用。

在实践中,恰当地运用多媒体使教师给学生提供多方位的刺激,这使得教学内容更能充分理解,更有趣。在教学中提供更多不同刺激的能力也包括学生自主学习;在电脑屏幕上展现各种彩色图像和声音效果能增强传达给学生的信息。毫无疑问,眼睛总是被各种色彩和形状所吸引,在教学中色彩和形状最常用来吸引学生的兴趣。 网络系统

如果机构里还有过去留下的网络如传送模拟音频视频信号的光纤,它们可以有很好的作

79 / 156

文档可能无法思考全面,请浏览后下载!

为。例如在TLTP INSURRECT项目中仍使用一种叫SONY LVR的视盘服务器来储存静止和活动的图像,并用LIVENET光纤将这些模拟图像传送到教学场所。该项目还通过SuperJANET ATM视频网络将图片传送到

80 / 156

文档可能无法思考全面,请浏览后下载!

编解码器,用于发送到远处的教学场所。SONY服务器可以储存多达54,000帧图像,可以是以静止图像也可以是视频短片。这个SONY系统可以由RS232A命令来控制,这些命令通过局域网或互联网从远处的节点发送过来。这样就能在演讲厅中用笔记本电脑很方便地控制幻灯片的播放,无论是在本单位内部还是进行远程控制。视频序列的播放也可以用互动方式来控制:停止,开始,快进和快退。将来数字网络将逐渐遍布校园,但必须记住:模拟网络很可能提供更大的带宽,因此能传送分辨率更高的图像。

在INSURRECT项目中,使用LIVENET模拟电路在UCLA(洛杉矶加州大学)整个校园里传送视频和音频信号,同时也运用编解码器将信号通过SuperJANET ATM视频网络传送到远处的节点。有一个节点(Bristol)不在SuperJANET上,TCP/IP成功地通过100Mbps的SMDS1链接实现了传输。在早期的实验中,在将音频通道与视频同步中遇到了一些困难,不过随着项目的进展有所改进。

以太局域网在大学校园中很普遍,在这些网络上可基于IP向教学场所提供高分辨率信号,但对于视频信号却没有预留带宽,因此信号质量将随以太网的使用情况而变化。我们注意到,现在的局域网电视会议系统使用校园网络中的IP,但是却使用ISDN网关与远处节点相连,因为ISDN确保可用的带宽保证了图像的质量。

ATM 网络可工作在25Mbps到 155Mbps 的典型带宽下,局域网和广域网皆可。ATM 网络常用作传输媒介,使用多种协议如IP,SMDS和局域网仿真。在某些实际应用中,使用最基本的ATM技术来发送音频和视频信息。在许多校园中运用的是各种不同技术的混合。一种典型情况就是以ATM为主干,连接以太网。ATM主干系统应当尽可能接近主要的教学场所。

在教学中,常需要连接两个以上的节点,此时Mbone和多点结构就很必要了。多点会议使用星形的网络结构,并能够实现交互,因为MCU各个节点支持视频和音频的双向传送。音频信号用来控制声音交换系统中的交换功能。

组播对IP网络特别适用。人们开发了组播骨干网,在各节点间选择路由,使尽可能多的数据流共享同样的路由,在链路最后阶段才分流,以节省网络资源,使数据流量最小化。在理想情况下,组播网络能与所有的节点两两相连,而且这种网络能支持互动的信息交换。 什么是ISDN?

ISDN即综合业务数字网是一种通过电话线实现高速数据连接的电话服务,它基本上是利用已有的联线将电话网转变为全数字式。ISDN能在站点间传送大量数据,由于其固定带宽,可支持压缩的视频传输,因此可保持音频和视频的同步。

ISDN比其它高速传输数据的方式便宜得多,但是比起普通的电话线还是太贵。在某些领域里,能与14.4Kbps调制解调器、传真和电话自动答复机可靠地配合工作的普通电话线被称为POTS,即普通旧式电话服务2。人们曾认真尝试在这样的线路上传送视频,比如可视电话,但是就总体效果来看它的分辨率还达不到教学的要求。

由于ISDN传送的是数字信号而不是模拟信号,所以它不能和常规的调制解调器或电话答复器一起工作,这是它的一个主要缺点。你需要特殊的,昂贵的设备来实现ISDN速度下 1 2

SMDS stands for Switched Multimegabit Data Service. POTS: plain old telephone service.

80 / 156

文档可能无法思考全面,请浏览后下载!

的各种功能。不过ISDN比标准的调制解调器快得多,而且在世界许多地方都能使用,包括澳大利亚、西欧、日本、新加坡、法国和美国的部分地区。

81 / 156

文档可能无法思考全面,请浏览后下载!

Unit 19 人工智能

Unit 19-1

第一部分:什么是人工智能

人工智能,简称AI,是一项包含了计算机技术,生理学和哲学的综合技术。AI是一个宽泛的课题,由从机器视觉到专家系统的多个不同领域组成。AI所包含的这些领域的共同点在于它所创造的机器能够“思考”。

为了分辨计算机是否会“思考”,我们有必要定义一下什么是智能。智能在多大程度上包含譬如解决复杂问题、进行概括和建立关系这样的能力?包括感知和理解能力吗?在学习,语言和感官知觉领域的研究帮助科学家们制造智能机器。专家们所面临的最大的挑战之一就是如何制造出一个能够模仿人类大脑行为模式的机器,而人类的大脑由上亿个神经细胞组成,被认为是世界上最复杂的东西。或许度量机器智能最好的方法就是由英国计算机科学家Alan Turing提出的测试。他说,当一台计算机可以骗过人,相信它是一个人而不是机器时便可称得上是智能的。

人工智能由一群专注的研究人员推动着,已由最初的研究走过了很长的一条路。AI的起源在电子学之前,可以追溯到Boole和其他一些哲学家和数学家们,他们根据那些已成为AI逻辑基础的原则建立起了最初的理论。随着1943年计算机的发明,AI开始吸引研究人员的注意。这项技术终于可用于模拟智能行为了,或者看起来是这样。在这之后的40年中,虽然面临过许多困难和阻碍,AI已由最初只有十几位研究人员参与发展到现在有几千名工程师和专家们共同致力于研究;从最初的只能下西洋跳棋的程序发展到今天已设计出可以诊断疾病的系统。

AI技术始终站在计算机科学的前沿。先进的计算机语言,以及计算机接口和文字处理软件都要归功于人工智能的研究。AI研究引出的理论和认识将为未来的计算机科技发展指明方向。虽然现在所制造出的AI产品仅仅只能反应不久的将来研发出的产品的一小部分功能,但是它们迈出了走向未来人工智能的一步。随着人们的不断探索和追求,人工智能已经影响,也将继续影响我们的工作、教育和生活。 有计划地使用AI

我们研究AI应用已有多年,了解了所有的术语和相关的情况。但是我们真正应该知道的是如何着手使用一些AI技术。我们怎样作为个体来使用这些技术呢?

首先,我们必须对面临的变化有所准备。我们的保守往往成为进步的挡路石。AI跨出了对社会非常有用的一步。具有人工智能的机器可以完成需要遵循详细指示和灵活思维警觉的工作。具有学习能力的人工智能可以胜任那些工作,但只有人们准备改变他们的保守观念使之成为可能才行。这让我们想起很久以前人们就接受了轮子这项伟大的发明,而并没有认为它是从文化遗产和传统中带走了什么。

81 / 156

文档可能无法思考全面,请浏览后下载!

第二,我们必须对AI的能力有所了解。越多地使用机器,需要我们的工作量就越少,随即人类所要承受的伤害和压力也越小。人类是通过尝试来学习的物种,我们必须给AI一个机会来证明AI是对我们的祝福而不是抑制。

82 / 156

文档可能无法思考全面,请浏览后下载!

最后,我们必须对AI技术有最坏的打算。像AI这样如此具有革命性的技术肯定有许多瓶颈需要攻克。总是有那样一种担忧,以为要是人工智能是建立在学习基础上的,那么机器会不会在得知富有和成功是好事后,去发动战争反对经济强国和著名人物呢?一个新系统有那么多情况可能出错,所以我们必须尽可能为这种新技术做好准备。

而且,即使我们对机器存在畏惧,它们的能力却是无限的。不管我们教AI什么,在未来机器将会提示它是否给出肯定的结果。AI就像孩子一样,需要被教育成体贴的,彬彬有礼的,聪明的孩子。他们应该学会聪明地做重大的决定。作为公民,我们应当保证AI的程序员们都正确地工作着,一切都走在正轨上,这样未来才不会发生意外。 专家系统的范围

专家系统能够像一个专业人才一样工作。而且计算机系统可以很快地训练,实际上没有操作费用,不会忘记学习过的东西,不会打电话请病假,退休或是要休假。除此之外,智能计算机还可以处理大量的信息,而人类不能。

但是这些系统可以多大程度上替代人类专家呢?或者,它们可以完全替代人类?例如有人曾经把智能计算机看成是人对核武器进行控制的替身,说是计算机对于威胁可做出比人更快的反应。我们不能忽视拥有一个计算机专家所带来的好处。比如,预报天气借助于许多可变的参数,计算机专家能够更准确地集中他所有的知识。尽管如此,计算机却无法借助人类专家所拥有的预感,预感往往能帮助我们预测结果。

总之,在天气预报或查找软件bug的情况下,专家系统有时比人类更加准确。但是在其他领域,比如医学,虽然计算机对医生的诊断是有用的,但是人类医生仍是不可替代的。可见,在某些范围内专家系统有能力帮助人类,在某些情况下甚至能代替人类,谨慎地使用计算机专家将使人类受益。

Unit 19-2

第二部分:人工智能的方法

人类已赋予自己智慧之人的称号,因为我们的智能对日常生活和自我感觉是如此重要。人工智能(AI)这一领域尝试去理解智能实体。这样,研究它的第一个原因是更多地了解我们自己。但是不像同样关注智能的哲学家和物理学家那样,AI力求构建智能实体并去理解智能。研究AI的另一个原因是这些构建的智能实体本身很有趣,而且也有用。即使是在其发展的早期,AI就已产生了许多重要和令人印象深刻的产品。虽然无人能具体地预测其未来,但很明显,具备或超越人类智能水平的计算机将在我们的日常生活和未来的文明进程中具有巨大的冲击力。

AI涉及了一个终极的难题,即一个又慢又小的大脑或是电脑如何能感知、理解、预测和操纵一个远远比其大而复杂的世界?我们如何使某些东西具备这些特性?这些是难题,但是不同于寻求超光速运动或反重力装置,人工智能研究者有确凿的证据证明这种探索是可能成功的。所有研究者必须要做的事是照一下镜子,看一看镜子里智能系统的一个实例。

AI是最新的学科之一。它正式始于1956年,当时造出了人工智能这个名词,尽管在此

82 / 156

文档可能无法思考全面,请浏览后下载!

以前有关工作已经开展了5年。同现代遗传学一起,AI经常被其他学科的科学工整理称为“最愿意从事的领域

83 / 156

文档可能无法思考全面,请浏览后下载!

”。学物理的学生可能有理由感到所有的好主意早已被伽利略、牛顿、爱因斯坦等科学家提出了,人们需要经过多年的研究才能贡献出一个新的想法。而在另一方面,AI对全身心投入的爱因斯坦们仍有尚待解决的问题。

AI目前包含许多子领域,从诸如感知和逻辑推理等的通用领域,到下棋、证明数学定理、写诗和诊断疾病等具体任务。通常其他领域中的科学家(会)逐渐转移到人工智能研究中来,他们在这里发现了能使他们自己毕生从事的智力工作实现系统化和自动化的工具和语言。与此相似,AI工整理们可以选择把他们的方法应用于任何人类智能化努力的领域中,在这个意义上,它确实是一个通用领域。 什么是AI?

我们现已揭示了为什么AI是激动人心的,但我们还没有说它究竟是什么。我们可能会说:“好,它和编写聪明的程序有关,那就让我们着手来写一些”。但科学的历史证明瞄准正确的目标是非常有益的。早年寻求长生不老药和点石成金秘诀的点金术士恐怕是迈错了步。只有改变目标,用早期天文学家预言星宿和行星运动那样的方法寻求能给出人间世界准确预言的明确理论,科学的方法和有成效的科学才会出现。表19.1给出的定义沿着两个主要的方面发展。上面一行是关于思维过程和推理的,而下面一行涉及行为。同样的,左面一列的定义按照人的表现来衡量(系统是否)成功,而右面一列的定义按照智能的理想概念来衡量,我们将其称为理性。如果一个系统做的是正确的事,那么它就是理性的。

就如人们所预期的,以人为中心的方法和以理性为中心的方法之间存在着矛盾。我们应该指出人和理性行为之间有区别,我们并不是在“情绪不稳”和“精神失常”的意义上暗示人必然没有理性,人们仅仅需要注意我们通常会犯错误。即使了解全部象棋规则,也不会都是象棋大师。而且很不幸,不是每个人在考试时都能得到A。以人为中心的方法必然是一个经验的科学,包括假设和实验验证。理性主义者的方法包括数学和工程的结合。每个群体中的人们有时互相批评其他群体的工作,但事实是每个方向都得到了有价值的见识,让我们更仔细地互相关注。

像人一样行事:图灵测试法

由艾伦·图灵提出的图灵测试是设计用来提供一个令人满意的可操作的智能定义。图灵把智能行为定义为在所有认知任务中达到人的水平,足以骗过讯问者。粗略来说,他提出的测试就是,计算机应该被一个人通过电传打字机询问,如果询问者不能断定那一端是计算机还是人,那么就通过测试。测试的详情以及如果计算机通过测试是否确实就是智能的将在下面讨论。眼下对计算机编程使其通过测试就有足够的工作要做。计算机需要拥有以下的能力:

自然语言处理,使其能成功地用英语(或其他人类语言)交流。 知识表达,存储讯问前或讯问中所提供的知识。 自动推理,利用存储的信息回答问题并得出新的结论。 机器学习,适应新的环境,检测并向外推断模式。

图灵测试故意避免在询问者和计算机之间的直接物理接触,因为对一个人的物理模拟对于智能来说不是必要的。不过所谓“完全图灵试验”需要包括视频信号,这样询问者就可以

83 / 156

文档可能无法思考全面,请浏览后下载!

对被测试者的感觉能力进行测试,同时也包括询问者“通过舱口”传递实物的可能性。为了通过完全的图灵测试,计算机需要有:

84 / 156

文档可能无法思考全面,请浏览后下载!

计算机视觉,用于感知物体。 机器人的能力,以便到处走动。

在AI中,并未化费太大的努力以尝试通过图灵测试。像人一样行事的问题主要来自AI程序必须与人交互,如一个专家系统解释它是如何得出诊断,或者自然语言处理系统与用户进行对话那样。这些程序必须遵照人类交流的某些通常习惯行事以使他们能被理解。在这样一个系统里基本的表达和推理可能是基于人类模型的,也可能不是。 像人一样思考:认知模型方法

如果我们想说某一程序像人一样思考,我们必须有某种方法决定人是如何思考的。我们必须深入人类思维的实际活动。有两种方法去做:通过内省,当我们的思维出现时抓它们;或者通过心理学实验。一旦我们有足够精确的思维理论,就有可能用计算机程序进行表达。如果程序的输入输出和定时行为与人的行为相匹配,那就证明程序的某些机理也可以在人体内运行。例如,发明“通用解题装置”的纽厄尔和西蒙并不会满足于他们的程序能正确地解决问题。他们更关注于比较程序推理步骤和人解决同一个问题的步骤。这和同时期只关心获得正确答案而不管人们会怎样做的其他研究者形成对比。认知科学这一交叉学科领域将人工智能领域中的计算机模型与心理学中的实验技术结合起来,试图构建人类思维精确并可测试的理论。虽然认知科学本身是一个令人着迷的领域,我们并不想讨论太多。然而,真正的认知科学必定建立在实际人或动物的实验研究基础之上。我们只是要说明,AI和认知科学继续互相促进,特别是在视觉领域、自然语言和学习方面。 理性思维:思考方法的法则

古希腊哲学家亚里士多德是第一个尝试对“正确思维”即不可辩驳的推理过程进行归纳的人。他著名的三段论法提供了争论结构的模式,给定正确的前提就能得出正确的结论。例如,“苏格拉底是人,人终有一死,苏格拉底也如此”。人们假定这些思想法则支配思维活动,它们开创了逻辑学领域。

十九世纪后期和二十世纪初形式逻辑的发展提供了描述世界上各类事物的精确表示法和他们之间的关系。(与常规的算术表示法形成对照,算术主要提供数值相等和不等的表述)。到1965年已经只要提供足够的时间和存储空间,就会有计算机程序以逻辑表达方式描述问题,而且只要有解,就能找到这些解。(如果没有解,程序可能永远不停地寻找答案)。人工智能领域中所谓的逻辑主义实践派期望构造这样的程序以创建人工智能系统。

这个方法有两个主要的障碍。首先,获取非正式的知识而用逻辑表示法所需的正式术语描述它们并不容易,特别是当知识不是100%确定时。其次,原则上能解决问题与实际上真正去解决它之间有巨大的差别。即使是问题仅有几十个事实就有可能耗尽任何计算机的资源,除非有关于首先尝试哪个推理步骤的某种指引。虽然这两个障碍都适用于任何构建计算推理系统的尝试,但他们首先出现在逻辑主义实践派的传统中因为对表达和推理系统的能力有明确定义并有相当好的理解。 理性行事:理性代理方法

理性行事的意思是在给定某人信念的情况下,为了达到其目的而实行的行为。一个代理

84 / 156

文档可能无法思考全面,请浏览后下载!

就是某些感知和行事的东西(这可能是这个词的不寻常的用法,但你将会习惯它)。在这个方法里,AI被看作是研究和构建理性代理。

在AI的“思维法则”方法中,整个重点在于正确的推断。有时做出正确推断是按照理性行事的智能代理的一部分,因为理性行事的方式之一就是合乎逻辑地推出这样的结论:某一给定的行为将能达到目的,然后照此行事。另一方面,正确推断并不是理性的全部,因为通常有这样的情况,没有什么正确的事情要做,但仍然必须要去做一些事。同样有些理性行事的方式,他们不能被合理地称为包括推理。例如,把手从火热的炉子上抽回来只是一种反射行为,这要比经过深思后采取的缓慢行动要成功得多。

85 / 156

文档可能无法思考全面,请浏览后下载!

所有的图灵测试所需的认知技巧就是允许理性行事。这样,我们需要有能力去表达知识和用它进行推理,因为这使得我们能在各种各样的情形下达到好的决策。我们需要能用自然语言产生易于理解的语句,因为说这一些语句可帮助我们适应复杂的社会环境。我们需要学习并不仅仅是为了博学,而是因为对世界如何运转有一个较好的观念能使我们产生更有效的策略来处理它。我们需要视觉并不仅仅是因为能看见很有趣,而是为了对行为所能达到的效果有一个更好的概念。

Unit 20 人为错误和系统设计

Unit 20-1

第一部分:从灾难中学习

虽然泰坦尼克号和兴登堡的灾难已经过去了几十年,但它们却开始引起人们对于现代系统安全工程的极大关注。两者都是当时规模最大的,最先进的技术,相当于今天正在开发并用于许多行业,对安全要求很高的基于计算机控制的系统。这些灾难的例子最可怕之处也许不是那些在事后分析中看到的明显错误,而是它们和近期所发生事故之间的相似之处。

泰坦尼克号沉没最令人震惊之处在于卷入这起事件的人们竟自鸣得意到难以置信的地步。爱德华时代末年是对工程和科学进步充满信心的年代,将如此多生命送上绝路的决定也许正是这种极度自信的结果。然而,曾于1985年发现失事的皇家油轮泰坦尼克号的著名海洋学家罗伯特巴拉德博士,将泰坦尼克号和发生于1986年1月的挑战者号航天飞机失事这两起事件划上等号,指出正是对技术的过分自信和对自然环境力量的藐视导致了两起事件中指挥者的疏忽。

甚至官方报告也反映出一种毫无根据的自信,报告中讨论了救生艇准备的不足,除了委婉地指出这些救生艇已陈旧之外没有提出任何明显的批评。同样地,报告提到望远镜,泛光灯和其他瞭望员的辅助设备达不到与泰坦尼克号的级别,却没有承认这些是设备上的缺陷。“发生了令人遗憾的事故,但责任在其他方面”这样的基调可以在更近期的许多事故报告中看到。

泰坦尼克号的灾难也提出了一些技术问题。船体外壳的结构是如何定下来的?船舱的数量,舱壁的高度和保证生存的所需设施是依赖什么分析数据决定的?也许对当时的技术水平来说提出这样的问题不公平,但是现代也有相似的案例。例如,(我们可以)把(船)可能发生正面冲撞的假设与汽车制造厂对新车进行撞车试验这种几乎完全一样的假设相比较,对撞车试验的规定直到1997年才得到加强。

兴登堡事件还强调了其他一些同样挑战着现代工程师们的安全工程问题。这些问题中最明显的一个可能就是改变设计后需对安全性做重新评估。在兴登堡事件中,这样的改动有两方面:对先前成功的设计做了修改(放大);当意识到没有足够的氦能使如此巨大的船体浮起来后对设计思路也做了修改

85 / 156

文档可能无法思考全面,请浏览后下载!

。建造如此巨大轻巧的结构对工程提出的严峻挑战令人钦佩地得到了解决,但是却没有考虑到改变采用的纤维处理所造成的似乎很小的影响。特别令人感兴趣的是,在已知静电积累是一个明显问题的情况下,已经注意到了对框架和金属部件提供放电回路。

最近由兴登堡的制造者齐柏林公司所揭露的隐情也很有趣。同样地,也有许多现代的相似案例:诸如Piper Alpha, Bhopal 和Seveso事故等都企图隐藏其善后情况,或者至少能低调地处理先前事故的证据,操作中存在的问题和安全管理的不足。

这些意见可以应用到任何行业的安全工程与管理中。本质上,安全是一种经验性的纪律;运用过去出错时的经验教训可以避免意外,而历史数据正是经验最重要的资源之一。过去150年航空事业的发展正说明了这一点。这些早期的发展是以“试飞-修改-试飞”模式为特征的,也许更确切的是“试飞-但愿存活-修改-试飞”。

早期飞行开拓者越是谨慎,越是选择付给别人报酬或试图说服他们来试飞自己的作品。据说1853年George Cayley先生的马车夫在完成了一份简报并驾驶Cayler的一架滑翔机自由地飞过约克郡河谷后提出辞职,理由是:“尊敬的先生,我不是雇来飞行的”。当时事故、受伤和死亡事故很频繁,因为工程师们都在努力掌握飞行的基本知识,而很少关心安全问题。 相比之下,到20世界末飞行已经成为最安全的旅行方式之一。波音客机的数据显示,到1996年底世界范围内已由12343架商业喷气飞机组成了一支庞大的机群,飞行总数达到1630万次。1996年仅发生了30起有乘客或机组人员死亡的事故,造成1300人死亡,达到一百万次飞行中死亡80人的比率。每次事故之后都会组织大规模的调查寻到事故原因,判断是否需要修改飞机设计,增强机组人员的训练或流程来防止类似事故再次发生。这些调查报告广泛的传播以让整个业界受益。

Unit 20-2

第二部分:人为错误的教训

1988年苏联福波斯I号卫星失踪在飞向火星的途中。什么原因?根据《科学》杂志的说法,是因为发射后不久地面控制中心在发往飞船的一系列数字指令中略去了一个字母。由于运气不好,这个字母的缺少使代码被误译,从而触发了测试序列(测试序列存储在ROM中,只是准备飞船在地面上时用于熟悉性能的)。福波斯折戟沉沙,就此无法恢复。

多么奇怪的报告:只是“运气太坏”吗?为什么是运气坏而不是坏的设计?难道不是命令语言设计的问题使这样一起异常事件导致了如此严重的后果?

电噪声对于信号的检测、识别和可靠性的影响是众所周知的。设计者会使用误码检测和纠错编码来解决这一问题。让我们假定是某些已知来源的干扰破坏了传送到福波斯的信号,这样我们就不会去责备地面控制者了。我们会说系统的设计者没有遵从标准的工程惯例,会重新考虑系统的设计,以防止今后再出现这种问题。

人们错了。因为这就是生活的现实。人不是精确设计的机器。实际上人类是一种完全不同的“装置”。我们的强项是创造性、适应性、灵活性。持续不断的警戒、行动或记忆的精确性则是我们的弱点。我们容忍错误的能力是惊人的,甚至在有物理损伤也如此。我们非常

86 / 156

文档可能无法思考全面,请浏览后下载!

灵活、健壮、富有创造能力,具有极强的能力从不完整的和受干扰的证据中寻求解释和理解含义。而导致健壮性和创造性的同样秉性却也产生错误。解释不完整信息的本能虽然是我们的基本优势,却可以使一名操整理以这样一种貌似有理的方式误解系统的行为,从而使这种误解难以被发觉。

87 / 156

文档可能无法思考全面,请浏览后下载!

我们对人类行为,以及它是如何用于与系统之间交互的了解已经相当多了。人类所犯的好几类错误已经得到确认和研究,可以事先确定,在什么情况下发生错误的可能性会增加。可以设计通信系统使之具有容忍误码、检测误码、纠正误码的能力。类似地,我们可以发明一种容错、检错或使人机交互降至最小的科学。

在我们对信息处理系统硬件和软件的理解方面已经取得了许多进步,但是还有一个缺口,这就是将操整理包括到系统分析之中。一个信息处理系统的行为并不只是设计指标的产物,而是人和系统交互作用的产物。设计者必须将系统中包括人在内的所有组成部分,以及他们之间的相互作用考虑进去。这一领域的各种技术出版物表明了对软件和硬件的关注,可是缺乏对人类功能和能力的强调。许多信息系统的失败要归咎于人为错误而不是设计问题。我们还将遭遇失败直到学会改变我们的方法。

需要做的第一件事就是改变态度。我们称之为人为错误的行为和系统噪声一样地可预测,也许更甚。因此,不要责怪那些恰好与此有关的人,最好还是试图找出导致事故的系统特性,然后修改设计以消除相应危险,或者至少将它对未来事件的影响减至最小。一个主要步骤是将“人为错误”这个名词从我们的词汇表里去掉,重新评价是否应责怪具体人员。第二个主要步骤是制定设计指标,将人的作用考虑在内,并赋予它和系统其他部分相同的重视程度。

根据美国《科学》杂志关于苏联探测火星事件的报道,好像是控制人员的无能造成了事故。《科学》采访了苏联飞船制造厂经理罗尔德·克莱姆涅夫。这份杂志对这次采访的报道是这样的:“发生错误的控制人员受到了什么处分?克莱姆涅夫以阴沉的语气告诉《科学》杂志,他没有被送进监狱或发配西伯利亚。实际上正是他最终找到了程序中的错误。不过克莱姆涅夫说,这位控制人员未能再参加以后福波斯的工作。”采访者提出的问题和克莱姆涅夫的回答预先都已经有了责备的观念。尽管操整理查出了错误所在,他还是受到了惩罚(不过至少没有被流放)。可是编程语言的设计者和所用的软件或方法又怎样呢?没有提到。用这种态度进行处理所产生的问题是,它使我们不能从事故中学到什么,使错误潜伏的情况依旧。

由于“人为错误”而导致计算机系统失败的事件在每个行业都很容易找到,例如核电、航空、商务、股市,当然还有计算机工业本身。在Communications of the ACM(美国计算机协会通信)1989年8月出版的一期中,下列论述出现在新闻追踪栏目中:埃克森石油公司休斯顿总部一名计算机操作员被解雇,该操作员漫不经心地销毁了数以千计文件的电脑拷贝,这些文件中包含与阿拉斯加石油溢出有关的重要信息。然而这位前雇员说他只是替罪羊,在他删除的磁带中没有任何一盘标有“不得销毁”的文字。关于这一事故提供的信息太少,不能得出结论。但如果系统设计中将人的因素考虑了进去,那么磁带的保留就不会仅仅依赖于一条 “不得销毁”的(人为)标签了。这样就既不会发生事故,也不会提供貌似有理的借口了。也许现在是ACM在这一方面带头在计算机系统设计方面采取措施的时候了。ACM的成员中有足够的专长,这些成员包括计算机和公共政策委员会,以及一个专门关注相关问题的研究组:人机交互专门研究组(SIGCHI)。

还有一个方便的起点可以启动这方面的工作。在计算机网络上,Peter Neumann主持着

87 / 156

文档可能无法思考全面,请浏览后下载!

一个很有意义的论坛,即关于计算机和相关系统中公众所面临风险的论坛,作为ACM计算机和公众政策委员会的一项活动。这一

88 / 156

文档可能无法思考全面,请浏览后下载!

“风险”论坛收集、报告、评论各种包括人为错误和设计问题的事故,但这些对于该领域的专业性发展并不具备足够的准确性和权威性。信息来源通常是传媒的报告,而这些报告是不完整的,通常是在全部有关信息收集齐全之前写就的,并受到其他不准确的和有偏向的消息来源的影响。(以上本人引述的《科学》杂志和CACM新闻反映了所有这些不可靠的来源。)通过对设计失败的仔细分析可以得到许多潜在的好处,其他学科领域学会了通过仔细检讨和分析而受益。在回顾“风险”论坛中所讨论的案例中,为什么不将它们用作更好设计的指南呢?

其他行业中正在使用着的好几种系统可以提供一个范例。航空界一个有价值的主要咨询信息源是称为航空安全报告系统(ASRS)的事故汇集(信息库),这是由美国宇航局Ames研究中心(NASA-Ames)运作的,带有Battelle公司管理的计算机可读取的数据库。这里,见证或发生错误或其他有关问题的航空界人员将对事故的描述,以及他们对事故的解释写下来,寄给ASRS。ASRS的调查人员可以召回他们以核对材料的准确性或取得更多的信息。但是一旦信息被确认和澄清,表格中包含提供信息人员身份的有关部分就被返回本人。ASRS还将可确认身份的信息删除,使得人们不可能确定谁是提供消息者和事故的有关人员。这种匿名制度是保证数据库准确性和完整性的关键。因为美国宇航局不具备统制权,而且有保护消息来源机密的良好记录,这一数据库得到了航空界的信任。现在人们如果相信他们的报告将有助于改进航空安全,就会愿意叙述他们自己的行为。驾驶员坐舱和飞机其它部分设计的许多改进都是经过设计者研究了数据库中能找到的错误情况后做出的。

ASRS系统的一个关键因素就是,其中的报告不能被信息提供者的上司看到。其他行业的类似尝试均告失败,因为他们的报告是通过一系列的权威机关提交的,其中包括有关人员的上司或工厂管理层,他们是有偏向的,或者对报告进行处理以减轻责任,或者做出对报告的否定判断。这样一来,关于核工业事故的报告系统对于实际的运作实践就不是一种无偏见的指南。连同确认和澄清体系一起,匿名制度和自我报告制度起到了它的作用,如美国宇航局的ASRS团队(主要由退休的航空专业人士组成)所做的那样。

类似地,美国国家交通安全局(NTSB)也对交通事故进行详细分析,包括航空、高速公路、海运、铁路、输油管。这些报告非常有价值,是相关行业提高安全性的重要因素。(根据法令,NTSB报告不得用于确定事故责任的司法程序。这种保护性措施在当前这种动不动就诉诸法律的社会中,对于调查能进行下去而不用担心其结果会被错误解释或滥用是具有关键作用的。)

ACM是否应当提出类似的动议呢?笔者不知道,因为这个问题和其它行业面临的问题有所不同。但笔者提请ACM对改进本专业的这一方面开展调查。ACM可以采取某种积极的,建设性的行动,提升计算机系统中对人的作用的重视,使之与硬件和软件所引起关注和重视具有等同的水平。

88 / 156

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- ryyc.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务