论文研究-基于DMA实现高速数据包收发.pdf

发布时间：2022-05-29 发布人：admin 分类：说明书资料大小：0.23M 资料格式：pdf 举报版权申诉

weixin_39840387-11401689-4744302542956142778.pdf-第1页.png

第1页 / 共4页

weixin_39840387-11401689-4744302542956142778.pdf-第2页.png

第2页 / 共4页

weixin_39840387-11401689-4744302542956142778.pdf-第3页.png

第3页 / 共4页

weixin_39840387-11401689-4744302542956142778.pdf-第4页.png

第4页 / 共4页

文本预览

第 5 期黄宗和等: 基于 DMA 实现高速数据包收发基于 DM A 实现高速数据包收发 * ( 1. 湖南大学软件学院 , 湖南长沙 410082; 2. 中国科学院计算技术研究所, 北京 100080) 黄宗和1 , 谢高岗 2, 张大方 1 ·912· 摘要: 网络测试是了解网络流量 , 分析业务性能的重要手段。如何实现高速链路流量捕获分析是目前人们非常关注的问题。在网络处理器上设计了一种 BIOS 下基于 DMA 技术的接收、发送以太数据帧的方法, 以提高处理器数据包处理能力。该方法已经在 BCM1250 处理器上实现, 测试实验表明 , 该方法数据包处理能力较之嵌入式 Linux 环境下提高了两倍。关键词: 直接内存访问( DMA) ; 网络处理器 ; 数据包捕获 ; 数据包发送中图法分类号 : TP311. 11; TP393 文章编号 : 1001- 3695( 2006) 05- 0219- 03 文献标识码 : A Packet Capture and Generating at High Speed with DMA HUANG Zong-he1 , XIE Gao-gang2, ZHANG Da-fang1 ( 1. School of Software, Hunan University, Changsha Hunan 410082, China; 2. Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100080, China) Abstract: Network test and measurement is one of most important methods to find out characteristic of traffic and understand application performance. It is key issue to perform network measurement for high speed link. An Ethernet frame capture and generating method has been proposed in BIOS with Direct Memory Access ( DMA) for network processor. This method has been implemented on network processor of BCM 1250. It has been showed from experiment the performance of packet capture and generation with this method on BCM 1250 has been improved double over on embedded linux. Key words: Direct Memory Access ( DMA) ; Network Processor; Packet Capture; Packet Generation 1 引言 2 方法原理网络测试是了解网络流量, 分析业务性能的重要手段, 如何实现高速链路流量捕获分析是目前人们非常关注的问题。数据包捕获与产生是网络测试的基本过程。数据包捕获一般有三种办法: ①基于专用硬件的采集方法, 如 HP/ Agilent Advi- sor, InMon sFlow Probe 等。这些专用硬件可编程性差, 难以满足用户的多种需求。②基于 PC 架构, 通过网络接口卡捕获的方法, 如 Ethereal, EtherPeek 等工具。该方法从链路上捕获数据包, 再从网卡拷贝到操作系统内核空间或者用户空间, 拷贝过程需要大量占用 CPU 资源, 基于该方法的工具在千兆以太网或者更高的高速链路, 对流量进行精确测量是不可能的。③ 基于网络处理器的数据包捕获方法。网络处理器 ( Network Processor, NP) [ 4] 是专门为处理数据包而设计的可编程处理器, 其专门针对数据包处理的部件进行了优化, 因此数据包处理性能得到大幅度的提升。在通用 NP OS 如 Vxwork、嵌入式 Linux 等环境, 由于操作系统的额外开销, 使得网络处理器的性能没能得到极致的发挥。本文在网络处理器上设计了一种 BIOS 下基于 DMA 技术的接收、发送以太数据帧的方法, 以提高处理器数据包处理能力。该方法已经在 BCM1250 处理器上实现, 测试实验表明, 该方法数据包处理能力较之嵌入式 Linux 环境下提高了两倍。收稿日期: 2005- 04- 07; 修返日期: 2005- 05- 19 基金项目: 国家自然科学基金资助项目( 60403031, 60273070) DMA 技术允许来自以太网 MACs 的以太帧直接传输到内存, 而不需要处理器的干涉。同时, 内存中的数据发送到以太网 MACs 也不需处理器处理。因此, 如果我们能够直接操作 DMA, 就能够大大提高网络处理器的数据包处理能力。本文正是基于这种思想, 设计了基于 DMA 方式的数据包接收 / 发送方法。DMA 方式的数据包捕获、发送的思路如图 1 所示。传统方法用户数据基于阅酝粤技术的方法阅酝粤用户空间内核空间网卡驱动陨辕韵设备图员阅酝粤方式实现包捕获辕发送图 1 左侧是传统处理数据包的方式, 由于网卡驱动程序运行在内核空间, 当网卡收到数据包以后, 数据包会存放在内核空间内, 由于上层应用运行在用户空间, 无法直接访问内核空间, 因此要通过系统调用将网卡中的数据包拷贝到用户程序空间。图 1 右侧是改进后的数据包处理方式, 通过重写网卡驱动, 使用 DMA 技术, 使得网卡驱动与上层系统共享一块内存区域, 网卡从网络上捕获到的数据包直接 DMA 至网络监测系统, 这个过程避免了数据的内存拷贝, 不需要占用 CPU 资源, 最大程度地将 CPU 资源让给协议分析和模式匹配等进程去利

·022· 计算机应用研究 2006 年用, 提高了整体性能。零拷贝解决“抓包”的瓶颈问题, 提高网络处理器的数据包处理能力。上层信息的发送过程如图 2 所示。酝藻泽泽葬早藻酝藻泽泽葬早藻 S藻早皂藻灶贼葬贼蚤燥灶辕 A泽泽藻皂遭造藻U灶蚤贼 Transmit FIFO 栽则葬灶泽皂蚤贼阅酝粤悦澡葬灶灶藻造郧酝陨陨 I灶贼藻则枣葬糟藻图圆信息打包辕发送指向两块内存缓冲区。Offset 仅仅作用于 Buffer A, 如果 Offset _b 位被设置, Offset 则应用于 Buffer B。描述符有三个控制位, INT 位被设置, 则 DMA 管道在描述符处理完之后会触发中断。第 2 个控制位指示缓冲区 B 是否有效。第 3 个控制位则允许控制域是应用于 B 缓冲区或者是 A 缓冲区。描述符组织结构有两种, 即环式结构和链式结构。环式结构如图 5 所示。从网络处理器发送至以太网 MACs 的信息首先被拆分成一个个小于 MTU 的小包, 同时每个包都有一个流水线号, 以便标志其在拆分前信息体中的位置。用于接收方信息的重组。阅杂悦砸援粤阅杂悦砸援月 S贼葬贼怎泽韵云云遭孕葬糟噪藻贼蕴藻灶早贼澡灾粤蕴陨凿陨晕栽杂蚤扎藻月怎枣枣藻则粤杂贼葬则贼A凿凿则藻泽泽月怎枣枣藻则粤杂贼葬则贼A凿凿则藻泽泽月怎枣枣藻则月杂蚤扎藻月怎枣枣藻则月韵枣枣泽藻贼 O责贼蚤燥灶泽图源阅酝粤描述符阅藻泽糟则蚤责贼燥则园阅藻泽糟则蚤责贼燥则员杂蚤扎藻粤月怎枣枣藻则粤杂蚤扎藻月月怎枣枣藻则月韵憎灶藻则遭赠阅MA E灶早蚤灶藻阅藻泽糟则蚤责贼燥则R蚤灶早赃泽蚤扎藻鄄员图缘描述符环结构每个小包经过信息分割 / 组包单元之后, 被组装成以太帧。该帧被直接 DMA 发送至 FIFO, 然后经由 GMII 接口发送到物理层。信息的接收过程与发送过程相反( 图 3) , 首先接收到的以太帧被保存到接收 FIFO, 然后由 DMA 控制器取得帧的内容, 经过拆包 / 解码单元, 重组接收到数据包。酝藻泽泽葬早藻哉灶责葬糟噪藻贼 Receive 阅酝粤砸藻糟藻蚤增藻云陨云韵悦澡葬灶灶藻造郧酝陨陨I灶贼藻则枣葬糟藻图猿信息接收辕还原 3 方法详细设计为了进一步详细说明该方法, 我们描述在 BCM1250 上如何实现它。 BCM1250 处理器是一种通用的网络处理器芯片 [ 2] 。片上集成了三个以太网 MACs。每个以太网 MACs 有四个 DMA 管道, 其中的两个用于发送以太帧, 另外两个用于接收以太帧。当发送数据包流时, 存储在内存中的数据被 DMA 发送至 FIFO。DMA 控制器预取 32 字节的 Cache 块来维持 FIFO 始终是装有数据包。数据解包器从 FIFO 中抽取出 64 位双字数据, 并把它们作为一个字节流转发到协议引擎。这时可以选择以太网 MAC 引擎或数据包 FIFO 协议旁路。以太网 MAC 协议引擎根据以太网规范格式化数据包, 执行 MAC 协议来访问发送媒介, 并通过 GMII 引脚把数据包发送至物理层。数据包流的接收开始于来自物理层设备的字节流。字节或者被发送至以太网协议引擎或者数据包 FIFO 协议引擎。协议引擎将会检查数据包的有效与否, 剥去 MAC 层外的头部, 把数据转发至组包单元。所有被接收的字节都被组包成 64 位的双字, 被插入到接收 FIFO。这类似于发送 FIFO, 接收 FIFO 的缓冲功能用于掩饰 DMA 延迟。接收 DMA 引擎将从接收 FIFO 中抽取 32 字节的 Cache 块, 然后传递到内存。 3. 1 DMA 系统 DMA 系统由两个基本组成元素, 即数据缓冲区和描述符。数据缓冲区是一定大小的物理地址空间; 描述符为含有该内存缓冲区参数的并指向该缓冲区的指针。数据之间的传输由三种类型的 DMA 控制器来完成, 分别为: 接收 DMA 控制器和发送 DMA 控制器和数据搬运 DMA 控制器。接收 DMA 控制器负责把以太网口进来的数据传输到数据缓冲区, 发送 DMA 控制器负责把数据缓冲区中的内容发送到以太网接口, 而数据搬运 DMA 控制器则负责在任意两块数据缓冲区之间的传输。描述符的结构示意图如图 4 所示。 DMA 描述符对每个数据缓冲区都包含有这些参数。一个描述符由两个 64 位的双字 dscr_a 和 dscr_b 组成。它们分别砸蚤灶早B葬泽藻 C怎则则藻灶贼 Co怎灶贼砸蚤灶早S蚤扎藻描述符环中可容纳的描述符数目在环被建立起来时就被配置好了, DMA 引擎通过检查环的长度来检测是否到达最后一个描述符( 内存中, 最后的描述符位于内存的最高端 ) 。环大小一般可在 1 ～65 536 之间。软件可以通过增加控制器中用于记载所拥有的描述符的编号的计数器来传递描述符的所有权。这样 DMA 控制器就可以跟踪当前描述符的位置。当 DMA 控制器访问完了一个描述符, 其通过减少描述符计数器的值就可以注销对描述符的拥有权。如果描述符的中断位被设置, 则描述符处理完之后就触发中断。对 DMA 的操作, 只要体现在对描述符环的操作上。在一个接收管道, 当一个数据包被发送到 DMA 引擎时, 接口会在数据包的开始处作一个标记, 这样就可以识别数据包的头部。在发送管道, DMA 引擎则通过数据包的长度域来识别下一个数据包。虽然一个描述符与两块内存块相关联, 但是 DMA 引擎对描述符的两部分是有区别对待的。在 DSCR. A 中包含了一些参数的配置信息, 网口将根据这些参数来处理该数据包。并且, 在数据包被接收后, 数据包的长度等信息只能记载在数据包的第一个描述符, 同时 SOP 位被设置。接收引擎都可以通过软设置来清除描述符的状态字。通过使用 SOP 标志位, 接收引擎可以识别该描述符是数据包的开始。SOP 位仅当一个数据包的所有内容均被接收后才被设置为有效。当发送数据包时, 仅有的变化就是数据包描述符的 SOP 位被清除。这样, 发送引擎就可以通过该标志位判断数据包是否被发送完毕。对于 DMA 引擎来说, 当描述符与数据包相连时, SOP 位必须被设置。如果 SOP 位被设置, 则发送描述符的选项域就必须是非 0; 如果 SOP 位被清除, 则描述符的选项域也必须为 0。当一个管道被 Disabled 之后又 Enabled, 它将又从基地址指向的描述符开始。同时, CPU 必须清零计数器或者是重排描述符环, 以使得有效的描述符位于环的开始处。 3. 2 发送操作发送之前需要作一些发送引用时钟配置, 对于 1Gbps 的操作, 其发送时钟为 125MHz, BCM1250 的 REFCK01 引脚是用于输入引用时钟至以太网口 E0 和 E1。时钟源可在 mac_cfe 寄存器上设置。发送 FIFO 宽 64 位, 能容纳 128 个实体。其配置参数主要有三个, 分别是: tx_rd_thrsh, tx_rl_thrsh, tx_wr_thrsh。tx

第 5 期黄宗和等: 基于 DMA 实现高速数据包收发 ·122· _wr_thrsh 是 mac _thrsh_ cfg 寄存器中的一个域, 用于设置当 FIFO 中至少有多少的空闲实体数时, 才请求填充数据。数据是由协议引擎负责从发送 FIFO 中读取出来, 并发送至物理层。一旦发送操作开始, DMA 引擎必须确保, 当协议引擎需要数据时, FIFO 中总有数据可供发送。无论在什么时候, 如果在数据包结束之前, FIFO 是空的, 将引起下溢错误, 并导致发送失败。为了降低在发送期间 FIFO 发生无数据的情况, 可以通过设置 tx_rd_thrsh 阈值来保证在传输开始时, 已经有一定数量的数据已经写入 FIFO 中。一旦发送开始, 发送的数据会一直保留, 直到 tx_rl_thrsh 个实体被发送完毕。在此期间, 如果检测到任何的错误, 数据包将会被自动重发。这项功能可以通过设定 mac_cfg 寄存器的 tx_hold_sop_en 位来启动。我们知道每个 MAC 都有两个发送 DMA 管道与之相关联。如果只有一个 DMA 管道被启动或者是只有一个管道有可用的描述符, 那么该管道将被选择用于发送数据。如果两个 DMA 管道都被启动, 并且都有可用的数据包, 将通过 mac_txd_ctl 寄存器中设定的权值来选择那个管道用于发送。一般所发送的数据包数目由权值决定。如果一个管道空闲, 另一管道立即开始。如果每个 DMA 管道里面的数据包长度相同, 它们将按照权值来共享发送带宽。发送操作与发送的数据包的封装格式 [ 4] 分别为图 6、图 7 所示。当数据从杂韵孕开始装载至此点袁或者接收到分组结束时袁将请求阅酝粤袁如果在此之前发生错误袁接收到的分组将被丢弃远源 E灶贼则蚤藻泽阅酝粤远源位宽悦澡葬灶灶藻造 r曾赃则凿赃贼澡则泽澡 r曾_则造贼澡则泽澡当数据在接收 M蚤凿鄄责葬糟噪藻贼到达此处袁或者接收到帧结束时袁将会请求阅酝粤图愿接收操作由图 8 可知, 接收器将会推迟告知 DMA 引擎, 直到其成功接收到一定字节的数据包。通过设置 mac_thrsh_cfg 寄存器中的 rx_rl_thrsh 域, 可以设置在通知 DMA 引擎之前, 必须写入 FIFO 的实体数。如果接收到含义结束标志的数据包, 无论什么时候都会告知 DMA 引擎。如果在此点之前发生任何传输错误, FIFO 将被清空, 数据包自动被丢弃。当一个数据包被地址过滤器接收之后, 将会选择一条 DMA 管道。DMA 管道的选择是通过最先接收的 128 个字节里面的其中 8 位来完成( 如果所设定的 rx_rl_thrsh 值小于 128, 那么该 8 位必须在 rx_rl_thrsh 范围之内) 。在取得 8 位数据之后, 再根据 mac _chup 和 mac_ chlo 寄存器所构成的表来查找 2 位。数据包的偏移值可以由 mac_cfg 寄存器所指定( 以 nibbles 为偏移单位) 。当此 2 位值等于 0 时, 数据包将由 DMA 管道 0 来接收, 否则由 DMA 管道 1 来接收。分组起始渊杂韵孕冤员圆愿个实体在杂韵孕与此实体之间发生传输错误时袁接口能够自动重发已发送的数据阅酝粤 4 实验结果分析远源位宽 T曾赃则凿赃贼澡则泽澡 T曾赃则l赃贼澡则泽澡悦澡葬灶灶藻造当云陨云韵填充至此点时袁杂韵孕将被发送图远发送操作 T曾赃wr赃贼澡则泽h 如果云陨云韵有大于此长度的空闲空间袁将请求数据孕则藻增蚤燥怎泽云则葬皂藻陨云郧陨枣早_贼曾孕则藻葬皂遭造藻杂云阅阅藻泽贼蚤灶葬贼蚤燥灶苑粤凿凿则藻泽泽杂燥怎则糟藻葬凿凿则藻泽泽远栽赠责藻蕴藻灶早贼澡圆酝蚤灶孕葬c噪藻贼杂蚤扎藻远酝葬曾孕葬糟噪藻贼杂蚤扎藻员图苑分组的封装格式陨枣早赃贼澡则泽澡阅葬贼葬悦砸悦陨云郧源远~员缘园园源 3. 3 接收操作协议引擎将会处理所有来自物理层的数据包, 负责把物理层的封装剥去, 然后传送到接收 FIFO。接收 DMA 引擎则把数据从 FIFO 传输到内存中的数据包缓冲池中。在接收过程中, 数据包将被校验是否发生了传输错误。在接收数据包早期监测到错误, 数据包将被丢弃, 而不会启动 DMA 操作; 如果数据包在 DMA 被启动之后检查到错误, DMA 操作将不会被中止, 而是一直完成为止。为了标记该数据包有错, 接口将在描述符的状态位上设定错误标志。通过保留接收 FIFO 中初始的一些实体而不告知 DMA 逻辑有数据可取, 直到填充的数据到达所设定的阈值。如果在到达阈值之前, 发生错误, FIFO 指针可以恢复到指向包起始的实体。同时该数据包被丢弃。接收 FIFO 宽 64 位, 可最多容纳 64 个实体。当 FIFO 含有数据时, 发送信号给 DMA 引擎请求 DMA 清空 FIFO。mac_thrsh_cfg 寄存器中的 rx_rd_thrsh 域用于设置 DMA 中的有效实体个数阈值( 当实体个数大于该值时, 将请求清空 FIFO) 。DMA 引擎一般每次传输 32 字节大小的数据块, 因此该域通常设为 4。接收操作如图 8 所示。根据上述的原理, 我们在基于 BCM1250 的 Motorola PCRB 网络处理器硬件平台( 采用双 BCM1250, 单核主频为 750MHz, 内存为 1GB) 和 BroadCom 的 CFE( Common Firmware Environ- ment) 软件平台上实现了该方法。为了检验该方法以太数据包处理能力, 进行性能测试实验。 Smartbits2000 与 PCRB 通过 GE 链路直接相连, PCRB 对捕获的数据包进行了 MAC- > IP- > TCP/UDP- > Application 的逐层解码, 然后把数据包转发出去。在处理捕获的数据包之前, 记下当前的时间戳 t1 到一个临时变量, 然后当处理完该数据包之后, 记下当时的时间戳 t2。则数据包总的处理时间为 t2 - t1。数据包处理的吞吐量为 C = 1 △t = 1 t2 - t1 为了测单个数据包的处理性能, 我们在 100% 带宽利用率下对不同大小的数据包进行测试, 测试的结果如表 1 所示。表 1 不同大小数据包处理时间带宽包大小带宽包大小 ( B) 64 128 256 384 512 640 768 利用率 100 % 100 % 100 % 100 % 100 % 100 % 100 % 包处理时间 ( t) 0. 871 0. 867 0. 872 0. 871 0. 872 0. 873 0. 871 ( B) 894 1 024 1 152 1 280 1 408 1 500 利用率 100 % 100 % 100 % 100 % 100 % 100 % 包处理时间 ( t) 0. 868 0. 867 0. 872 0. 873 0. 868 0. 874 如表 1 所示, 在不同字节大小情况下数据包处理时间基本上是相等的( 因为对进来的数据包的处理流程基本相同) , 数据包处理时间平均值为 0. 87μs, 吞吐量为 1 149 425pps。较之在 Linux 环境下的 382 321pps 提高了两倍的速率。 ( 下转第 227 页 )

第 5 期柳斌等: 基于 Linux 系统的高速网络捕包技术研究 ·722· 数据, 如果有数据, 就根据这个指针取得内存中的数据包, 如果没有数据, 就会将自己阻塞, 直到有数据包到达才被唤醒读取数据, 这样网络上若有大量的数据包到达, 内核就可以不断向环形缓冲区中写数据, Libpcap 同时不断地从环形缓冲区中读取数据, 数据包的读写并行工作减少了系统调用和数据包拷贝。 3 试验分析和数据拷贝是 Lioux 中 Libpcap 捕包的主要性能瓶颈 , 对此给出了 NAPI 与 MMAP 相结合的捕包方案。 NAPI 是一种中断与轮询相结合的技术 , 在网络重负载时能有效地降低了中断数量, 避免系统进入中断活锁状态。MMAP 可以将内核空间映射至用户进程空间 , 减少数据包的拷贝和系统调用。实验结果表明该方案有效改善短长度数据包接收的效率, 减少中断触发的时间 , 提高了网络重负载下数据包的捕获率。对改进方案进行测试。测试环境如第 1 节所述。采用 Linux 2. 6. 0 内核, 100MB 网卡为 Realtek 8139。修改 8139 网卡驱动程序, 添加 POLL 方法支持 NAPI。使用 Libpcap 1. 020040706 版本, 该版本是 Libpcap 的一个特殊版本 [ 2] , 支持 MMAP 内存映射。捕获率的测试结果如表 3 所示。参考文献: [ 1] H Salim, R Olsson, A Kuznetsov. Beyond Softnet[ J] . Proc. Linux 2 . 5 Kernel Developers Summit, San Jose, CA, USA, 2001. [ 2] 田志宏 , 方滨兴 , 云晓春 . RTLinux 下基于半轮询驱动的用户级报文传输机制[ J] . 软件学报, 2004, 15 ( 6) : 834- 839. 表 3 改进后 Libpcap 捕获率 [ 3] Libpcap[ EB / OL] . http: / / public. lanl. gov / cpw/ , 2005- 04- 20. 背景流量 [ 4] Mogul C J, Ramakrishnan K K. Eliminating Receive Live-lock in an Interrupt-driven Kernel [ J ] . ACM Transactions on Computer Sys- tems, 1997, 15( 3) : 217- 252 . [ 5] [ 6] http: / / luca. ntop. org / ring. pdf, 2005- 04 - 20[ EB/ OL] . http: / / www. linuxhq. com/ kernel / file/ Documentation/ networking/ NAPI_HOWTO. txt, 2005- 04- 20[ EB / OL] . [ 7] http: / / oprofile. Source-forge. net/ , 2005- 04 - 20[ EB/ OL] . 作者简介: 柳斌( 1971- ) , 男 , 湖北武汉人 , 讲师 , 博士研究生, 主要研究方向为网络安全、网络多媒体; 李之棠 ( 1952- ) , 男, 湖北人, 教授 , 博士生导师 , 主要研究方向为计算机网络、网络安全、计算机系统结构和并行处理 ; 背景数据包帧长 0 Mbps 25Mbps 50Mbps 75Mbps 100Mbps 1512 B 512 B 80B 100% 100% 100% 100% 100% 90 % 100% 100% 81 % 97 % 81 % 72 % 94 % 67 % 21 % 对比表 1、表 3, 可以看出采用 NAPI 和 MMAP 后, 在小包的环境下, 由于网卡中断数量减少, 捕包率有较大提高, 特别是在背景数据帧长为 80B 情况下, 改善明显。在 100Mbps, 80B 背景流量条件下, 系统不再出现瘫痪现象。实验表明: 改进方案适用于对高速率的短长度数据包的处理。 4 结束语网络捕包是网苗分析工具的基础。中断处理、系统调用黎耀( 1977- ) , 男 , 湖北人 , 讲师, 主要研究方向为网络安全。 ( 上接第 221 页) 网络处理器的另一个指标是丢包率。采用上面的测试数据, 同时在 10% ～100% 不同带宽下进行试验, 发现对于 64B 的数据包 , 当带宽利用率为 70% 时 , 出现丢包现象。也就是当发送速率为大于 1 000 000pps 时发生丢包。图 9 是 64B 数据包在不同带宽利用率下发送和捕获到的数据包比较图。丢包主要是底层硬件( 网卡) 的处理能力引起的。实际网络带宽一般为设计的 30% ～40% , 因此我们的解决方案是足以应付的。员远园园园园园园员源园园园园园园员圆园园园园园园员园园园园园园园愿园园园园园园远园园园园园园源园园园园园园圆园园园园园园园 5 结论产生数据捕获数据图怨远源月产生数据帧和捕获数据帧收、发送以太数据帧的方法, 以提高处理器数据包处理能力。该方法已经在 BCM1250 处理器上实现, 测试实验表明, 该方法数据包处理能力较之嵌入式 Linux 环境下提高了两倍。此外, 该方法对于高速业务链路监测的流的存储提供一种很好的解决方案。参考文献: [ 1] vangelos P Markatos, et al. User-level DMA without Operating Sys- tem Kernel Modification[ C] . Proceedings of the 3rd IEEE Symposium of High-Performance Computer Architecture, Tx USA, NW Washington DC USA, IEEE Computer Society, 1997. 322. [ 2] Increasing Perform in Network Storage w / Multi-Processors & High- Speed I/ O [ EB / OL] . http: / / zh-tw. broadcom. com/ collateral / wp / 1250-WP100-R. pdf, 2002. [ 3] W Richard Stenens. TCP / IP Illustrated ( volume1 ) . The Protocols [ M] . Addison Wesley, 1994. 15-17. [ 4] N Shah. Understanding Network Processors, Master’s Thesis [ R ] . Dept. of Electrical Engineering and Computer Sciences, University of California, Berkeley, 2001. 作者简介: 网络测试是了解网络流量, 分析业务性能的重要手段, 如何实现高速链路流量捕获分析是目前人们非常关注的问题。本文在网络处理器上设计了一种 BIOS 下基于 DMA 技术的接黄宗和 ( 1979 - ) , 男, 广东茂名人 , 研究生 , 主要研究方向为高速业务流监测、测量与监控 ; 谢高岗 , 男 , 浙江衢州人, 副研究员 , 主要研究方向为高速网络技术、网络测试测量与监控、QoS 等; 张大方, 男 , 上海人 , 教授 , 主要研究方向为可信系统与网络、网络测试测量与监控。

分享到：

赞收藏

资料库

论文研究-基于DMA实现高速数据包收发.pdf

相关推荐

开发技术

热门标签

最新资料