跳至主要内容

什么是工作量?

工作量

在信息技术(IT)领域,工作负载指的是在基础设施环境中消耗IT资源的计算任务、应用程序、服务或进程。这些资源包括处理能力、内存、存储容量和网络带宽。从运行业务应用程序到处理人工智能模型,每一项数字化操作都代表着在底层硬件和软件系统上运行的工作负载。

工作负载决定了基础设施的利用方式。它们决定了所需的性能水平、系统的扩展方式、数据的存储和传输方式,以及如何维护可用性和弹性。在企业环境中,工作负载的范围很广,从传统的业务应用程序和企业级 Web 工作负载到大规模分析、虚拟化、高性能计算(HPC) 和人工智能 (AI) 驱动的服务,都包含在内。

随着IT环境的演进,工作负载不再局限于单个服务器或数据中心。它们可能运行在私有管理的数据中心、公有云环境、混合部署以及边缘位置。每种工作负载都具有独特的特性,这些特性会影响基础设施的设计,包括计算强度、内存消耗、延迟敏感性、存储吞吐量需求和可扩展性要求。

了解什么是工作负载以及不同工作负载的行为方式,是设计高效、可扩展和节能的 IT 系统的基础。

IT 工作负载类型

IT 工作负载因其支持的应用程序、处理的数据以及所需的性能级别而异。有些工作负载需要强大的计算能力,而另一些则更注重存储容量、内存带宽或低延迟网络。了解工作负载类别有助于组织将基础设施资源与运营需求、可扩展性目标和效率目标相匹配。以下各节概述了现代企业、云和边缘环境中常见的主要工作负载类型。

计算密集型工作负载

计算密集型工作负载严重依赖处理能力来执行复杂的计算或大量的并行任务。这些工作负载会消耗大量的中央处理器 (CPU) 或图形处理器(GPU) 资源,常见于高性能计算 (HPC)、科学模拟、金融建模和媒体渲染等领域。

人工智能 (AI) 和机器学习(ML) 的训练工作负载也属于此类,尤其是在涉及大型数据集和深度神经网络时。这些环境通常受益于专为加速并行处理和提高性能效率而设计的 GPU 优化系统。

企业级Web工作负载

企业级Web工作负载支持基于Web的应用程序、电子商务平台、内容管理系统以及服务于业务运营的应用程序编程接口(API)。这些工作负载必须能够应对流量波动,保持高可用性,并可横向扩展以满足不断增长的用户需求。

它们通常在虚拟化或容器化环境中运行,并部署在分布式基础设施上。为了支持稳定的性能和可扩展性,企业通常依赖于可扩展的机架式系统,这些系统专为企业数据中心的高密度部署和可靠的正常运行时间而设计。

内存密集型工作负载

内存密集型工作负载依赖于大容量内存和高带宽来实时处理数据。内存数据库、实时分析平台和缓存系统需要快速访问存储在内存中的数据,以最大限度地减少延迟并提高事务处理速度。

这些工作负载对内存架构和系统配置尤为敏感。合理的资源分配能够确保在持续或不可预测的需求下,性能保持稳定。

存储密集型工作负载

存储密集型工作负载优先考虑高容量存储系统、快速的输入/输出性能和数据持久性。例如,大数据分析、备份和灾难恢复环境、数据湖、视频归档和企业文件系统。

此类工作负载可能需要高吞吐量存储架构以及对以下技术的支持: NVMe 以及软件定义存储。基于高容量存储平台构建的基础设施可以提供高效管理大型且不断增长的数据集所需的性能和可扩展性。

云原生和分布式工作负载

云原生工作负载采用容器、微服务和编排框架等现代应用架构设计而成。与单一的单体应用不同,这些工作负载由更小、更独立的多个服务组成,这些服务可以独立扩展,并且可以在不中断整个系统的情况下进行更新。

分布式计算模型通过将处理任务分散到多个系统上,增强了系统的弹性和可扩展性。支持这些架构的基础设施通常采用多节点服务器架构,以提高集群计算环境中的资源效率、容错能力和横向扩展能力。

边缘工作负载

边缘工作负载是指需要在数据生成点附近进行数据处理的应用。这些工作负载通常对延迟或带宽非常敏感,常见于电信、零售运营、制造系统、医疗保健环境和智能基础设施部署等领域。

由于边缘工作负载通常在集中式设施之外运行,因此需要紧凑可靠的基础设施,能够在分布式环境中运行。部署方案可能采用边缘计算系统,该系统旨在支持本地化处理和业务连续性。

工作量特征和资源需求

每种工作负载都有其特定的技术特性,这些特性决定了基础设施的设计方式。这些特性会影响处理器选择、内存容量、存储配置、网络带宽和系统密度。了解工作负载行为有助于企业在保持效率和可扩展性的同时,将资源与性能预期相匹配。

计算需求通常是最显而易见的因素。人工智能训练、建模和高级分析需要GPU优化服务器支持的加速处理,而传统的企业应用可能更注重均衡的CPU性能和虚拟化能力。

内存需求同样重要。内存数据库和实时分析平台依赖于大容量内存和高带宽来避免性能瓶颈。存储密集型工作负载,包括大型数据库和数据湖,需要基于高容量存储平台构建的稳定吞吐量和可扩展架构,以在数据量增长时保持响应能力。

可扩展性也决定了工作负载的设计。分布式和云原生应用程序通常依赖多节点服务器架构和云原生基础设施平台来支持横向扩展和应对需求波动。


 

工作负载运行位置:数据中心、云、混合环境和边缘

现代工作负载可以根据业务目标、监管要求、性能预期和成本考量,部署在各种环境中。工作负载类型定义了应用程序的行为方式,而部署模型则决定了这些工作负载的运行位置。

本地数据中心工作负载

本地部署使企业能够完全掌控基础设施、安全策略和合规性管理。关键业务数据库、企业资源规划 (ERP) 系统和内部企业 Web 工作负载通常在专用的企业数据中心内运行,这些数据中心旨在实现可预测的性能和高可用性。

基于刀片服务器或可扩展机架式系统的基础设施能够实现密集部署、集中管理和长期基础设施规划。

公有云工作负载

公有云环境提供弹性容量和基于使用量的定价模式。当企业优先考虑快速扩展、地理分布或降低资本支出时,会将工作负载部署到公有云。

公共云部署通常构建在专为虚拟化、容器化和大规模资源池化而设计的基础设施之上。

混合云工作负载

混合部署结合了本地和公有云基础设施,使组织和企业能够根据性能、成本、数据主权或监管要求来部署工作负载。这种模式允许动态的工作负载迁移,同时保持对敏感系统的控制。

混合型企业战略通常依赖于可扩展的基础设施,该基础设施能够在各种环境中持续运行,支持工作负载可移植性和均衡的资源分配。

边缘部署

边缘部署将基础设施扩展到集中式数据中心之外,以支持更靠近用户、设备或数据源的实时处理。企业采用边缘策略来降低延迟、减少带宽消耗并提高应用程序响应速度。

这些环境通常依赖于专为分布式操作和空间受限位置而设计的边缘计算平台

工作负载管理和优化

工作负载管理是指用于在应用程序和服务之间高效分配计算资源的流程和技术。随着组织在数据中心、云环境和边缘位置运行日益多样化的工作负载,有效的管理对于维持性能、可靠性和成本控制至关重要。

工作负载管理的核心在于监控资源利用率、平衡计算和内存分配,并确保应用程序获得所需的容量,同时避免基础设施过度配置。虚拟化平台和容器编排框架能够实现动态资源分配,使工作负载能够根据实时需求进行扩展。这种弹性对于流量模式多变的企业级 Web 工作负载和云原生应用程序尤为重要。

优化不仅限于扩展。它还包括使工作负载需求与系统架构相匹配,从而提高每瓦性能、降低延迟并提升吞吐量。计算密集型应用可受益于GPU优化服务器支持的加速处理,而数据密集型环境则依赖于专为实现稳定输入/输出性能而设计的高容量存储平台。分布式应用通常依赖多节点服务器架构来提高弹性和资源效率。

通过持续评估工作负载行为和基础设施性能,企业可以提高资源利用率、降低运营成本,并确保 IT 环境能够持续响应不断变化的业务需求。有效的工作负载优化最终能够实现可扩展的增长,同时保持可预测且节能的运营。

工作负载关键性、安全性和基础设施设计

并非所有工作负载都对业务产生同等程度的影响。有些应用程序直接支持创收或关键运营,而另一些则服务于内部或开发目的。因此,基础设施决策必须反映工作负载的优先级、风险承受能力、性能要求和监管义务。评估工作负载的关键性有助于组织将系统架构与服务级别预期、安全标准和长期运营战略保持一致。

工作负载关键性和服务水平

工作负载通常根据其对业务连续性的重要性进行分类。关键任务型工作负载,例如事务数据库或核心企业级 Web 工作负载,需要高可用性、低延迟和严格的正常运行时间保证。业务关键型工作负载可以容忍有限的停机时间,但仍需要可靠的性能。非关键型工作负载,包括开发和测试环境,通常允许更大的资源分配灵活性。

服务级别协议 (SLA) 定义了性能基准、正常运行时间目标和恢复目标。满足这些要求通常需要构建基于刀片服务器平台或多节点架构的冗余、集群和容错架构。将基础设施与工作负载优先级相匹配,可确保资源得到合理分配,同时最大限度地降低运营风险。

安全和合规要求

工作负载敏感性会显著影响部署和基础架构设计。处理受监管、机密或专有数据的应用程序必须遵守严格的安全和合规标准。这些要求可能包括加密、访问控制、工作负载隔离、审计日志记录和数据驻留策略。

某些工作负载可能需要保留在受控的本地环境中以满足监管要求,而其他工作负载则可以在混合或云模式下运行。支持敏感应用程序的基础设施必须经过精心设计,以确保数据完整性和可用性,同时不影响性能。专为安全且可扩展部署而设计的平台(包括一些机架式系统)有助于组织在安全性和运营效率之间取得平衡。

分层基础设施设计

组织经常实施分层基础设施策略,以使系统功能与工作负载的重要性和性能需求相匹配。

一级工作负载

一级工作负载是任务关键型应用,需要最高的可用性、容错性和性能稳定性。这些环境通常依赖于高度冗余的架构和企业级系统,这些系统旨在实现持续正常运行。

二级工作负载

二级工作负载支持重要的业务功能,但在维护或发生意外事件时允许有限的停机时间。该层级的基础设施通常在保证可靠性的同时,兼顾性能和成本效益。

第三级工作负载

第三级工作负载包括开发、测试、归档或非必要服务。这些工作负载优先考虑成本优化和资源整合,通常在共享或低密度系统上运行,例如用于归档或备份应用程序的高容量存储系统。

通过实施分层基础设施设计,组织可以将性能、安全性和投资水平与工作负载优先级保持一致,从而确保关键任务系统获得适当的资源,同时保持不太重要的应用程序的成本效益。

常见问题

  1. 工作负载和应用程序有什么区别?
    应用程序是执行特定任务的软件程序。工作负载代表一个或多个应用程序、服务和进程产生的总计算需求,以它们对计算、内存、存储和网络资源的综合消耗量来衡量。
  2. 什么是企业级Web工作负载?
    企业级Web工作负载由支持核心业务功能的Web应用程序组成,包括电子商务平台、客户门户和API。这些工作负载需要高可用性、可扩展性和稳定的性能,以应对用户需求的波动和影响收入的运营。
  3. 什么是工作负载自动化?
    工作负载自动化利用软件工具来调度、执行和管理计算任务,无需人工干预。它协调作业依赖关系、资源分配和扩展活动,帮助组织提高效率、减少错误并保持稳定的运行性能。
  4. 什么是云工作负载?
    云工作负载是指在公有云、私有云或混合云环境中运行的应用程序或服务。这些工作负载通常使用虚拟机或容器,并受益于弹性可扩展性和分布式资源可用性。
  5. 什么是关键任务工作负载?
    关键业务工作负载是指对核心业务运营至关重要的应用程序。停机或性能中断可能会造成重大的财务或运营影响,因此需要高可用性、冗余、明确的恢复目标和严格的服务级别承诺。
  6. 工作负载如何影响基础设施设计?
    工作负载根据计算强度、内存使用量、存储吞吐量、延迟敏感性和可扩展性需求来决定基础设施要求。了解这些因素可以确保系统架构能够提供适当的性能、可靠性和成本效益。
  7. 什么是工作负载可扩展性?
    工作负载可扩展性是指应用程序应对不断变化的需求的能力。它可以通过增加系统资源进行纵向扩展,也可以通过将任务分配到多个系统上进行横向扩展,以保持性能的一致性。