万卡万P万亿参数通用算力!摩尔线程夸娥智算中心解决方案重磅升级
时间:2024-07-06  浏览次数:663

  摩尔线程夸娥(KUAE)万卡智算集群,以全功能GPU为底座,旨在打造国内领先的、能够承载万卡规模、具备万P级浮点运算能力的国产通用加速计算平台,专为万亿参数级别的复杂大模型训练而设计。这一里程碑式的进展,树立了国产

  此外,摩尔线程联合中国移动通信集团青海有限公司、中国联通青海公司、北京德道信科集团、中国能源建设股份有限公司总承包公司、桂林华崛大数据科技有限公司(排名不分先后)分别就三个万卡集群项目进行了战略签约,多方聚力共同构建好用的国产GPU集群。

  摩尔线程创始人兼CEO张建中表示:“当前,我们正处在生成式人工智能的黄金时代,技术交织催动智能涌现,GPU成为加速新技术浪潮来临的创新引擎。摩尔线程矢志投身于这一历史性的创造进程,致力于向全球提供加速计算的基础设施和一站式解决方案,为融合人工智能和数字孪生的数智世界打造先进的加速计算平台。夸娥万卡智算集群作为摩尔线程全栈AI战略的一块重要拼图,可为各行各业数智化转型提供澎湃算力,不仅有力彰显了摩尔线程在技术创新和工程实践上的实力,更将成为推动AI产业发展的新起点。”

  大模型自问世以来,关于其未来的走向和发展趋势亟待时间验证,但从当前来看,几种演进趋势值得关注,使得其对算力的核心需求也愈发明晰。

  首先,Scaling Law将持续奏效。Scaling Law自2020年提出以来,已揭示了大模型发展背后的“暴力美学”,即通过算力、算法、数据的深度融合与经验积累,实现模型性能的飞跃,这也成为业界公认的将持续影响未来大模型的发展趋势。Scaling Law将持续奏效,需要单点规模够大并且通用的算力才能快速跟上技术演进。

  其次,Transformer架构不能实现大一统,和其他架构会持续演进并共存,形成多元化的技术生态。生成式AI的进化并非仅依赖于规模的简单膨胀,技术架构的革新同样至关重要。Transformer架构虽然是当前主流,但新兴架构如Mamba、RWKV和RetNet等不断刷新计算效率,加快创新速度。随着技术迭代与演进,Transformer架构并不能实现大一统,从稠密到稀疏模型,再到多模态模型的融合,技术的进步都展现了对更高性能计算资源的渴望。

  与此同时,AI、3D和HPC跨技术与跨领域融合不断加速,推动着空间智能、物理AI和AI4Science、世界模型等领域的边界拓展,使得大模型的训练和应用环境更加复杂多元,市场对于能够支持AI+3D、AI+物理仿真、AI+科学计算等多元计算融合发展的通用加速计算平台的需求日益迫切。

  多元趋势下,AI模型训练的主战场,万卡已是标配。随着计算量不断攀升,大模型训练亟需超 级工厂,即一个“大且通用”的加速计算平台,以缩短训练时间,实现模型能力的快速迭代。当前,国际科技巨头都在通过积极部署千卡乃至超万卡规模的计算集群,以确保大模型产品的竞争力。随着模型参数量从千亿迈向万亿,模型能力更加泛化,大模型对底层算力的诉求进一步升级,万卡甚至超万卡集群成为这一轮大模型竞赛的入场券。

  然而,构建万卡集群并非一万张GPU卡的简单堆迭,而是一项高度复杂的超 级系统工程。它涉及到超大规模的组网互联、有效率的集群计算、长期稳定性和高可用性等诸多技术难题。这是难而正确的事情,摩尔线程希望能够建设一个规模超万卡、场景够通用、生态兼容好的加速计算平台,并优先解决大模型训练的难题。

  夸娥(KUAE)是摩尔线程智算中心全栈解决方案,是以全功能GPU为底座,软硬一体化、完整的系统级算力解决方案,包括以夸娥计算集群为核心的基础设施、夸娥集群管理平台(KUAE Platform)以及夸娥大模型服务平台(KUAE ModelStudio),旨在以一体化交付的方式解决大规模GPU算力的建设和运营管理问题。

  基于对AI算力需求的深刻洞察和前瞻性布局,摩尔线程夸娥智算集群可实现从千卡至万卡集群的无缝扩展,旨在满足大模型时代对于算力“规模够大+计算通用+生态兼容”的核心需求,通过整合超大规模的GPU万卡集群、极 致的计算效率优化以及高度稳定的运行环境,以万卡智算集群的新超 级工程,重新定义国产集群计算能力的新标准。

  超大算力,万卡万P:在集群计算性能方面,全新一代夸娥智算集群实现单集群规模超万卡,浮点运算能力达到10Exa-Flops,大幅提升单集群计算性能,能够为万亿参数级别大模型训练提供坚实算力基础。同时,在GPU显存和传输带宽方面,夸娥万卡集群达到PB级的超大显存总容量、每秒PB级的超高速卡间互联总带宽和每秒PB级超高速节点互联总带宽,实现算力、显存和带宽的系统性协同优化,全面提升集群计算性能。

  超高稳定,月级长稳训练:稳定性是衡量超万卡集群性能的关键。在集群稳定性方面,摩尔线程夸娥万卡集群平均无故障运行时间超过15天,最长可实现大模型稳定训练30天以上,周均训练有效率在99%以上,远超行业平均水平。这得益于摩尔线程自主研发的一系列可预测、可诊断的多级可靠机制,包括:软硬件故障的自动定位与诊断预测实现分钟级的故障定位,Checkpoint多级存储机制实现内存秒级存储和训练任务分钟级恢复以及高容错有效能的万卡集群管理平台实现秒级纳管分配与作业调度。

  极 致优化,超高MFU:MFU是评估大模型训练效率的通用指标,可以直接反应端到端的集群训练效率。夸娥万卡集群在系统软件、框架、算法等层面一系列优化,实现大模型的有效率训练,MFU最 高可达到60%。其中,在系统软件层面,基于极 致的计算和通讯效率优化等技术手段,大幅提升集群的执行效率和性能表现。在框架和算法层面,夸娥万卡集群支持多种自适应混合并行策略与有效显存优化等,可以根据应用负载选择并自动配置最 优的并行策略,大幅提升训练效率和显存利用。同时,针对超长序列大模型,夸娥万卡集群通过CP并行、RingAttention等优化技术,有效缩减计算时间和显存占用,大幅提升集群训练效率。

  全能通用,生态友好:夸娥万卡集群是一个通用加速计算平台,计算能力为通用场景设计,可加速LLM、MoE、多模态、Mamba等不同架构、不同模态的大模型。同时,基于有效易用的MUSA编程语言、完整兼容CUDA能力和自动化迁移工具Musify,加速新模型“Day0”级迁移,实现生态适配“Instant On”,助力客户业务快速上线。

  万卡集群的建设需要产业界的齐心协力,为实现大模型创新应用的快速落地,让国产算力“为用而建”。发布会现场,摩尔线程携手中国移动通信集团青海有限公司、中国联通青海公司、北京德道信科集团、中国能源建设股份有限公司总承包公司、桂林华崛大数据科技有限公司(排名不分先后),分别就青海零碳产业园万卡集群项目、青海高原夸娥万卡集群项目、广西东盟万卡集群项目进行了战略签约。

  借助摩尔线程先进的夸娥全栈智算解决方案,各方将携手共建强大的全国产智算平台,以加速产业数字化转型和高质量发展。夸娥万卡智算集群项目标志着国产AI算力基础设施的又一重大进展,将为各地的数字经济发展注入新活力。

  发布会后,无问芯穹、清程极智、360、京东云、智平方等五家合作伙伴代表纷纷登台,分享了摩尔线程夸娥智算集群如何助力其在大模型训练、大模型推理、具身智能等不同场景和领域的创新,展现了夸娥智算集群在实际应用中的巨大潜力与广泛适用性。

  摩尔线程愿与广大行业伙伴并肩同行,发挥全栈AI的力量,加速推动一个由万卡智算集群为强大底座,多领域伙伴共建、广泛赋能数字经济的国产智算生态,共同开启一个属于大模型与生成式人工智能的新时代,为美好世界加速。在WAIC期间,摩尔线程将在上海世博展览馆(H2馆D616)开展“全栈AI 为美好世界加速”的主题成果展示,包括加速卡、服务器、超融合一体机和AIGC应用在内的摩尔线程全栈AI产品悉数亮相,并携手众多行业合作伙伴联合展示基于夸娥智算集群的丰富行业大模型与应用方案。

  摩尔线月,以全功能GPU为核心,致力于向全球提供加速计算的基础设施和一站式解决方案,为各行各业的数智化转型提供强大的AI计算支持。

  我们的目标是成为具备国际竞争力的GPU领军企业,为融合人工智能和数字孪生的数智世界打造先进的加速计算平台。我们的愿景是为美好世界加速。

  特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!

  展会预告诚挚邀请您参加在上海新国际展览中心举办的老博会!我们在W3馆C31站台展出万维感知革命性AI健康传感解决方案,覆盖血压无感连续监测,心率呼吸率无感监测解决方案。期待与您共商合作,携手开启智慧养老及医疗康复新篇章。我们期待在即将到来的AID展会上,与各界合作伙伴共同探讨智能感知技术在康养领域创新应用以及康养产业的未来发展。

  作为普通商品的纺织服装生产过程看似简单,但它带来的能耗和污染却不容忽视。纺织服装行业在污染产业中排名第二,仅次于石油产业。克鲁勃润滑剂是纺织服装行业推进可持续发展的有力助手,企业生产经营遇到的任何润滑问题均可从克鲁勃找到合适的方案。

  在新生儿的喂养过程中,相信很多宝妈都被宝宝的便便状态焦虑和烦心过,尤其是面对绿便情况真的是如临大敌。宝宝绿便的成因到底是什么?如何能破解这一喂养问题?今天,就让我们一文讲清楚宝宝绿便的成因,帮助宝爸宝妈们破解宝宝的绿便问题。超百亿的活性益生菌和双益生元组合,也为宝宝的肠道菌群平衡提供可能,助力消化吸收。

  基于完全自主研发的SoveCloudDO分布式对象存储系统,依托标准X86服务器,亿万克为高校提供科研创新服务,以“技术四宝”实现科研数据存储和管理。1、硬件资源池采用EVOCX86架构服务器,搭配通用网卡与存储磁盘,通过IP网路组建存储集群。4、统一身份访问搭建统一门户网站、涌动门户和一站式大厅,为客户提供多样化的使用体验。

  老师突然给我发信息,说“岩岩最近上课不专心,总是走神”。爷爷也说她似乎变得有些“不礼貌”,在聊天时也不愿意直视,甚至晚上总是斜着眼睛看爷爷。铂林眼科通过五维近视管理体系,为儿童和成人提供专业有效、个性化的视力改善方案,致力于让更多孩子的视界清晰、舒适、持久,为他们的健康成长提供支持。

  在全球化浪潮日益高涨的今天,跨境电商已成为企业拓展海外市场、提升品牌影响力的重要渠道。面对复杂的国际市场和繁琐的建站流程,许多企业感到力不从心。在跨境电商的道路上,KShop将是您最可靠的伙伴。

  “所有的产品或者服务都是给用户提供一种价值,然后在创造价值的过程中来实现商业利益。”在激烈的市场竞争中,只有找到用户痛点,洞察用户真正需求,不断提供满足用户需求的产品和服务,企业才能生存下去,进实现更好的发展。升级一品威客网平台个性化任务推荐引擎,让企业需求与人才匹配变得更完善;为中小微企业提供在线数字业务解决方案……未来,一品威客将继续在众包市场深耕,不断创新产品研发,不断提升平台服务效率和水平,为中小微企业用户创造更大价值。

  近期AI计算平台已经迎来新一轮升级。从NVIDIA发布RubinGPU,到Intel发布至强6,再到AMD的锐龙和EPYC处理器,无一不在强调AI加速的重要性。在多样化数字社会进程中,助力创建行业标准,应对不断变化的市场趋势,推动行业向令人振奋的方向发展。

  售后技术支持是企业销售行为的延续,也是企业直面客户的一个重要窗口,如何在售后技术支持环节收获客户的积极评价,同时提升服务效率,是每一个企业的重要课题。作为一款专业的远程技术支持解决方案,贝锐向日葵技术支持解决方案很好的解答了上述课题,该方案通过专业的功能搭载,以及与工单平台产品的有效融合,帮助企业更好的搭建一个售后技术支持体系,让�

  柏林-2024年6月18日-创新、开放和安全的企业级解决方案的全球领导者SUSE®今天公布了SUSEAI,即SUSE对开放、安全和企业级生成式人工智能的愿景和战略。SUSEAI提供了一个交钥匙平台,为企业提供在本地或云中使用其选择的大语言模型运行私有生成式AI解决方案的自由。SUSE让“开源”重新“开放”,使客户能够灵活地应对当今的创新挑战,并能够自由地在未来发展其IT战略和解决方案。

  奇点通是一个致力于提高工作效率的在线工具平台,通过集成多种智能功能,帮助用户在品牌识别、内容创作、社交媒体推广等场景下提升效率。产品背景是当前市场对于自动化和智能化工具的需求日益增长,奇点通通过其技术优势,为用户提供了一种高效、便捷的工作方式。

  302.AI是一个汇集了全球顶级AI品牌的在线平台,提供无月费,按需付费的服务模式。它允许用户根据需求选择不同的AI服务,无需支付固定的月费,从而降低使用门槛,提高灵活性。平台可能涵盖了多种AI技术,如图像识别、自然语言处理等,满足不同用户的需求。

  InternLM-XComposer2.5是一款专注于文本图像理解与合成应用的大型语言模型,具有7B参数的后端支持,能够处理长达96K的长文本上下文,适合需要广泛输入输出的复杂任务。

  Wanderboat是一个利用人工智能技术,为用户提供个性化旅行计划的网站。用户可以通过聊天的方式,快速生成符合自己兴趣和偏好的旅行行程。它通过分析用户的需求,推荐最佳的景点、餐厅和活动,让旅行规划变得简单而无压力。

  Gemma-2-27B-Chinese-Chat是基于google/gemma-2-27b-it的首个指令调优语言模型,专为中英文用户设计,拥有角色扮演和工具使用等多种能力。该模型通过ORPO算法进行微调,显着提升了在中英文对话、角色扮演和数学计算等方面的性能。

  SenseVoice是一个包含自动语音识别(ASR)、语音语言识别(LID)、语音情感识别(SER)和音频事件检测(AED)等多语音理解能力的语音基础模型。它专注于高精度多语种语音识别、语音情感识别和音频事件检测,支持超过50种语言,识别性能超越Whisper模型。模型采用非自回归端到端框架,推理延迟极低,是实时语音处理的理想选择。

  CodeGeeX4-ALL-9B是CodeGeeX4系列模型的最新开源版本,基于GLM-4-9B持续训练,显着提升了代码生成能力。它支持代码补全、生成、代码解释、网页搜索、函数调用、代码问答等功能,覆盖软件开发的多个场景。在公共基准测试如BigCodeBench和NaturalCodeBench上表现优异,是参数少于10亿的最强代码生成模型,实现了推理速度与模型性能的最佳平衡。

  YoYo是一个提供创意合成素材的平台,用户可以在这里探索各种角色和风物素材,进行个性化创作。它支持用户通过选择不同的角色和场景素材,合成具有独特风格的插图或图像。YoYo平台的主要优点在于其丰富的素材库和用户友好的合成工具,能够帮助设计师和插画师快速实现创意想法,提高工作效率。

  笔魂AI绘画是一个专注于人工智能创作图片的网站,集聚了国内AI魔法师与炼丹师们,致力于打造AIGC的内容社区与商业化应用。该产品利用先进的AI技术,为用户带来创新的图片创作体验,同时提供丰富的创意社区交流平台,促进创意分享与合作。

  Vitamin AI是一款利用人工智能提升公司生产力的平台,它通过集中信息、加速沟通、高效协助客户以及快速创建内容,彻底革新了公司的生产力。它提供了一系列专为商业需求设计的AI工具,包括社交媒体自动化、问答聊天、客户聊天机器人、内容生成器、博客文章生成器和音频转文字等。Vitamin AI专注于您的数据,提供对您业务更相关和准确的见解和输出,同时优先考虑敏感数据的保密性和安全性。

  L402是一个开放协议,基于HTTP 402 Payment Required状态代码和闪电网络实现互联网原生的付费墙。它为API货币化和数字服务提供了即时、低成本的交易,通过微支付、按使用付费和细粒度访问控制模型,解锁了新的收入流。L402的开放协议鼓励创新和跨行业的广泛采用,促进了一个充满活力的应用和服务生态系统的发展。

  Fast Sites with AI Translations是一个静态网站构建工具,它使用i18next进行多语言翻译,并且包含自定义语言切换器。该工具还包含站点Map生成器和robots.txt生成器,内置HTML验证功能。它可以帮助用户从单一语言扩展到20多种语言,通过调整URLs和生成多语言链接的站点Map,使搜索引擎能够轻松找到内容。作为静态网站生成器,输出文件非常小,加载速度快,安全性高。

  creaition是一个利用先进AI技术,通过全视觉工作流程,让用户轻松创建令人惊叹的设计对象的平台。它提供了基础版Lite的免费试用,让用户体验无缝的设计创造过程。该平台通过训练定制的AI模型,融合品牌精髓,生成与现有产品组合无缝集成的无数新设计。

  伏羲AIPPT是一款集成了AI技术的产品,能够一键生成PPT、思维导图、专业写作和学术论文。它利用先进的人工智能算法,帮助用户快速完成文档的创建和编辑工作,极大地提高了工作效率。产品支持PHP语言和MYSQL数据库,提供了定制化的服务,但不支持开源和二次开发。产品原价1980元,现价1380元,提供一年的免费系统升级服务。

  Venngage Muse是一个AI驱动的设计平台,提供多种设计模板和工具,帮助用户节省设计时间,提高工作效率。平台通过AI技术,自动生成和编辑设计,同时提供协作工具,支持团队成员共同完成设计项目。Venngage Muse的主要优点包括:直观的用户界面、AI辅助的文本编辑和设计建议、自动品牌化工具、AI生成图像描述和背景移除功能,以及符合Web内容无障碍指南的可访问性检查。

  StudyRecon是一款旨在简化和协助研究过程中文献综述的智能工具。它通过提供学术景观的全景视图、查询建议、跨数据库搜索、关键词可视化、论文摘要和注释等功能,帮助用户快速获取全面准确的文献资料,从而提高文献综述的质量与效率。

  xLAM是一个由Salesforce AI Research团队开发的基于大型语言模型(Large Language Models, LLMs)的智能代理研究项目。它通过聚合来自不同环境的智能代理轨迹,标准化并统一这些轨迹到一致的格式,以创建一个优化的通用数据加载器,专门用于智能代理的训练。xLAM-v0.1-r是此模型系列的0.1版本,专为研究目的设计,与VLLM和FastChat平台兼容。

  Rapport是一个提供创建、动画化并部署情感智能角色的平台,旨在通过虚拟交互个性(VIPs)丰富与受众的对话体验。它结合了最新的AI技术与面部动画技术,支持任何语言的准确唇形同步,并且可以创建逼真或风格化的角色。Rapport的背景信息包括其在游戏面部动画和中间件领域的行业知识,以及其在GTMF 2024年会上的参与。

  文心智能体平台 AgentBuilder 是基于文心大模型的智能体平台,支持开发者根据行业领域和应用场景,选择不同开发方式打造智能体。其主要优点包括低成本开发、流量分发路径支持,为用户提供完整的产品开发闭环。

  tabOS是一个浏览器扩展,将新标签页转化为个性化桌面,帮助用户管理标签页,创建标签组,快速保存信息,使用AI聊天助手,记录笔记,保存图片和RSS订阅。它强调了端到端加密、每日备份和随时可访问的安全性,以及通过拖放、搜索和右键菜单等操作的便捷性。




上一篇:《风从何处来》微纪录片上线挖掘传统文化的传承与创新   下一篇:苏锡常宁等地多个P+R停车场投入运营