本文作者:xinfeng335

计算机行业周报:AI发展再遇算力短缺

xinfeng335 2023-11-19 63
计算机行业周报:AI发展再遇算力短缺摘要:   OpenAI 新服务涌现,AIGC 再遇算力短缺。1)11 月6 日OpenAI 举办首届开发者大会,显著提升大模型在图像和文档上的处理能力,且新的基础模型GPT4 Turbo...
  OpenAI 新服务涌现,AIGC 再遇算力短缺。1)11 月6 日OpenAI 举办首届开发者大会,显著提升大模型在图像和文档上的处理能力,且新的基础模型GPT4 Turbo成本更低、功能更强大。更值得关注的是,GPTs 作为ChatGPT 的自定义版本,极大降低了AI 应用的开发门槛,截至2023 年11 月18 日,第三方网站gptstore.ai上已经收集了12,967 个共享GPTs,数量呈井喷式增长。2)OpenAI 推出的一系列新服务受欢迎程度超预期,另外叠加DDoS 攻击,太平洋时间11 月6 日至8 日,ChatGPT 服务器间歇性出现大范围宕机,用户访问会收到“ChatGPT 目前已满载(ChatGPT is at capacity right now)”的消息。11 月15 日,OpenAI 彼时首席执行官Sam altman 在平台上表示,将暂停新的ChatGPT Plus 注册,开发日后使用量的激增超出了其承受能力,希望确保每个人都有良好的体验。3)这并不是OpenAI首次受制于算力瓶颈,2023 年初至10 月,ChatGPT 已出现6 次宕机、API 亦出现7 次宕机,我们认为,算力是AIGC 发展的基础土壤,也是AIGC 目前训练和推广的重要瓶颈之一,芯片、服务器、算力租赁、光模块等厂商有望核心受益。  多模态训练缺口仍大,推理进一步提振算力需求。1)ChatGPT 的推出意味着生成式人工智能已突破技术奇点,互联网公司、云计算提供商和企业客户都迫切希望将生成式AI 应用到自身业务中,AIGC 或引爆新一轮智算需求。2)在训练端,根据GPU Utils 报道,GPT3.5 同级别模型需要数千张H100、GPT4 或对应数万张A100、GPT5 或对应数万张H100,模型训练对大规模算力集群的需求呈现刚性;在推理端,仅考虑文字问答场景,根据百度智能云、科创板日报、快科技、英伟达等报道,我们估算,大约需要数万张H100、对应算力投入数十亿美元;而多模态或有更多提升。  信创战略坚定不移,华为系、海光系加速追赶。1)根据央视网报道,2023 年10月17 日,美方发布了对华半导体出口管制最终规则,在去年10 月7 日出台的临时规则基础上,进一步加严对人工智能相关芯片、半导体制造设备的对华出口限制,并将多家中国实体增列入出口管制“实体清单”。外部环境复杂化程度加深,自主进程已成为产业共识。2)相应地,2022 年1 月15 日,求是网刊登总书记《不断做强做优做大我国数字经济》文章,强调加强关键核心技术攻关,尽快实现高水平自立自强;2023 年10 月19 日,上海提到将打造超大规模自主可控智能算力基础设施,争取形成支撑万亿级参数大模型训练的国产智算能力。3)海光系:  产品迭代加速,国产算力之光。产品上,海光三号实测性能较上一代提升约45%,海光四号、五号研发进展顺利,深算二号于2023Q3 发布并商用,性能较前代翻倍;生态上,深算兼容“CUDA”生态优势明显,与主流大模型厂商适配良好;业绩上,公司23Q3 业绩快速增长,利润率提升反映产品力。4)华为系:
计算机行业周报:AI发展再遇算力短缺
(图片来源网络,侵删)
文章版权及转载声明

作者:xinfeng335本文地址:http://www.hkdumashi.com/post/133.html发布于 2023-11-19
文章转载或复制请以超链接形式并注明出处

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享