恢复备份
导出
导入
更新
清空
关闭
More
保存
重做
撤销
预览
开始
框架
模块
您可以通过导出进行模板备份
我知道了
添加框架
添加模块
100%框架
1:1
1:2
2:1
1:3
3:1
1:1:1
tab框架
关闭
当前为
简洁模式
,您可以更新模块,修改模块属性和数据,要使用完整的拖拽功能,
请点击进入高级模式
广告合作
招聘广告
社区广告
博牛APP
博牛QA
在线客服
官网人员验证
门户首页
博牛论坛
新闻中心
东南亚新闻
国际新闻
产业新闻
讨论广场
综合讨论
黑点曝光
求助问答
灌水闲聊
生活服务
房屋租售
商品交易
外卖点餐
畅游世界
美食之旅
博牛招聘
求职招聘
招聘专区
求职专区
产业中心
免费广告
全球展会
娱乐大厅
每日签到
金鲤耀博
俄罗斯方块
解谜乐园
趣味竞猜
站务公告
公告专栏
版主专区
建议投诉
登录/
注册
博牛社区
›
讨论广场
›
综合讨论
电梯直达
»
返回列表
我要做个渣男
版主
当前积分:92569
帖子
10674
新博币
18859
提现
提现
0
元
TA的勋章:
勋章中心
展开更多
收起
发表于 2023-2-14 12:24:15
1542
1
|
显示全部楼层
|
倒序浏览
楼主
随着以ChatGPT为代表的生成式AI兴起,其背后以大模型为基础的人工智能成为业界投入的方向。
所谓“大模型”,通常是在无标注的大数据集上,采用自监督学习的方法进行训练。之后在其他场景的应用中,开发者只需要对模型进行微调,或采用少量数据进行二次训练,就可以满足新应用场景的需要。
据腾讯研究院,当前的人工智能大多是针对特定的场景应用进行训练,生成的模型难以迁移到其他应用,属于“小模型”的范畴。整个过程不仅需要大量的手工调参,还需要给机器喂养海量的标注数据,这拉低了人工智能的研发效率,且成本较高。
相比之下,大模型的改进可以使所有的下游小模型受益,大幅提升人工智能的使用场景和研发效率。
同时,在大模型的框架下,ChatGPT所使用的GPT模型,每一代参数量均高速扩张,预训练的数据量需求和成本亦快速提升。
国盛证券计算机分析师刘高畅、杨然在发表于2月12日的报告《Chatgpt 需要多少算力》中估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM模型,训练成本介于200万美元至1200万美元之间。这一成本于全球科技大企业而言并不便宜,但尚在可接受范围内。
初始投入近十亿美元,单日电费数万美元
国盛证券估算,今年1月平均每天约有1300万独立访客使用ChatGPT,对应芯片需求为3万多片英伟达A100GPU,初始投入成本约为8亿美元,每日电费在5万美元左右:
1)计算假设:
英伟达A100:根据OneFlow报道,目前,NVIDIAA100是AWS最具成本效益的GPU选择。
英伟达DGXA100服务器:单机搭载8片A100GPU,AI算力性能约为5PetaFLOP/s,单机最大功率约为6.5kw,售价约为19.9万美元/台。
标准机柜:19英寸、42U。单个DGXA100服务器尺寸约为6U,则标准机柜可放下约7个DGXA100服务器。则,单个标准机柜的成本为140万美元、56个A100GPU、算力性能为35PetaFLOP/s、最大功率45.5kw。
2)芯片需求量:
每日咨询量:根据Similarweb数据,截至2023年1月底,chat.openai.com网站(即ChatGPT官网)在2023/1/27-2023/2/3这一周吸引的每日访客数量高达2500万。假设以目前的稳定状态,每日每用户提问约10个问题,则每日约有2.5亿次咨询量。
A100运行小时:假设每个问题平均30字,单个字在A100GPU上约消耗350ms,则一天共需消耗729,167个A100GPU运行小时。
A100需求量:对应每天需要729,167/24=30,382片英伟达A100GPU同时计算,才可满足当前ChatGPT的访问量。
3)运行成本:
初始算力投入:以前述英伟达DGXA100为基础,需要30,382/8=3,798台服务器,对应3,798/7=542个机柜。则,为满足ChatGPT当前千万级用户的咨询量,初始算力投入成本约为542*140=7.59亿美元。
每月电费:用电量而言,542*45.5kw*24h=591,864kwh/日。参考HashrateIndex统计,我们假设美国平均工业电价约为0.08美元/kwh。则,每日电费约为2,369,640*0.08=4.7万美元/日。
训练成本:公有云下,单次百万至千万美元
国盛证券基于参数数量和token数量估算,GPT-3训练一次的成本约为140万美元;对于一些更大的LLM模型采用同样的计算公式,训练成本介于200万美元至1200万美元之间:
1)基于参数数量和token数量,根据OneFlow估算,GPT-3训练一次的成本约为139.8万美元:每个token的训练成本通常约为6N(而推理成本约为2N),其中N是LLM的参数数量;假设在训练过程中,模型的FLOPS利用率为46.2%,与在TPUv4芯片上进行训练的PaLM模型(拥有5400亿参数)一致。
2)对于一些更大的LLM模型(如拥有2800亿参数的Gopher和拥有5400亿参数的PaLM),采用同样的计算公式,可得出,训练成本介于200万美元至1200万美元之间。
国盛证券认为,在公有云上,对于以谷歌等全球科技大企业而言,百万至千万美元级别的训练成本并不便宜,但尚在可接受范围内、并非昂贵。
个人签名
收藏
0
回复
东南亚最大的华人电报群,点击加入 https://t.me/boniush365
相关帖子
企业鼓励员工谈恋爱 脱单3个月获奖励
绑架RCBC知名公司员工 菲律宾李娜绑架团伙再次作案
起重机吊钩甩落 他连带摩哆一起被砸飞
Telegram免簽封裝無跳轉無網址顯示還原原生APP機器人..
技术/职能/远程 ,马来,泰国,迪拜,多地点直招✈️@RZCX99
flutter 开发 iOS 安卓 Java 测试 棋牌 UI 原画 动效
Relax Gaming 推出 Winter Champions 赛事
客服/质检/运营/技术1122
我要做个渣男
版主
当前积分:92569
帖子
10674
新博币
18859
提现
提现
0
元
TA的勋章:
勋章中心
展开更多
收起
发表于 2023-2-14 12:24:28
沙发
大模型训练一次200-1200万美元
个人签名
回复
点赞
反对
返回列表
获取博牛招聘专属权益 >>
赚博币,当钱花 >>
点击按钮快速添加回复内容:
支持
高兴
激动
给力
加油
淡定
生气
回帖
路过
感动
感恩
恭喜您已经成功添加了回复内容!
返回重选
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
劳力士
任务勋章:连续签到奖励
到计时
任务勋章:连续签到奖励
新年快乐
版主勋章
新年快乐
活动勋章
妇女节
活动勋章
劳动节
活动勋章
劳动节
活动勋章
端午节
版主勋章
端午节
活动勋章
端午节
活动勋章
儿童节
活动勋章
七夕节
活动勋章
中秋节
活动勋章
中秋节
活动勋章
中秋节
活动勋章
圣诞节
活动勋章
干物妹:小埋
定价勋章
罗小黑战记
定价勋章
奇奇冒险日记
定价勋章
熊本熊I
定价勋章
关闭
博牛推荐
/2
金鲤耀博:财富捕手
您发现了吗? 在论坛帖子的各个角落捕捉到象征着幸运与财富的 金色鲤鱼!金鲤将为您带来丰厚的博币奖励,让您的财富瞬间倍增!
查看 »
经典俄罗斯方块
无论你是在电脑前,还是手握手机,都能随时随地享受经典俄罗斯方块带来的乐趣!让大家在休闲的同时,争夺最高分,赢取丰厚奖励!
查看 »
快速回复
返回顶部
返回列表