恢复备份
导出
导入
更新
清空
关闭
More
保存
重做
撤销
预览
开始
框架
模块
您可以通过导出进行模板备份
我知道了
添加框架
添加模块
100%框架
1:1
1:2
2:1
1:3
3:1
1:1:1
tab框架
关闭
当前为
简洁模式
,您可以更新模块,修改模块属性和数据,要使用完整的拖拽功能,
请点击进入高级模式
广告合作
招聘广告
社区广告
博牛APP
博牛QA
在线客服
门户首页
博牛论坛
新闻中心
东南亚新闻
国际新闻
产业新闻
讨论广场
综合讨论
黑点曝光
求助问答
灌水闲聊
生活服务
商品交易
房屋租售
外卖点餐
畅游世界
美食之旅
博牛招聘
求职招聘
招聘专区
求职专区
产业中心
免费广告
全球展会
娱乐大厅
每日签到
金鲤耀博
俄罗斯方块
解谜乐园
趣味竞猜
站务公告
公告专栏
建议投诉
版主招募
登录/
注册
重播
博牛社区
›
讨论广场
›
综合讨论
电梯直达
»
返回列表
我要做个渣男
版主
当前积分:91887
帖子
10608
新博币
18240
提现
提现
0
元
TA的勋章:
勋章中心
发表于 2024-8-14 23:33:36
5166
2
|
显示全部楼层
|
倒序浏览
楼主
你有没有想过,当你在网上进行简单的验证码操作时,其实你已经无意间成为了一名“标注民工”?
昨天晚上,我在登录QQ邮箱和LOL官网的时候。
发现腾讯的验证码变了。
不再是之前的验证码了,而是变成了一段Prompt加六张AI生成的图。
右下角赫然写着:
图片由混元AI生成。
腾讯,终于把用验证码做标注的手,伸向了他那12亿的用户。
拿验证码当标注系统,让用户免费标注,其实在远古时代,就已经不是什么新鲜事了,但是用生成式AI来跟验证码做结合,这确实还是我,所看的头一回。
先说说验证码这个东西。
这玩意从最开始发明起,其实只有一个目的,就是为了区分机器和人。
简称“CAPTCHA”,全称就贼长了,“Completely Automated Public Turing Test to Tell Computers and Humans Apart”
翻译过来是,“全自动区分计算机和人类的图灵测试”。
你看看,图灵测试。
刚开始,有个斯坦福公益验证码系统,reCAPTCHA。
它最成名的项目,就是用验证码来数字化海量的书籍和旧报纸。那时候的Ocr真的不咋地,而且很多年前的书和报纸那糊的真的差强人意。
当时,reCAPTCHA系统会向用户在验证码上,展示两组扭曲的单词,其中前面的一组是计算机已经识别的,另一个是计算机难以识别的。
如果用户正确输入前半部分,那么 reCAPTCHA就会假设用户输入的后半部分也是正确的,然后把录入结果返回至reCAPTCHA的项目主机。
结果返回主机后,主机还会把这个结果再派发给多个用户进行交叉验证,以确保没有不小心或故意输错单词的情况。
他们用这个系统,在十几年里,数字化了几千万的书籍和报纸。
本来一切都挺美好的,然后,Google下场了,他们把reCAPTCHA给收了。
没过多久,就让用户开始识别,google街景中,那些难以识别的门牌号了。。。
这其实,就是明晃晃的让你当标注民工,无偿来给google标注训模型了。
google那时候几亿用户,每天验证码会被调用上千万次。
这大概就好像,让几百万个人每人为给你干5秒钟活儿,然后一分钱都不给一样,你说这是不是已经,把白嫖玩到极致了。
直到后面,离谱的东西越来越多,你要标注的东西,也越来越多。
比如这些奇奇怪怪非人视角让你选一个bus的照片。
当然最离谱最好玩的,得数15年的12306,当时开脚本抢票的太多,12306的流量压力实在太大,被逼的开启了神迹级的验证码,据说人类首次正确率仅为8%,得错3次以上的人占比有65%。
这种逆天验证码的题目是这样的。
刘慈欣我不敢打包票,但是范伟我是全认出来了。。
时间走走停停,一眨眼,来到了2024年。
为了自己家的混元大模型,腾讯也把手,伸向了验证码。
让我们开始,来做AI绘图大模型的标注了。
这部分的标注,其实不是啥图片美学质量的标注,而是对于图片理解和映射的标注。
通俗地讲,就是语义理解。
现在做的,还是最基础最简单的分类,我们标起来,还是挺轻松的。毕竟里面都知道,左上角是鸭子,中间是老虎,左下角是蜜蜂,右下角是赛车。
而那两张白杨树林,其实,你选任意一个,或者选两个,都能过。
比如我这个图:一簇在悬挂花盆在生长的多肉。
其实你会看到有两张都跟多肉有关,而根据定语,一簇,更符合左上角第一张图,右上角那个其实不是一簇是一堆,但是我选了他,依然能过。
而你想把两个都选,你也都能过。
所以这个标注之心啊,一点都不藏着掖着。
但是确实这个做法很有用,比如还是这句Prompt,真正核心难点是一簇。
用这种方式,对整体的语义理解,确实有非常大的帮助。
而且现在明显还是初期,给的prompt和图,都非常的简单,标注的难度也不高,甚至一些大厂的标注模型直接机标可能都应付的过来。
但是如果下一次,是“一只在清朝宫殿里生长的杜鹃花”呢?
一只、清朝宫殿、杜鹃花。难度直接拉满。
甚至另外几个选项给你的也不是差异这么大的动物汽车啥的,给你的都是菊花、杜鹃花、喇叭花、玫瑰花,来吧你就选吧,加油啊标注民工。
要知道,标注真的很贵的,之前跟国内一家做AI绘图大模型的公司聊过,才知道他们标注分为机标和人标,而人标的成本,大概是数据量的十分之一。
也就是你拿出去3000万的数据,人工标一次,就得300万RMB干出去。
而腾讯12亿用户,每天验证码起码也是千万的量级,这标注费用,你可以算算这省了多少钱吧。
所以说,大厂在如今还在大数据的时代,优势是真的大。。。
不过这种标注,目前来看还是只能解决语义理解的标注,但是能把这个解决也已经很牛逼了,虽然美学一般,但是语义理解能达到极强,这就是妥妥的国内版Dalle3。
而Dalle3的短板大家肯定也清楚,实在太丑了。
而要标美学表现,难度其实就大很多,真的得找懂设计、懂美学的人来标注。
Midjourney当年其实就是吃了这波红利。
第一波获得用户,而且获得的还是一大波的有美学背景的专业用户,然后每次你生图的时候给你生成4张图拼一块的一张整图,你还必须选一张你觉得最好的进行提取或优化。
这就是一种强行的数据标注。
所以Midjourney在如今的美学表现上一骑绝尘,是因为他们在美学的标注上,做的太好了,而别的家想在这块赶上,基本不可能,因为最高质量的那波用户,基本已经全在Midjourney那了。
而腾讯未来想做这件事,其实在我看来,还真是有可能的。
因为你其实看Midjourney的路径,核心点就一个:海量的专业用户。
腾讯缺专业用户吗,怎么可能会缺,12亿用户捏在手上,用户画像做的那么齐全,我想把有设计师背景的用户挑出来,难吗?一点都不难。
我想给挑出来的这些设计师背景的用户推送美学标注的验证码,难吗?也不难。
所以啊,现在在我看来,腾讯的验证码标注,才刚刚向前迈了半步,后面的模型空间,还很大。
唯一问题就是,腾讯内部有点封闭,用户画像数据PCG做QQ的那边肯定有,但是混元跟PCG不是一个事业群,也不知道能不能拿得到。。。
能拿到的话,那就是王炸。
但是不管怎样。
你我都已经,身在其中了。
10年前,就已经是了。
个人签名
收藏
0
回复
东南亚最大的华人电报群,点击加入 https://t.me/boniush365
相关帖子
招台湾籍远程Java后端,flutter……
稳定企业签名-自动企业签名服务平台API接口24小时自动补签.
最新!普京签署,事关俄朝!俄方表态:愿意听取特朗普...
世博集团招聘 色站项目 1025
❤️【直招】特助|行政|運營|客服|电销|推广110906
全国助贷款数据咨询飞机:@GG56555
全球短信:游戏/棋牌/交友/股民 w18充值
蓝色星星平底鞋
我要做个渣男
版主
当前积分:91887
帖子
10608
新博币
18240
提现
提现
0
元
TA的勋章:
勋章中心
发表于 2024-8-14 23:33:46
沙发
都变成免费的“标注民工”
个人签名
回复
点赞
反对
linda0102
LV8 深海的明珠
LV8 深海的明珠,当前积分10116,距离下一等级还需3884积分
如何获得积分?
帖子
97
新博币
0
提现
提现
0
元
TA的勋章:
勋章中心
发表于 2024-8-21 20:34:52
板凳
个人签名
回复
点赞
反对
返回列表
获取博牛招聘专属权益 >>
赚博币,当钱花 >>
点击按钮快速添加回复内容:
支持
高兴
激动
给力
加油
淡定
生气
回帖
路过
感动
感恩
恭喜您已经成功添加了回复内容!
返回重选
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
劳力士
任务勋章:连续签到奖励
到计时
任务勋章:连续签到奖励
新年快乐
版主勋章
新年快乐
活动勋章
妇女节
活动勋章
劳动节
活动勋章
劳动节
活动勋章
端午节
版主勋章
端午节
活动勋章
端午节
活动勋章
儿童节
活动勋章
七夕节
活动勋章
中秋节
活动勋章
中秋节
活动勋章
中秋节
活动勋章
圣诞节
活动勋章
干物妹:小埋
定价勋章
罗小黑战记
定价勋章
奇奇冒险日记
定价勋章
熊本熊I
定价勋章
国庆节
活动勋章
中秋节
活动勋章
端午节
活动勋章
最佳答案
特殊勋章
关闭
博牛推荐
/2
金鲤耀博:财富捕手
您发现了吗? 在论坛帖子的各个角落捕捉到象征着幸运与财富的 金色鲤鱼!金鲤将为您带来丰厚的博币奖励,让您的财富瞬间倍增!
查看 »
经典俄罗斯方块
无论你是在电脑前,还是手握手机,都能随时随地享受经典俄罗斯方块带来的乐趣!让大家在休闲的同时,争夺最高分,赢取丰厚奖励!
查看 »
快速回复
返回顶部
返回列表