马云爸爸之前说了这么一句话

  又是特别火:

  “30年前你错过广州

  20年前你错过杭州
现在不要再错过贵州”

  我去,贵州到底干了个啥

  成未来的发展宝地了呢?

  1.jpg

  热爱学习(发财)的我赶紧研究了一下

  这才发现 贵州竟然有几十万人给人工智能打过工!!

  这是啥概念呢

  据有关媒体报道全中国搞人工智能的人才

  总共也就五六万

  贵州难道要弯道超车成为中国的人工智能之都?

  1.jpg

  但其实……并不是这样,冷静一点,事实可能大大出乎你的意料

  事实的情况是

  像腾讯、华为这样的大企业数据中心不是在北京、不是在上海,而正是在经济相对不发达的——

  贵州

  马化腾说背后的理由是贵州山多水多空气凉爽有利于电脑主机冷却,适合放服务器,省电又省钱

  再直白点说,贵州的数据支持很便宜,数据标注更便宜

  所以贵州是许多互联网公司的云后端,大数据的来源地

  自然的,这里也就成了人工智能从业者的“打工圣地”

  “贵州”也因此被称为国务院钦定的大数据中心

  1.jpg

  提到人工智能从业者,你脑子里冒出来的可能是穿着条纹汗衫的程序猿

  但在贵州,并不是这样——

  贵州的人工智能打工者,叫做“数据标注员”是人工智能领域的最大隐形者

  也是人工智能时代的新型农民工,同时代指人工智能前面的“人工”——(手动滑稽)

  即“人工智能的搬砖工”

  啥?数据标注员?根本没听过啊,咋就跟人工智能扯上关系了??????

  1.jpg

 
这个数据标记员,确实一般人平时接触不到,他们的工作简单来说就是:给人工智能“打工”

  是的,很多人担心人工智能迟早要奴役人类,但现在,我们离那一天还很远

  只是,在贵州的这些AI工厂里,有时候你会有一丝错觉仿佛人类正在为人工智能服务

  这个“数据标记员”这还得从如今比较火爆,像谷歌、特斯拉、百度都在搞的无人驾驶技术说起

  1.jpg

  正如上图所示,安装上无人驾驶技术的车辆只需要你坐上来就可以自己动,跟成精了一样

  可认路、识灯、辨人,跟大石头一样没有生命的车

  是怎么做到的?这就得归功于人工智能的帮手:也就是数据标注员了

  1.jpg

  在距贵阳市 50公里的百鸟河数字小镇有500名学生 正在从事这份职业,而他们每天的工作内容

  就是画框

  1.jpg

  像框出图片里的十字路口、高架桥,隧道、城市道路等.据传有大神一天能框上千张

  啊?画个框就能做人工智能?虽然乍一听让人摸不着头脑,但它真的很重要!

  1.jpg

  其实就像让机器识别苹果,或者用美图秀秀识别人脸一样,机器本身并不认识苹果和人脸

  我们只有给机器足够多角度,不同类型的人脸或苹果,它们才能在自己的数据库里提取相似数据显示出正确答案即大家看到的“智能”技术所以数据标注员的“画框”正是在给机器提供大量“数据源”也就是教冷冰冰的机器认识这个世界

  1.jpg

  

大家可能发现了这种工作基本没有技术难度,人工智能数据标注员乍一听很高大上,但实际上

  这是一份只要会用鼠标就能干的工作

  工作量又大,现在年轻人,谁会愿意去干这个???

  1.jpg

  据业内人士报道

  中国的全职数据标注员已达到20万人,加上兼职人群规模已有100多万

  这其中有职高学生,有聋哑人,有从工地辗转而来的农民工并且在方言标注这一块,没上过学的老农

  可能比清华硕士标的更准

  1.jpg

  用29点法标注的人脸头像

  所以为了我们更便捷更放心地使用它们社会上需要足够多并且更多样的数据标注员来为人工智能服务

  那既然是个新兴工作需求量又大工资会不会相当之高啊!

  1.jpg

  然而就在贵州梦动科技有限公司,数据标注员的工资仅为4200元

  没有五险更没有一金,全国基本都是这个水平而贵州省的平均工资呢是5200

  如果是职校招的实习生2000块就可以打发,然而尽管他们收入微薄但他们的老板还嫌他们干的太少

  这里的项目经理胡定祥觉得自己的生意成本太高,于是又兼任了某职业技术学院的老师,这样他就可以把自己的学生贩卖到数据标注工厂里赚他们的血汗钱了

  500人的团队全职的可能只有十一二个

  “老师就是经理”

  “上课就是上班”

  可以,很强,很互联网!

  1.jpg

  中国的互联网公司选择在欠发达地区的贵州用低于当地平均工资数倍的薪水利诱在校学生替他们做数据标注,所以你可能会看到在这里2000块就能招到的实习生

  一面在北京五环上驱动着光鲜亮丽的无人汽车被交警开罚单一面回到家

  却连B站的大会员都买不起

  1.jpg

  但是,这算不算是压榨学生呢?学生们乐意吗?这个数据标注员听起来又苦又累工资又低,工作内容也不高级真有人心甘情愿做这个?而正在这里的学生小志却说“真的,我很珍惜这个接近‘白领’的兼职机会”小志口中的“白领”机会就是每个月拿1500元的工资.

小志还说这些钱完全足够自己经济独立甚至省点还能补贴家用相比餐厅辛苦端盘子顶着风雨送外卖,数据标注反而相对轻松又体面,自己在进职高之前连电脑都没碰过唯一会的操作就是按电脑开关键

后来玩上电脑,开始沉迷游戏严重的时候课都不去上  1.jpg

  为此老师找他谈了多次经过规劝引导才决定加入数据标注员现在既能玩电脑又有钱也算个好事吧

  而已经26岁的犇犇,算是数据标注员里的大佬了因为他的工资足足有四五千,之前他做过厨师,进过工厂

  直到2017年12月初有人邀请他做数据标注工作室,他才杀进了这个领域,犇犇说这里氛围挺好,他们一边标一边聊天,时间一点都不难熬

  就是吧……容易眼干眼涩,然后每月要还4700块的房贷

  一发工资,工资……

  Duang!就没了!

  1.jpg

  当然,与这些人更不一样的还是聋哑人小袁,他是少有的全职做数据标注员的人

  1.jpg

  左一为老师 右一位小袁

  他是一位换过40份工作的聋哑人之前在餐厅、奶粉厂打过工因为交流困难所以频频被辞退

  当然,被辞了40次的小袁,从没有说放弃直到她遇到了“数据标注员”才深刻地认识到自己是个有用的人.因为聋哑人只能靠眼睛生活,对视觉信号更敏感,所以他们标注得更快,精准度更高。

  小袁说很庆幸自己在人工智能领域成为了数据标注员从而找到了生活的意义

  1.jpg

  还有为这份工作而自豪的小吴

  他只有22岁刚做这份工作的时候差点没把眼睛看瞎了而他们与小伙伴之间也会互称“画框的”

  


  那时一个人一天要画几百个框,以至于后来走在路上看什么东西都想画个框把它框住。

  

  后来接到百度无人车的项目后他们从来不敢相信像这种高精尖的东西还能跟他们这些“画框的”  扯上关系不过当小吴看到自己接过项目里的无人驾驶汽车在美国的硅谷跑,在乌镇的世界互联网大会跑,他才激动地说道:“看,也许那就是我之前标注过的”

  那种感觉,就像一不小心踩到了时代潮流的浪尖上

  1.jpg

  连项目经理胡定祥都说,没有我们人工智能背后的人工,这个人工智能它永远都智能不起来

  人工智能的起点在小镇年轻人的指尖,它的背后是像小志、犇犇小袁、小吴这样的  几十万“农民工”

  1.jpg

  据相关从业者爆料一般数据标注的工作都会由上游人工智能公司交给中游的数据加工公司然后分包给下游小公司小作坊或者“散兵游勇”这些外包江湖门派众多,良莠不齐

  从业者之间都是这样打招呼:你是发包方还是外包方,经过这么多的层层转包,更进一步压低利润,最后把锅盖到数据标注员的头上,进一步造成了他们的“便宜”

  1.jpg

  转包、廉价、无技术

  社会下游人群,流水线、又苦又累,这种工作就好比上世纪80年代的来料加工

  大工厂可以,家庭作坊也可以,大家有没有意识到这挺有科技感的数据标注员不就跟建筑工人一模一样嘛???而做数据标注的人自己也调侃道,我们就是从父辈的建筑工地搬迁到了现在的智能工地

  1.jpg

  当然,在这片“智能工地”上不光有数据标注员,还有语音录播员,图片数据提供者,人工翻译同传人员 


  当用户问“世界上谁最美”,他就会回答“当然是你最美”。一问一答均由索琳事先写好,再由一家擅长语音识别的人工智能(AI)公司植入。

  

他们做着那些重复又枯燥的工作就是为了在你启动“AI”的时候可以生动有趣地与你对话让你更快地P图发朋友圈,帮助你理解外文书籍,让你近距离地感受“智能”

以前当我想到“人工智能从业者”的时候,我脑海里出现的都是高大上的计算机大牛,疯狂敲键盘码代码的场景。我没有想到人工智能技术的光鲜亮丽背后竟然有着这样一群默默付出的人。

说实话,不知道为什么,我的心情很复杂。

人工智能行业为我们的农民工兄弟提供了工作,这原本是一件大好事,但你如果换个角度一想——原本很多核心的计算工作、技术工作如今可以交给人工智能来完成,反过来,人类却去帮它们做那些最基础的辅助工作给它们的进化“打下手”

用如今流行的话来说是不是多少有些“智力降级”的感觉?

而人工智能的时代如果真的来到数据标注行业会不会用机器替代人工?

教无人车学会认路,教自己学会失业

深度学习技术突破可以自行数据标注了,  1.jpg也有数据公司高层认为商业竞争才是决定这部分人会不会取代的关键因素,每家公司都有自己的数据标注需求并且他们暂时不会公开自己的模型,就像在互联网之初,大家都不会开源自己的代码一样,可能到某个节点大家都公开自己的数据模型后,这部分人才会面对失业的担忧。

我想起福特汽车的创始人亨利·福特的话:“我雇的明明是两只手怎么却来了一个人?”

其实,无需同情数据标注这个行业,也不必担心人工智能是否有泡沫,你不必讶异更无须欢喜

在AI面前我们都是始作俑者,如同正在看这篇文章的你,不知道在微信后台已经被腾讯的AI打了多少个标签被苹果的“云上贵州”拉了多少个数据标注的红色框框,被数据堂卖了多少条信息了

  1.jpg

  别想了,真的,人间不值得。

http://dy.163.com/v2/article/detail/EE1BO9800512V004.html


知乎上面有人在问类似的问题:

互联网数据标注员是做什么的?有什么发展前途吗?


https://www.zhihu.com/question/30654399