第105章 全面布局
离开密西沙加校区的时候,林志凌依然觉得心里堵得有些感慨。
“为什么这些人在多伦多那么好的学术氛围里,却无法发挥出他们最大的价值呢?”
顾诚对此倒是毫不感慨,显然早已没心没肺:“科学是很严谨的东西。如果你得了癌症,科学已经宣判了你的死刑,现在有一种吃了之后有10%概率懵对救命、但是生效机理不明的药,你吃还是不吃?造这种药赚钱的生意你做还是不做?
要想拿图灵奖,这种生意就不能沾,这种研发就不能做。如果只是要钱,要实用,就无所谓。我这辈子从来没想过拥抱科学,我最多只是利用科学。但是如果某个具体问题上科学还没巫术好使,我就用巫术好了。”
史蒂芬.库克是个伟人,但是跟顾诚混的圈子不相交。
所以顾诚只能尊重对方的人品,但是道不同不相为谋,然后尽量从他手下挖走那些三观还没定型、“节操”没那么满满的学者。
只要肯用名换钱,顾诚就有希望挖到。
他在多伦多滞留了两天,好让杰夫.辛顿有更多时间做手下人的思想工作。
一切都很顺利,事情完全向着顾诚预想的方向进展着。面对巨额的研究经费和薪水,乃至未来可能的基础分红,和其他媒体渠道的出名机会,最终战胜了对学术上拿奖拿影响因子的欲-望。
除了杰夫辛顿这个研究“深度学习算法”的流派之外,史蒂芬.库克麾下其他几个技术路线的教授也略有松动,至少被顾诚挖走了两个副教授和一堆博士研究生。
顾诚要的,就是这种效果。“跟着顾诚混,就算上不了核心期刊,照样可以在别的严肃媒体渠道出名,用另一种方式被世人记住”。
第一步总是很艰难的,一旦这种念头在脑子灵活的基础科研能人心中扎根,顾诚的雪球就会越滚越大。
为了完成这一切,顾诚也初步开出去了足足三千万美元的支票,给他新注册的空壳研究所和基金会注资。
这笔钱几乎相当于“传奇”一个季度的毛利,而且目前这个机构还只能设在米国——顾诚试探着问过杰夫.辛顿,“如果让大家去华夏工作,并且加钱,有多少人愿意走”,但结果是愿意跟着他跑的人数至少会降低三分之二。
华夏如今给白人的印象,还是太不透明了,要是再过个五年十年,情况绝对会倒过来。
所以顾诚决定目前还是先在米国设立一个研究机构,以及YY网络科技的子公司,过个两三年等他盘面更大了,再从长计议把核心研发人员挪去华夏。
……
“深度学习算法”是未来人工智能的鼻祖,虽然不是其唯一实现路径,却为人类开启了一条“让机器慢慢根据数据标识自我修正”的思路。
历史上,这一技术最初的应用场景,其实是谷歌的图片搜索引擎,和FACEBOOK的人脸识别技术。
在此之前,谷歌搜索只能搜文字信息,却没法搜图片——
别看百度和谷歌都很早就开放了“百度图片”之类的功能,但是最初的“百度图片”并不是根据图片的内容来决定搜索结果的,而是靠该图片所属的网页链接的文字标题来搜的。
所以09年以前的“百度图片”功能,其实并不是真正“读懂”了图的内容。只不过外行用户只看疗效,所以并没有在这段还算平滑的技术过渡中察觉出什么异常,还以为后来的“百度图片”识图率“自然而然”就提高了。
只有基于深度学习为代表的新一代人工智能真正应用之后,人类才学会了让机器直接读图本身。
不过,这个应用场景虽然很宏大,却跟顾诚的生意没什么关系。那是需要百度李老板和阿狸马风去操心的。李老板将来或许可以做图片搜索,马风则可以做淘宝找同款。顾诚最多在合适的时机提点一下、换取自己的好处,却不会亲自下场。
深度学习型人工智能的第二个应用场景、也就是平行时空FACEBOOK的人脸识别,则是和顾诚眼下的生意非常契合的。
如今,扎克伯格还不是一个胸怀大志的家伙,他只想着在哈佛女生当中扬名立万,被无数人崇拜,混进最顶级的豪门俱乐部。所以十有八九会被顾诚劝诱至麾下。顾诚也不打算另搞FACEBOOK了,而是准备直接在海外运营“YY网”。
考虑到墙的因素,以及墙里墙外的内容差异,到时候国内那部分就把英文的“YY网”倒过来,改叫“人人网”好了。
名字不重要,反正两者最后都会是基于YY的朋友圈类空间产品。
国内腾云那边,马腾如今正在做QQ空间,而且腾云的资金链比较紧张。等QQ空间误入歧途之后,顾诚再公布自己的开发计划教做人也来得及。
按照这个计划,顾诚估计他回国后全面推进“YY网”和“人人网”的开发计划、四季度十一黄金周前后上线网站,基本上就可以卡住几个关键时间点。
除了历史上FACEBOOK和谷歌已经干过的事情之外,“深度学习”在顾诚手中自然还有他独到的用处,那就是“用户偏好分析”。
这事儿在平行时空的起步,比前两项应用要晚得多,但顾诚深知那并不是这件事情技术上比前两项难多少,而是因为平行时空最初接触深度学习型人工智能的巨头们,统统都没有涉猎娱乐/内容产业。
换言之,如果第一批接触深度学习人工智能的换成亚马逊公司,“用户偏好分析和推送”肯定会变成第一优先级的存在。
顾诚的生意,和亚马逊的重合度非常高,而且他是个知其然知其所以然的人,当然不会放过这一领域的布局。
只是这块工作量比较大,一方面要堆叠算法,另一方面也要让把目前市面上已有的大量文娱作品进行标签化分类和数据标识、将来再长年累月一步步细化细分数据表示。
按照最乐观的估计,“用户偏好分析和推送”至少要在实验室里躺两三年,才能谈试运营的问题。
幸好顾诚钱多,做得起这种长线投资。
……
在多伦多盘桓了三四天,挖够了人之后,顾诚就准备驱车回波士顿,了结一下跟扎克伯格的赌约。
然而算算日子,跟扎克伯格的一周之约还没到期,顾诚只好先去纽约休假两三天。
以他这么忙的身份,就算在纽约也不会很闲,至少也要电话遥控一下生意。
这不,他人还在多伦多的时候,就把公司的准CFO柳倩从纽约发配去了旧金山,让她在硅谷投资一块办公楼地皮,在那儿注册一间YY子公司、同时留心一家成立还不到两年的初创公司,尝试一下收购。
被顾诚盯上的这家公司,便是后来在05年拿出了世界三大物理运算引擎PhysX的AGEIA公司。这家公司历史上应该于08年被英伟达(NVIDIA)收购,后来成就了英伟达的完全体GPU大业。
顾诚要搞深度学习型人工智能,要搞卷积神经网络,挖一家这样的公司就非常有必要。
就如前几天顾诚和史蒂芬.库克教授谈到的那样,任何“神经网络”和传统计算机网络最大的区别,是“没有中枢,每个神经元节点完全平等,彻底云分布”。
所以在执行“神经网络”相应的运算时,人类传统的电脑CPU效率其实并不是很高,无论英特尔还是AMD。
因为稍微懂点计算机常识的人都知道,CPU是“时分占用”的计算硬件,通俗的说,一个4G主频的CPU,只是一秒钟能够运算40亿次,但每一瞬间依然只能计算一次,WINDOWS的“多任务处理系统”,本质上只是“把CPU的时间占用细分,每个后台程序在每一秒里占用那么几微妙”来实现的。
比如一个人打CS游戏的时候,后台开了个QQ。运行QQ需要占用“每秒1亿次运算”的CPU处理资源,那么实质就是“4G主频的CPU每秒分出25毫秒处理QQ”,而不是物理意义上的“同时处理CS和QQ”。
这种只能单核运算的模式,注定了不适合未来卷积神经网络越来越多的“并线操作”。所以06年当卷积神经网络的曙光出现之后,平行时空的英特尔公司也不是没有意识到这一点并且挣扎。只不过英特尔公司最初的挣扎方式是“开发多核CPU”。
这才有了后来人们熟知的“英特尔酷睿双核/四核”。
可惜历史最终证明,CPU再多核,要满足浩如烟海的并线操作,也是杯水车薪。
要彻底满足神经网络的并线胃口,还是得靠最初作为显卡物理运算用的GPU。
这才有了后来人工智能在软件领域爆发后,倒逼硬件计算企业市值剧烈波动。做显卡GPU出身的英伟达公司,一下子在两年里股价市值跃升了十几倍,俨然对英特尔都形成了竞争。
用一句文科生都听得懂的话来解释这里面的区别:为什么所有的显卡都没有“双核/四核”概念?就是因为显卡GPU的每一个单元都是天然并行运算的。显卡处理电脑图像的时候,每一个像素都是单独同时处理的。没有了“时分占用”的瓶颈,导致GPU显然不像CPU那样需要多核。
(注:GTX-Titan系的显卡有些被称作“双核”,其实是商家的错误宣传,那些显卡的本质是“两块显卡”而不是“双核”。)
顾诚的打算,就是在英特尔还准备靠多核挣扎的时候,他直接一步到位看穿其中的大坑,直接跳到GPU一统天下的路数上去。
如今的AGEIA公司成立还不到两年,也没什么牛逼到爆的科技成果市场化。柳倩挥舞着顾诚的支票本出发,断无不利之理。
展开全部内容