Quantcast
Channel: 微软亚洲研究院
Viewing all 620 articles
Browse latest View live

微软自拍:让黑科技拯救不会拍照的你

$
0
0

你知道吗,不久前淘宝发布的消费数据报告显示,自拍杆的购买主力军居然是50-59岁的人群!无论你是否买过自拍杆,毫无疑问,如今自拍绝对不是只属于年轻人的娱乐。

图片来自互联网 

在把美美的自拍照晒到社交媒体之前,大部分人都有着不可缺少的一步,那就是利用修图软件对图片进行美化。目前市面上的图片美化软件种类繁多,操作方式也复杂百变,一不小心把自己P成“蛇精脸”的修图雷区也是让人防不胜防。社交媒体上出现的“你这么美,你妈妈知道吗?”就是形容修图软件操作不当而导致图片失真的情况。因此,一款操作简便,适应各种年龄层和多种使用场景的图片美化软件的出现十分必要。

微软最新推出的图片美化应用——微软自拍(Microsoft Selfie)就是这样一款智能的应用。它能够针对自拍照片中出现的所有人脸的年龄和性别进行差异化一键自动美颜。此外,微软自拍还能自动为你的照片降噪补光,无论光线环境如何复杂,都能拍出理想的照片。


自拍+美化,只需一键

如果要给微软自拍写一个使用攻略的话,那么它应该是这样的:1、打开微软自拍应用;2、对着镜头摆好表情;3、拍照;然后就没有然后了…… 因为微软自拍能够一键美化你的图片,在很短的时间内实现拍照+美化的全过程。之后保存你美美的照片分享到朋友圈,等着集赞吧~

但是,如果给微软自拍写一个技术流程的话, 那就复杂了……

算法自拍流程

当你打开微软自拍准备开始拍照时,该应用会主动感应周边的环境,如果光线过暗以至于拍照可能产生噪点,例如晚上的户外派对,酒吧等环境,它就会自动开启降噪模式,以确保最后生成的图片干净无噪点。

无论是通过微软自拍拍摄到的照片,还是从相册导入图片,它会在接下来不到1秒的时间内,对输入照片进行快速处理,主要包括自然美颜智能降噪曝光增强三个部分,对于无论是自拍照片,还是非人像照片(如风景、物体等),都能实现理想的照片美化效果。


自然美颜:

事实上,不同性别和不同年龄段的用户对自拍修图的要求差别很大。例如,一家三代同堂的合照,奶奶、母亲和女儿三代人的面部都被同样对待——修得同样光滑、毫无皱纹与瑕疵,那肯定不是我们希望看到的。男士也希望自己修图的效果能恰到好处的表现出男人的硬气和潇洒,而不是最后修出来的皮肤吹弹可破、嫩白细滑。

图片来自互联网

微软自拍的智能美颜功能在美化人像照片时,会自动识别图片中人像的年龄、性别、肤色和光照等因素,并基于此相应地消除用户不需要的皱纹、眼袋、雀斑、痘印等。但对于用户希望保留的体貌特征,如,头发、纹身、浓密的胡子等,或者面部出现的装饰物,如耳钉、鼻环、眼镜等,该应用则会尽量保持不变,最终使整个人脸美化效果更为自然。

这样,无论是单人自拍还是多人合照,一键自然美颜能让照片中的所有人拥有最合适自己的美颜效果!

如此简单通用的美颜操作,背后的技术可不简单。首先,系统要对照片进行JDA人脸检测(Face detection)(Joint Cascade Face Detection and Alignment ECCV 2014),检测出这张图片是否存在人脸,一共有多少张人脸,以及人脸出现在图片的什么地方。

随后,系统利用特征点检测技术分析每一张人脸的不同五官需要什么程度的美化。微软自拍采用的是微软亚洲研究院在2014CVPR大会上发表的论文:Face Alignment at 3000 FPS via Regressing Local Binary Features 中提出的68个人脸特征点检测方法。借用该方法,系统能够快速准确地检测出脸型和特征点。接下来,基于高层的智能方式,算法会对图片中的人脸进行信息提取,包括年龄和性别的判别(Blessing of Dimisionality: High Dimensional Feature and Its Efficient Compression for Face Verification CVPR 2013)。而这个技术也应用在了大家所熟知的How-old.net(微软颜龄机器人)上。

最后,该应用采用的“数字化洁面”算法会基于已经提取的面部信息对人脸进行美化处理。不同于市面上常常导致图片失真的美化算法,“数字化洁面”算法包括两个部分,一是基于大数据的脸部美化分析,研究员根据大数据的分析对不同的性别和年龄建立了不同的美化模型集,从而更有针对性地对不同人群的图像进行美化。二是应用新的图像处理算法,不同于传统通过低通或者双边滤波的方式,从而避免图片的美化出现失真,如阶梯形效应(Staircase effect)带来的卡通化,又能获得自适应的美化效果,即去除不想看到的皱纹、痘印等信号,但是保留纹身、首饰等重要信息,避免“千人一面”的问题。


智能降噪:

智能降噪功能是微软自拍的一项“独门绝技”,在开启摄像头时就会针对周围环境进行判断。如果所处的拍摄环境光线条件不甚理想,直接拍摄到的照片通常会带有很多噪点,清晰度也会受到影响。在此时微软自拍会自动开启降噪功能,通过快速拍摄多张照片,并对其进行处理,最终生成一张平滑降噪的照片。正如大家所知道的,照片成像的噪声水平受手机或照相机本身等硬件条件影响极大,但购买高级设备则花费巨大,而微软自拍采用数字化降噪功能所生成的图片效果完全可与单反相机(DSLR)在三脚架上采用低ISO长曝光时间的拍摄效果媲美,从而为智能手机用户在夜间拍摄到高质量的照片提供了更好的选择,真正做到“硬件不足软件补”。

与微软已发布的延时摄影应用Hyperlapse 相似,微软自拍在智能降噪功能的关键技术包括快速帧间对齐和多帧降噪技术。单张照片上的噪点是围绕平均值进行上下波动的,而如果把两张有噪点的图片进行叠加的话,就可以得出一张更为干净的图片。图片数量增多,照片中的噪点也会逐步下降。基于这样的原理,研究员提出了一个快速多帧降噪的方法,相关论文已在去年的SIGGRAPH Asia大会上发表(Fast Burst Images Denoising SIGGRAPH Asia 2014)。 

但针对拍照过程中的手抖现象,如果只是简单地把连拍的多张照片进行平均叠加的话,则会产生重影的效果。因此,研究员对帧和帧之间采用了相机模型估计的方法,不通过传感器而是完全通过数字化的帧间对齐方法进行处理。其次,当帧和帧对齐之后,因为场景中深度有所不同,一个微小的运动都会导致同一个像素点在不同帧对应的物体不一样,所以如果只是简单地做图片平均的话,还是有可能导致图片重影。所以,研究员采用的算法会甄别选取一致的像素点拿来做平均,这个平均不仅是发生在时间域上也会发生在空间域上,从而让该降噪算法对于无论是人脸照片还是非人脸照片都有着非常理想的效果。


曝光增强:

相信大家都碰到过想要拍摄的场景受限于角度、光线等问题从而导致逆光拍摄的情况,而微软自拍的自动曝光功能则能对照片进行针对性的区域曝光调整。例如一张逆光的照片,人脸和所有逆光的景物,相对比背景都显得十分暗淡。或者是面对阳光的照片,受光面十分耀眼,并且人脸难以获得自然的表情。这种情形下,对拍摄到的一张照片进行后期处理的话,传统修图应用通常会全局地调整画幅中的光线情况,即会出现前景拉亮的同时,整个背景光线过亮,甚至出现过曝的情况。

面对这种情况,微软自拍会自动对画幅中各区域进行曝光分析和调整。首先系统会自动检测背光情况,并对各区域提供最佳的局部曝光补偿,避免整体图片调整而导致图片过度曝光,并保证照片在能够看清逆光景物的同时保持照片的层次感(Automatic Exposure Correction of Consumer Photographs ECCV 2012)。

而针对风景照常见的薄雾情况,研究员还开发了去雾算法(Single Image Haze Removal using Dark Channel Prior CVPR 2009)。该算法能与曝光校正算法融合增强照片的清晰度,从而达到使用紫外线滤镜(UV)或圆偏振镜(CPL)的专业级照片效果。当然PM2.5爆表的时候还是老老实实待在室内或者带好口罩吧,就别拍照了……


轻应用,大技术

从雏形到应用,微软亚洲研究院视觉计算组为微软自拍全程提供了技术支持。视觉计算组的研究方向和专业涵盖了计算机视觉研究领域的整个范畴,主要包括人脸,图像编辑和计算摄影,图像识别和检测等方面。

针对人脸的研究包括人脸(特征点)检测,人脸识别,人脸的属性识别等等。该项研究成果已经在微软牛津计划的人脸识别APIFace API),Windows Hello刷脸开机,Kinect Identification身份验证开机和微软小冰等诸多与人脸有关的产品与服务中得到应用。

而在图像编辑和计算摄影方向,视觉计算组的研究主要为图像自动编辑和相机增强技术等等。今年12月,刚刚开放的微软牛津计划视频APIVideo API)中也有该研究方向的身影。此外,OfficeLensHyperlapse等用户达千万级的应用中也都可以看到视觉计算组在图像编辑上的研究成果。

在图像识别和检测方面,该研究组在图像内容的理解、识别、检测和分割等方面都取得了突破性的进展。不久前,在全球顶尖高校和科研机构举办的2015 ImageNet计算机视觉识别挑战赛中,该组的研究员们凭借深层神经网络技术的最新突破,以绝对优势获得了图像分类、图像定位以及图像检测全部三个主要项目的冠军,击败了来自学界、企业和研究机构的众多参赛者,打造出了目前世界上最精确的计算机视觉系统。

当谈及开发微软自拍这样一款App背后的技术诉求时,微软亚洲研究院视觉计算组主管研究员袁路表示: “对于人脸编辑这个研究方向,我们一直有着极大兴趣,这也是目前针对人脸的研究中所缺失的一环。How-old.net(微软颜龄机器人)备受用户欢迎,让我们看到了大众对于面部智能科技的热情和渴求。因此我们希望做一个相比于目前市面上已有的面部美化产品更好的、适用人群和环境更广的、效果更自然的全智能产品。”从20157月开始,微软自拍项目历时5个月就从想法变成了面向市场的一款智能型应用,其中离不开的是微软亚洲研究院视觉计算组在计算机视觉领域长达十余年的研究积累以及微软亚太研发集团创新孵化组的敏捷开发。


让技术趋于隐形

在微软对外发布的众多耳熟能详的产品和服务中,都能看到来自微软亚洲研究院日积月累的基础研究成果。微软亚洲研究院就如同创新引擎,源源不断地把最前沿的科研成果转化至微软的产品和服务中。普通用户虽然看不到背后繁复技术的运作,却可以切实地享受到技术带来的便利。

在谈及微软自拍之后的技术走向时,袁路提到了三个发展方向。第一点是实现更智能的图像处理和相机增强,例如增加对场景的智能分类来让手机自动选择更适合的处理及拍摄方式。第二点是增加人脸编辑的更多特效,让用户可以更为个性化地订制出不同的造型,增加更多可供选择的面部增强效果,如选择瘦脸与否等。最后一点则是将图片质量智能增强的技术应用到视频的实时处理中。最终的目标是把这些复杂的技术应用到人们的生活中,让每个人都能够真正感受到智能的、个性化的计算体验。

目前,微软自拍应用已登录iOS应用商店(下载链接:https://appsto.re/cn/UTAD_.i,供大家免费下载。除此之外,微软亚太研发集团创新孵化组的微信公众号“微软咖啡”(微信号:MicrosoftCafe和微软自拍的网页体验版http://selfie.microsoftcafe.net/都可以实现该应用的部分功能,快去试一试吧!

了解更多相关信息,请扫面下方二维码。​



推荐阅读

收拾行李的时候,也别忘了这些微软旅行神器

假期结束,教你如何帮手机相册“瘦身”

 

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

统计机器学习——让计算机学会吟诗作赋

$
0
0

宿建德江

唐 孟浩然

移舟泊烟渚, 日暮客愁新。

野旷天低树, 江清月近人。

图片来自互联网

格律诗是中国古典诗词的一种,也叫近体诗,特指唐代之后的古诗体。其根据篇章长度不同可分为四句的绝句和八句的律诗,按照每句字数的不同又可分为五言诗和七言诗。格律诗的创作需在规定字数内完成给定主题内容的描述,且包涵特定意境。不仅如此,格律诗还讲究文字优美、押韵,对平仄、轻重音和用韵的使用也有一定的限制,比如有时候奇-偶句子要讲究平仄对应。李白、杜甫、李商隐、陆游等我们耳熟能详的著名诗人在中国诗歌史上占据重要地位。如今依然有很多文学爱好者希望和他们一样用诗歌传达自己的情感和抱负。但对于未经训练的人们来说,遣词造句以及韵律等约束是创作格律诗过程中的一大障碍。

新年到,作为格律诗研究的第一步探索,微软亚洲研究院推出了全新的绝句生成系统,为热爱诗词的人们带来了乐趣。自然语言计算组的研究员们基于统计机器翻译的方法,利用计算机对格律诗进行辅助创作。首先,创作者选择几个表达创作意图的关键词,然后系统会对每一个关键词增加若干语义相关的扩展词,并通过句子韵律模板生成候选的第一句,供创作者确认或者修改。然后,系统使用一个基于短语的机器翻译模型,以前一句为输入,来生成下一句的候选。与“微软对联”系统不同的是,在生成下一句候选时,中文格律诗自动生成系统要考虑与前面一句,以及前面所有句子的语义连贯性,以及平仄、韵律和对仗的约束。如此往复,直至四句全部完成。


带你写出“原汁原味”的古体格律诗

先来看看网友用“微软绝句”写下的心情:

郊兴

拨槕茶川去,入杯花海归。

随曲柳风至,逐人桃雨垂。

秋馆雨夜

飞鸣一燕带秋回,落语千花随夜微。

手拓棂窗望萧瑟,闲宵静话喜还悲。

是不是有点意境,仿佛古代的文人穿越至此留下的感悟?

目前中文格律诗自动生成系统已可以成功实现绝句的创作。网友们在体验后纷纷表示,前沿科技原来也可以如此“文艺”。

那么中文格律诗自动生成系统是如何让诗歌的字词句如此富有古典气息的呢?

一般的格律诗创作过程可大致分为如下几步:

1) 有清晰的描述主题,这些主题可以通过具体的主题词来表述。如:写一首想念故乡的诗,可由“思乡”或“故乡”等确切的词汇来表述。

2) 根据主题词联想出更多与其语义相关的词汇,如:由“思乡”联想到“慈母”和“家书”等。

3) 在符合格律诗约束下,通过对这些词的合理组织,反复推敲创作诗句。

4) 参考上文与主题,一句一句创作下句,循环往复直至完成全诗。

为了让创作者写出符合格律诗约束的诗篇,中文格律诗自动生成系统依照传统创作过程将具体架构设计如下:

系统在统计机器翻译的基础上,引入主题模型作为用户所输入的表征题目词汇的扩展,从而辅助首句的生成,并在交互方式下生成每一个单句。在统计机器翻译模型中融入主题模型是为了加强所生成诗句与创作者拟定题目的相关性。在基于统计机器翻译的格律诗生成过程中,把格律诗中的上下句分别看作源语言句与目标语言句,可自然地通过统计机器翻译模型实现下句的自动生成。

不仅如此,系统还引入了清代学者刘文蔚在《诗学含英》中所总结归纳的古诗特性及约束,加入了《声韵启蒙》、《训蒙骈句》、《笠翁对韵》三本训练对偶技巧和声韵格律的工具书中的主题类型,如天文、时令、节序、地舆、楼馆、人伦、文学、游眺、饮食、器用、花草、竹木、飞禽、走兽等。同时,系统还包含了主题词的二级分类,对常见的古诗主题有了比较全面的覆盖。创作者可以在这些类中选择主题,“写出”符合遣词造句、格律押韵并充满意境的古诗来。


“计算机诗人”的创作过程

饮中八仙歌

唐 杜甫

李白斗酒诗百篇,长安市上酒家眠。

天子呼来不上船,自称臣是酒中仙。

图片来自互联网

在使用系统时,用户首先选择一些关键词,系统会根据这些确定的关键词生成第一句(用户可以手动选择第一句,也可以自行输入);随后点击第二句的输入框,系统则会根据第一句自动生成第二句;同理,第三句和第四句的生成也会考虑已生成前文的信息。当四句诗生成结束后,用户则可以点击“写诗题”输入诗题和姓名,然后,系统还会根据诗歌内容量身定制诗配画。最后完成保存,就可以和小伙伴们一起分享你的大作。你也可以像“诗仙”李白一样“斗酒诗百篇”!

实现这样看似轻松的格律诗创作,其背后的技术却没有那么“轻松”。

首先,在格律诗创作中,主题可由多种多样的词汇来描述。为了满足表达多样性的需求,系统根据创作者提交主题词,利用主题模型进行扩展得到更多的主题相关词。主题模型除了有助于词汇扩展,还可帮助强化主题意境。

语义相关:词A和词B同属某个主题的常用词,在撰写某类主题文章时经常被一起使用,且在训练文档库中存在很强的共现关系

除此之外,我们进一步使用深度学习技术词向量模型对于主题词进行扩展,例如当用户选择“怀古”主题时,深度学习模型可以给出更多相关的主题词如“吊古”、“览古”、“凭吊”,“怀昔”等,对于传统的主题模型是很好地增强。在借助上述主题模型得到基于主题词的语义相关词集后,首句的自动生成便呼之欲出了。以该词集中的词汇作为造句的基本元素,结合语言模型作为评价函数,搜索较优的候选句。候选句的筛选机制在宽度优先搜索上加上了扩展宽度限制,每次只从扩展节点中选择评分最优的若干个节点进行扩展。例如,对于词集{清溪、石桥、潺潺、绕、过},首先设置扩展宽度为1,生成候选词的个数也为1,假定诗句长度为5(五言绝句)。第一次筛选时每个词均作为一个候选,假定首轮最优扩展节点为“清溪”,则第二轮筛选时,枚举词集可得到“清溪-石桥”、“清溪-潺潺”、“清溪-绕”、“清溪-过”四个扩展节点。再假定最优扩展节点为“清溪-潺潺”,后进入第三轮筛选,根据诗句长度5的约束可得到两个扩展节点“清溪-潺潺-绕”和“清溪-潺潺-过”。假定最优扩展节点为“清溪-潺潺-过”,在判断其满足三个约束后,即可生成对应语句“清溪潺潺过”。

当首句生成之后,继而采用基于统计机器翻译的方法进行二、三、四句的生成。统计机器翻译将翻译过程看作一个最优目标语句的搜索过程,对于一个给定的上句,根据以往的翻译经验,生成多种可能的译文。基于短语的统计机器翻译技术(Phrase-based Statistical Machine Translation, PBSMT)是目前一种主流的机器翻译技术,它的优势在于短语翻译结果的选词准确。由于诗词的生成讲求对仗,不涉及远距离语序调整问题,且上下句之间的对应关系往往建立于短语级别上,因此诗词的生成非常适合采用基于短语的机器翻译算法来解决。而将格律诗中的上下两句分别看作源语言与目标语言,便可以利用已生成的上句自动生成下一句。

在统计机器翻译中,特征函数的选择也不能忽略,因为这直接决定了模型能否生成正确的翻译结果。一般来讲,基于短语的统计机器翻译系统采用了如下的特征函数:正向短语翻译概率、反向短语翻译概率、正向短语词汇化翻译概率、反向短语词汇化翻译概率、使用短语个数和目标语言模型。

除此之外,中文格律诗自动生成系统还加入了概括上下文词汇使用意境一致性的的特征:互信息特征。

互信息特征的加入,可用于度量诗句间的意境关联。用Set-A表示即将生成的诗句中包含的词集合,用Set-B表示之前所有诗句包含的词集合,互信息计算方式如下:

其中,SiSj分别代表Set-ASet-B中的词汇,p(Si, Sj)表示SiSj共同出现在诗歌中的概率,p(Si)表示Si出现在诗歌中的概率。这样一来,互信息可较好地估计上下文使用词汇意境的一致性。

 

未来新突破

登鹳雀楼

唐 王之涣

白日依山尽,黄河入海流。

欲穷千里目,更上一层楼。

图片来自互联网

经过不断的改进,微软亚洲研究院自然语言计算组的研究员们提出的这一结合统计机器翻译模型与格律诗创作知识的独创性方法,通过对大规模诗词数据进行自动学习,将格律诗中上下句变换为统计机器翻译中的双语映射关系,实现了绝句的自动生成。

“微软绝句为广大古典文化爱好者提供了帮助,对中国传统文化的传承及宣扬也具有积极意义。而机器学习技术和中国格律诗创作的结合,则是我们在人工智能领域崭新的尝试。虽然目前的系统尚为稚嫩,但是我们仍然很高兴迈出了这历史性的第一步,并为未来的长期研究奠定了基础。微软亚洲研究院自然语言计算组首席研究员周明博士介绍道,“但是,我们也清楚地认识到还有很多问题。其中最重要的是全诗的意境的连贯性。这里我相信深度学习大有用武之地。同时我们将继续改善用户体验。在此基础上,我们也准备逐步扩展到律诗甚至词的生成”中文格律诗自动生成系统充满着挑战和收获,我们前进的脚步从未停止,未来还会有更广阔的空间等待着我们“更上一层楼”。

微软绝句传送门:http://couplet.msra.cn/jueju/


推荐阅读

微软自拍:让黑科技拯救不会拍照的你

成为数据专家,你只差一个Quick Insights的距离

这个端午节,你有的不仅仅是粽子…

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

大数据教父Michael Stonebraker告诉你大数据的秘密

$
0
0

——第十七届“二十一世纪的计算”学术研讨会

图灵奖得主Michael Stonebraker的主题演讲

(微软亚洲研究院主页君小田热心提示:搭配文中的视频和PPT阅读,效果更佳!)

观看演讲视频【2015年21世纪的计算】Michael Stonebraker的演讲

PPT下载链接http://vdisk.weibo.com/s/z7VKRh2itilfs


今天,我要跟大家谈谈大数据。大数据这个词其实是一些做营销的人发明的,大概是几年前的事情。然后我也非常高兴,我终于知道过去四十年自己到底在做什么,我原来是在做大数据。所以我想跟大家谈谈大数据对于我来说意味着什么,以及我认为的大数据中什么是重要的。

关于大数据,很多人说意味着三件事情,这三个单词都是以字母V开头的。

大数据的问题,第一个就是量(volume)很大。第二个是这些数据的产生速度(velocity)太快了,软件跟不上。第三个问题是数据来自许多不同的地方(variety),你需要进行数据整合,但这些数据来源太多了,你想要整合这些数据就非常困难。所以在这三个“V”领域你要解决的问题是完全不一样的,我分别给大家谈谈。

Big Volume大量数据

在量方面,第一种情况是你要想做一些非常愚蠢的分析,比如说SQL分析。第二种情况是,你想要做非常复杂的分析。前者是比较简单的,如果你想做SQL分析的话,我知道你可能要在上百个节点,PB的数据上面运行二十到三十个生产实现,日以继夜地进行分析。在这些数据仓库产品中,有几款已经做得还不错了。所以,这个市场的需求其实已经被一些商业软件很好地解决了,比如说Vertica,就是这样的一家数据仓库公司。他们最大的用户叫做ZyngaZynga开发了一个名叫FarmVille的游戏。Zynga会实时记录全世界每一个用户在玩他们的游戏时每一次的点击,这样的话就可以利用他们的数据做人工智能研究,看看如何能够让全世界的用户购买更多虚拟商品。所以,我认为这个问题已经得到了解决, 因为现在即使你从用户身上获得大量的数据,他们也不会感到不快。但我要提醒一下大家,在过去十年里,我们已经经历了一个非常巨大的变化。

大约十年以前,如果你去和一些卖数据仓库产品的公司聊的话,他们基本上卖的都是一种叫做“行存储”(row storage)的产品,这是指存储的下一个对象是同条记录的下一个属性。他们在磁盘上用行的方式存储数据。SQL服务器以前就是这样的。

其他的数据仓库公司都是卖这样的产品。当时我成立的这家公司叫做Vertica。我们从另外一个角度来看待这件事情,把行转90度,变成列,用列的方式存储数据。

于是存储的下一个对象就从同一条记录的下一个属性,转变为下一条记录的同一属性。这种方式比原来的行存储方式要快很多。Vertica完全颠覆了这个市场。它的速度比行存储产品要快50100倍。这是颠覆性的。

而这是由一家创业公司带来的。所以我认为,在这个市场上实现颠覆的一种常见方式就是成立一家公司,然后去挑战那些大公司,让他们感受到威胁。所以在过去的十年里,整个市场都开始转而采用列存储。其中包括微软的数据仓库产品PDW,也是用的列存储, 不过是10年后才用的。为什么列存储的速度要比行存储快很多呢?当然,这背后有很深层次的技术原因,不过我现在没有时间去详细解释了。厂商要取得成功,他们必须做出转变。于是,基本上除了Oracle外,所有其他厂商都开始采用多节点列存储的方式,它的速度非常快。在过去的十年里,正是由于这种颠覆性的转变,数据仓库产品的性能提升了50倍。但是在我看来,这已经是明日黄花了,就像PeterLee所说的,人们现在感兴趣的是机器学习,机器翻译,数据聚类,预测模型,这些才是接下来要做的重要事情。

借用华尔街的说法,我们已经进入了“股市分析员”的时代。这些分析员其实与火箭科学家无异。如果你是一名从事数据库工作的人员,当你仔细去看他们的算法和他们的工作,你会发现,其实大部分的算法都是采用数组形式的线性代数,而不是表格形式的SQL。这与现实世界毫无关系。如果你再仔细看这些算法的话,你会发现,其实大部分的算法都是内循环迭代,也就是执行几次诸如矩阵乘法、奇异值分解之类的线性代数运算。为了说明这一点,我来举一个非常简单的例子。

这个例子就是人们为之疯狂的股票市场。股票市场有涨有跌。假设有两只股票——AB,让我们来看一下它们在过去五年所有交易日的收盘价。如果你想的话,可以假设这两只股票是华为和阿里巴巴的股票。如果你在做电子交易,你可能想知道这两只股票的收盘价是否有关联,它们的时间序列是否有关联。如果有关联,那么如果一只股票涨了,你是否应该购买另一只股票?所以你能做的最简单的事情就是计算一下这两个时间序列之间的协方差。具体的做法我已从我的统计课本那里抄了下来——如果我没有抄错的话——就是幻灯片最下面的红色字。这就是你想要计算的东西。

其实并不难。你在手机上也可以做这种计算。但现在,假设你要对纽约证交所的所有股票进行这样的计算,有差不多四千只股票。五年的数据大约有一千个交易日。假设你有这样一个红色的矩阵,其中你有一只股票的一千个收盘价,然后一共有四千只股票。我要做的就是要计算每一对股票之间的协方差。

那会是怎样的呢?请允许我自由发挥一下,忽略掉那些常量减去他们的平均数。这就是红色的矩阵,矩阵乘以它的转置矩阵。也就是我们想要做的内循环。所以,大多数算法最终都要应用于这种超大规模的运算。

理想的大数据用户是当你解决了这个问题后,他马上就会想要更多的训练数据。你为华尔街的股市分析员解决了问题后,他又会想要为全世界所有的股票做这种计算,而不是仅仅纽约证交所上的股票。这就是你想要做的事情,不过不是在SQL中做,甚至不是在表格中定义的。所以我认为,对于一个数据科学家来说,他必须要对他的数据进行清理,去粗取精。这是他现在大部分时间所做的事情。

待会我在谈到多样性问题的时候会再说一下这一点。所以,数据科学家退休前所从事的工作就是数据管理和股票分析员的那种分析工作。而且你必须不断重复去做这种工作。这就是数据科学家所做的事情。目前我们有一些商业分析师,他们在数据仓库上运行SQL,所有这些都要被数据科学家所取代,在他们的数据上执行这种操作。那么我们应如何满足这种用户需求呢?你要做的就是数组分析。目前有大量的数组计算。你可能会说,我有一些问题是在图表上定义的,比如说社交网络这种问题。可是我认为,图表其实只是一种稀疏数组。它跟数组是类似的。然后你还要进行数据管理,不断重复这种操作,还要扩大规模。因为只要满足了用户的一个需求,他就会让你去处理另一个更复杂的问题。这个问题可能涉及更多的核心、节点和超出内存的数据。这就是真正的大数据,也是问题所在。

那么应该如何解决这个问题呢?如果你现在要做这样的工作的话,你很可能会成为RSaaSMatlab等统计软件的忠实用户。

当然,你可以选择R。但它基本上没有数据管理能力,因为它是基于文件系统的。你可以用R来进行大量的数组分析,但它无法扩展,实现不了真正的数据管理。所以它只是解决了问题的一部分。或者我们可以使用OracleOracle的扩展性也不是很好。但是先不管这一点。那么你应该如何在一个关系型数据库中做矩阵乘法呢?这样做的效果并不是很好。你们当中可能有些人会觉得自己很聪明,于是尝试在SQL中写矩阵乘法代码,这是一种不错的练习方法。这是可以做到的。它要求用表格去模拟数组的表现形式,但它的速度真的很慢。 而且在SQL中也很难去做奇异值分解。所以单就SQL来说,那是有问题的。

当然你可以说,如今大多数的系统都支持用户自定义功能,所以我们可以将矩阵运算的代码编写为用户自定义功能。这种想法已经开始实现。用户现在可以用RC++语言编写自定义功能。但是这种方式很别扭,做起来难度也很大。所以这并不是一个很好的想法。那么现在人们是怎么做的呢?他们对此一筹莫展吗?他们把数据放在一个关系型数据库系统里,在上面运行数据管理,将他们感兴趣的东西拷贝到RMatlab,然后在上面进行统计分析。

这是一个很糟糕的解决方案,因为你得学会两种完全不同的系统。而且要在两个系统当中来回拷贝。这样做的结果是让网络销售商大赚了一笔。而且R还无法扩展。所以研究的挑战就在于找出一种更好的方法。很明显这就是人们现在每天所做的,也是数据科学家在实现世界中所面临的挑战。我们应该可以做得更好。我倾向于将它视为数组问题来看待。这并不是表格问题。我们为什么不能用数组型数据库系统呢?所以,跳出你的思维条框,摆脱那些表格,用数组去取代它们。所以几年前我写了一个名叫SciDB的系统。它支持在SQL上使用数组,内置有分析方法,对于矩阵乘法的计算速度非常快,而且与现在许多其他软件一样,它是基于开源的Linux系统开发的。你可以试着去SciDB.org寻找一个颠覆性的解决方案,看看结果如何。

之所以说数组是一个理想的解决方案,是因为如果你将一个表格模拟为数组,那么你会得到一个维度为IJ的数组,而且被赋予了值。如果你想得到一个4x4的矩阵,那么它的左边就是表格的模拟。

注意刚才已经明确指定了维度。然后有大量的数据。右边是数组表达。你可以完全压缩掉这些维度。很多时候你想要得到该数组的一个子集,例如地理子集。它在右边可以很容易地定位。但在左边就很难做到。所以数组型数据库系统具有一些先天的优势。我认为从长期来说,这种技术将成为最终的赢者。现在我必须向大家坦白,Hadoop曾经存在很严重的问题。让我们来看看2012年前后的Hadoop

Hadoop是一个真正的三层堆栈。位于底层的是文件系统HDFS中间层是由谷歌写的Map-Reduce。雅虎写了一个开源的版本。然后在顶层有各种不同的高级系统——HivePigHahout等等。这就是Hadoop在大约三年前出售的堆栈。他们发现,当你试图让实现世界的用户使用该产品时,Map-Reduce并不是一个特别吸引人的分布式计算平台,这其中有许多技术上的原因。所以它在分布式计算上是失败了。另外,Map-Reduce也不是一个很好的数据管理平台。将SQL放在Map-Reduce顶层导致性能惨不忍睹。所以说Map-Reduce无论是在数据管理还是在分布式计算上都基本算得上完败。那么是谁放弃了Map-Reduce呢?

谷歌在写Map-Reduce的时候,是专门针对他们的Web搜索数据库写的。他们在大概2001年就放弃了Map-Reduce。而Map-Reduce当时设计所针对的应用,谷歌在五年后也将之放弃了。他们后来为其他项目开发了DremmelF1等不同系统。Map-Reduce已淡出谷歌的视线,他们对之失去了兴趣,不想进一步去开发了。ClouderaHadoop的一个主要供应商,他们也基本上放弃了Map-Reduce。所以他们的新SQL数据库管理系统——Impala并不是建立在Map-Reduce上的。HortonWorksFacebook也有类似的项目。那么,Hadoop堆栈的未来究竟在哪里呢?

它可以用作底部的文件系统。但由于HDFS存在非常糟糕的性能问题,因此先要将这些问题解决掉才行。未来SQL将位于顶层,类似于Impala的系统。大家知道,数据仓库形式的数据库系统都要运行在HDFS之上。所以Hadoop市场内的数据仓库市场将会完全融合。在商业分析上也存在同样的情况。所以Hadoop在他们最新的营销演讲上提到了“数据湖”这个概念,待会我就会大概说一下。现在我想说的是,数据仓库市场和Hadoop市场基本上是同一个市场。

那么Spark表现得怎样呢?Spark我认为很有意思。

Spark的存在是为了以快于Map-Reduce的速度进行分布式计算。现在大家都不想要Map-Reduce了,Spark的设计初衷是要解决一个没有人愿意解决的问题。所以出售Spark的商业公司Databricks很快就了解到,人们想要用SQL。现在,Spark70%的访问量来自于SparkSQL

Spark就是一个SQL市场。但不幸的是,Spark压根儿不是一个SQL引擎。它没有事务,没有持久度,也没有索引。现在所有这些问题都将得到修复。所以SparkSQL可能会越来越像Impala,像商业数据仓库实现。而且他们可能在数据仓库市场上与Impala以及现有的一些数据仓库厂商竞争。希望最好的系统能够笑到最后。Spark的市场有30%是分布式计算,它的主要客户是Scala。而且它的功能比Map-Reduce更强大。但是,Spark数据的RDD格式并不是所有人都喜闻乐见的,所以很快Databricks就尝试采用一种R形式的数据结构——数据帧。因此Spark内部将发生翻天覆地的变化,请系好你的安全带。这是下一代的明星产品。但明年会怎样谁都不知道。Spark的确有这样的意向。而且几乎可以肯定的是,它一定会进军数据仓库市场。我认为在商业智能领域的分析市场,其实有很多系统都做得非常好。而且SparkHadoop也将会进军这个市场,为它带来更多的产品。但最大的难题在于如何在数据管理的中心进行可扩展的分析。如果你决定要在这方面开展某项工作,你必须先解决好这个大难题。

Big Velocity很快的处理速度

下面马上就到高速这个话题。现在的商业市场规则不断变化,这是个不错的现象。物联网正在通过传感器记录下所有有意义的东西。例如戴在你腕上的小腕带,它可以记录下你的生命特征。不管是赛跑中的马拉松选手,还是为数众多的野生鸟类和动物,都能一一记录下来。这些人或动物会将他们的状态或其他数据实时传送给我们。这就带来了海量的数据。我们都在使用智能手机作为移动平台,它发送数据的速度也是相当的快。物联网持续冲击着人们原有的基础设施——我们必须提速了。而在人们说要提速的时候,他们会遇到两种不同的问题。第一种问题我将之称为“大模式、小状态”。

当你要做电子交易时,华尔街的工作人员会在海量的数据中寻找一个模式。比如先找一只草莓,然后0.1秒后再找一条香蕉。这就是复杂事件处理(CEP)技术。另外也有一些商业系统,他们可以比较好地解决这个市场的需求。所以这并不是一个交易数据库市场,而只是打开一条消防水管,然后从喷出的水中寻找模式。我对第二种有关高速的问题更感兴趣,我将之称为“大状态、小模式”。

假设有一家电子交易公司,他们目前的交易量占纽约证交所总交易量的10%。他们在纽约、伦敦、东京以及北京这里都设有电子交易专柜。这些电子交易专柜可以进行实时证券交易。这家公司的CEO想要确定自己相对于全球任一股票的价位。如果价位相对较高,那么他可以说,我的风险太高了。然后按下应急按钮来降低风险。也就是说,在风险高于一定水平的时候提醒我。注意这一次就不是在消防水管喷出的水中寻找模式了,而是确切地记录下世界各地每一次交易的影响。这是数据库中一个有关我当前全球位置的例子。此时哪怕你只是遗漏了一条消息,你的数据库也会变得毫无价值。所以你不能遗漏任何数据。一定不要遗漏任何数据。而且要非常快速、准确地记录我的状态。这看起来像是一个有关超高性能交易处理的问题。这是一个我非常有兴趣去研究的领域。

要解决这个问题,你可以运行任何一个商业关系型数据库系统,我将之称为老SQL。所以你可以运行微软的SQLserver。它就是其中一款老SQL大型应用。你也可以运行NoSQL系统。目前有75100家厂商可以卖给你NoSQL系统。而且他们主张放弃SQLACID。另外还有第三种解决方案,我将之称为新SQL,那就是保留SQLACID,但放弃老SQL厂商遗留下来的实现,以编写体积更小、速度更快的实现。待会我会分别解释这些方案。

现有的大型应用速度很慢。除了慢还是慢。如果你要在一秒内运行100万个交易,那么我劝你不必费劲在任何这些遗留实现上去尝试这样做。SQL是可以的,但它对交易的实现实在是太慢了。我在2007年与其他人合作写了一篇名叫"Through the OLTP Looking Glass"的论文,上面明确解释了为什么老SQL无法在这样一个市场当中高性能运行。如需更多详情,大家可以看一下这篇文章。所以为什么不使用NoSQL系统呢?

关于NoSQL我想说两件事情。第一件是,如果你主张放弃SQL,那么你就是主张使用低级的表示法,因为这是SQL编译后的结果。不要将赌注压在编译器上。我虽然白头发很多,但是我还记得我在刚入行的时候那些“白头”前辈对我说,你必须用IBM汇编器来写代码。这是因为,除非你能够控制机器上的所有寄存器,否则提速根本是不可能的。现在我们都知道这是多么的可笑。不要将赌注压在编译器上。高级语言是可以的。但低级表示法就不好了。40年的数据库研究教会大家这个道理。而NoSQL那些人还没有完全明白这个道理。我们应该放弃ACID。遗留厂商的传统交易实现实在是太慢了。真的。一种选择是放弃它们,但我并不是很支持这种做法。这是因为,如果你想将100美元从这里挪到那里,你必须要有交易才能做到。例如,比特币就是一个很好的例子,不少人因为NoSQL系统受到攻击而损失了很多钱。所以说, 如果你需要交易但又没有好的交易系统,那么你很容易就会被一些非常严重的漏洞陷入危险的境地。你所能做的就是对着用户代码抓狂。

所以我的预测是这样的,SQLNoSQL系统之后会合并在一起。NoSQL是指2012年版本的NoSQL。然后NoSQL厂商的营销人员就改口说,我们不仅有SQL,还有SQL的替代方案,对于那些需要用SQL做的事情,我们还有其他的解决方案。在我看来,现在NoSQL就是尚未使用SQL的意思。因为NoSQL厂商已经了解到高级语言的好处,所以便开始在他们系统的上层编写高级语言。尤其是MongodbCassandra,它们基本上都实现了看起来与SQL几乎一样的高级语言。所以说如今NoSQL阵营已开始转向SQL。而SQL人员也在他们的引擎中加入JSON,这是NoSQL厂商的其中一项重要功能——JSON数据类型的灵活性。所以我认为这两个市场将最终融合在一起,不使用SQL的引擎不再叫做NoSQL。它们都是SQL的一种实现,只是使用了不同于其他厂商的特性而已。我个人对新SQL是非常喜欢的,因为交易对每个人来说都是非常有用的。现在的问题是,老厂商的交易实现存在很多问题,它们的速度实在是太慢了。但这并不表示你无法将速度提起来。

例如,VoltDB是一款名叫“H-Store”的MIT系统的商业化版本,它比TPC-C上的老系统要快将近100倍。而且它的交易系统非常轻型,线程优化得很好。它是一款速度超快的主内存开源SQL引擎。微软的数据库系统——Hekaton最近作为SQL Server 14的一部分捆绑推出,它就是新SQL的另一个实现。所以说,提升在目前来看是可能的,只要你不要使用那些三、四十年前的老系统。

接下来我要说的是数据流速快的问题。这个问题要么是流处理问题,要么就是高性能交易问题。对于高性能交易问题,已经开始有速度很快的实现了。但我认为,这里面的关键是如何让交易高速进行。在这方面我们有很多的想法,未来也有很大的改善空间。


Big Variety数据来源多样性

好了,还有最后9分钟,我来谈谈多样性的问题。像联邦快递这样的典型企业一般会有5000个运营数据系统。联邦快递现在有一个数据仓库。但其中只有几个系统的数据纳入到了这个数据仓库当中。也就是说,这个典型的数据仓库只从1020个系统那里收集数据。那么其余剩下的4980个系统该怎么办呢?像Verizon这样的大型电信公司拥有10万个运营系统。大企业要有许多运营系统,主要是因为他们分成了许多独立的业务部门,以便于业务的开展。而独立的业务部门会产生大量的独立数据。所以在大企业的内部有许多运营系统。当然,这其中还包括电子表格、网页、数据库等等。而且每个人都想从互联网获得天气信息,也要从各种公共数据源获取数据。所以他们需要扩展性,将大量运营数据系统进行整合。那么该怎么做呢?

在过去,市场的传统做法是提取、转换、载入数据,ETF系统就是这样的。比如Data StageInformatics,如果你听说过的话,他们就是做这个的大厂商。那具体怎么做呢?首先是提前创建一个全局模式。让你们当中最聪明的人去研究这个全局模式应该是怎样的。创建完成后,针对每一个你想要纳入到该全局模式的本地化数据源,派一名程序员去咨询数据系统的所有者,了解数据源中包含了什么内容,然后将这些内容映射到全局模式当中,再编写一个数据转换脚本,最后确定如何清理并删除数据源中的重复数据。如果有20个数据源的话,应该没问题。但由于这种做法需要提前创建一个全局模式,如果数据源太多的话就不好做了。你也需要一个受训良好的程序员去单独处理每个数据源,其中涉及了太多的人力。如今的ETL人员在卖一种叫做“主数据管理”的产品。它其实只是一个新的术语,指的就是上面那种做法。这时候已经无法再扩展了。而且,现在有许多企业不只想整合20个数据源这么简单,他们想要整合1000个或3000个数据源。比如做团购优惠券的网站Groupon,他们正在建立一个全球小企业数据库,这些企业就是他们的客户。为此他们需要整合1万个数据源。所以他们实际上是以1万倍的规模去处理这个问题。而ETL根本不可能完成这个任务。这就是对系统可扩展性的巨大需求,传统的厂商无法解决这个问题。所以我认为, 在这个关键的领域我们需要有新的想法,需要去做研究,看看怎么去解决这个问题。

我加入过一家名为Data Tamer的初创公司,待会我 会在另一张幻灯片里面说明。他们有一种比较好的方式去做这种规模的数据。另外还有许多类似的初创企业,例如由来自BerkeleyJoe Hellerstein创立的Trifacta。他们关注于每个数据科学家,注重数据策管问题。他们非常关心非程序员、可视化以及每个数据科学家的需求。但不管怎样,我都认为这是一个亟需创新想法的领域。

那么Data Tamer究竟是做什么的呢?他们是做数据策管的,对我来说,数据策管就是要在原处摄取数据,然后将数据转换为某种不同的表示形式,例如欧元转换为美元,或人民币转换为美元等。然后还要进行数据清理。基本上任何数据源都会有10%20%的错误率。有些情况下人们会拼错人名或公司名字等等。然后你必须将多个数据源放到一起,对它们的属性进行映射对比。比如说你有一组员工的数据集。我也有一组员工数据集。你称之为薪金。我称之为工资。你填满了一行数据。然后发现有重复的数据,于是你要进行数据整合。数据策管就是这样的概念。在过去,数据策管的成本非常之高,是普通人无法逾越的大山。但如果你想做数据科学,你就必须翻过这座大山,完成所有的数据整理和勘误工作。如果使用传统的技术去做这项工作,所需的费用非常高。而且传统技术无法扩展。所以说这是一个很大的问题。那么Data Tamer究竟是做什么的呢?

我借用Peter Lee演讲稿里面的一段话。他们在统计学上应用机器学习,让机器找出那些我们无法找到的东西。这类似于将挂在低处的苹果全部摘掉。然后在需要人类帮助时,你必须去找这个领域的专家。你不能去问程序员。因为ETL的程序员不知道怎么解答这方面的问题。比如说Data Tamer有一个客户是Novartis,是一家非常大的医药公司。他们对基因数据应用这项技术。ICE50ICU50是两个基因术语。他们是一样的东西吗?是否其中一个是另一个的笔误?他们是两个不同的基因术语吗?程序员对此一无所知。你必须去问基因领域的专家。Tamer有一个专家搜索系统。当需要人类回答问题时,比如说创建培训数据,你必须去问这个领域的专家。你不能去问程序员。这样才能获得巨大的投资回报。这种方式比起使用传统技术要省钱。这是解决数据源多样性问题的一个可行方法。但我的建议是,这一点非常重要。如果你想研究这个问题,你必须去找一个真实的用户,例如阿里巴巴或华为。去拜访真实的用户,找出他们的数据策管问题在哪里,然后解决这个问题。因为在现实世界中,很多人都会先写一个算法,然后再想这个算法在现实世界中究竟好不好用。我觉得这个顺序反了。你应该先找出现实世界的数据,然后再修复这些数据。好了,时间不多了。但我刚才说了,我会谈一谈数据湖。

Hadoop厂商现在的想法是,将所有数据放入一个基于HDFS的数据湖中,这样就万事大吉了。也就是说,将所有原始数据放入HDFS,这就是他们所说的数据湖。注意这只是数据策管所摄取的数据块。其余部分才是难点所在,你还必须解决这些难点。所以,如果你采用Hadoop厂商的建议,将所有原始数据放入HDFS当中,你并非创建一个数据湖,而只是创建了一个数据沼泽。然后你必须进行数据策管,才能创建出一个可供你使用的数据湖。所以说,数据湖只是一个新的营销术语,它指的是数据策管所摄取的数据块。


总结:工欲善其事,必先利其器

最后总结一下,如果你想做大数据,想做SQL分析,你应该采用列存储。如果你想做智能分析,最好不要用过时的产品。我强烈建议你使用数组存储。但可能也会有其他解决方案。如果你遇到数据速度的问题,你需要找一个流处理产品,或高性能的OLTP系统,这取决于你手头上有什么资源。NoSQL人员目前提供了一种不错的上手体验。他们的产品容易使用,而且他们正在转向SQL。但你的公司现在已经有了大量类似的产品。一些遗留的厂商实现仍将存在,它们不会完全过时,但会逐渐被这些新技术所取代。与此同时,你仍然需要用到这些旧的技术。然后,你将拥有一个或多个数据策管系统,它们能够最大限度地解决数据源多样性方面的可扩展性问题。所以,你公司内部的堆栈中将产生大量的数据。最后我的建议是:“工欲善其事,必先利其器”。谢谢大家!

推荐阅读

听顶级科学家解读未来计算——第十七届二十一世纪的计算大会亮点

用数学视角去看待编程

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:



 

你负责幻想,科学放着我来

$
0
0

(主页君Dr.田提示:直接访问网址:http://news.microsoft.com/futurevisions/即可下载小说《Future Visions》哦~国内用户推荐使用Kobo下载~

《星球大战:原力觉醒》正在全球范围掀起一阵原力风暴,虽说星球大战离我们还很遥远,但这部科幻电影却点亮了一代人的科技和太空理想。

其实很多科幻电影背后,少不了专业技术团队提供的支持。《星际穿越》里关于虫洞的理念都够导演发好几篇论文了,而《火星救援》更是得到了NASA的全力支持,他们派出专人跟随剧组拍摄,为影片中的很多关键元素提供技术咨询。

《星际穿越》中的虫洞

技术团队的强大支持让科幻电影变得“硬派”而精彩,而科幻电影也为真实世界的科技前沿探索展现了无穷的想象空间。20151021日这个时间你也许觉得很眼熟,这是电影《回到未来II》中主角穿越到未来的那一天。这部在科幻史上有着重要地位的电影影响了一整代人的成长,以至于在1021日这一天,全世界的媒体都在津津乐道电影播放后的三十年内有多少技术成为了现实。

《回到未来》剧照

让科幻变为现实,背后少不了无数科研机构和研究人员的共同努力和推进,微软研究院就是其中之一。不久前,微软邀请了9位世界顶级科幻小说家深度参观微软在全球各地的研究院。从微软研究院超过55种研究方向中,这些作家们选择了他们想要探索的领域,如量子计算、预测分析、机器学习、人工智能、虚拟传送以及情感计算等主题,并与研究员面对面交流,提出问题,坦诚对话。最终他们将从微软研究院的科研项目中汲取的灵感和启发,创作了一本长达239页的科幻小说集《Future Visions》。

那么,在微软众多黑科技的启发下,这9位世界顶级的科幻小说家究竟写出了什么样的故事?快来先睹为快吧!

你负责幻想:9个故事应该怎么看?

Vol.1 你好,你好】

Hello, Hello

Paulson是一名科学家,为了帮助自己患有听力障碍的妹妹能如常人般交流,他便为妹妹安装了智能语音分析系统。在与别人的通话中,系统可以自动识别手语并模拟人声,常人根本不会意识到与他交流的是一位聋哑人。但奇怪的事情很快发生了,一天,Paulson接到了自己妹妹打来的电话,电话的另一头,一个陌生的声音一直反复说着“你好,你好”,起初,Paulson以为是语言识别系统出现了故障,然而,他不断接到各种奇怪的电话,谈话的内容也从单一的“你好,你好”变成了日常生活的方方面面。究竟发生了什么?Paulson决定亲自去妹妹家一探究竟……

Vol.2 运算开始】

The Machine Starts

Bose是一位量子计算科学家,虽然他认为自己并不是一个聪明的人,但却一直享受着研究的乐趣。在实验室中,他和其他四位科学家正在进行着量子计算机的研发,虽然投入了大量的资金与时间,但量子计算机的各种尝试却屡屡碰壁。当他们某次尝试转变思路之后,一系列奇怪的事情在量子实验室中发生了。一张张字迹熟悉的便条,一瓶瓶空置的可乐罐,很多迹象表明实验室里并不只有他们五个人,究竟实验室监视器里那个熟悉的人影是谁?他们的目的又是什么?Bose决定解开这背后的秘密……

Vol.3 风险共担】

Skin in the Game

Neon White是一名当红的摇滚歌手,在一次个人演唱会结束后,她的经纪人兼前男友Peter在金钱和利益的驱使下,逼迫她参加了一个名叫“clownfish”的APP采样计划。这个APP可以收集歌手演唱时的情绪并灌输给听众,让听众更好体验歌手的表演。Neon的好友Mitchell认为虽然这项技术能帮助Neon一直红下去但将情绪强行灌输给他人的行为有违伦理。不过,在Peter的威逼下,Neon最终还是进行了情绪的采样。就在一切看似顺利的时候,Mitchell的尸体出现在了演唱会的后台……

Vol.4 机器学习】

Machine Learning

人工智能专家Ethan和他的同事Jamie一直忙于研发MAIP人工智能系统,他们期待让MAIP能掌握自主学习的能力,并能够识别人类的情绪。对于MAIP项目,Ethan看似一直非常冷淡,但Jamie却意外地发现了一件事情:Ethan经常在夜晚偷偷溜进实验室,一待就是一个晚上。好奇的Jamie决心解开事情背后的玄机,于是他偷偷跟随Ethan,在夜晚闯进了实验室……

Vol.5 与公爵同行】

Riding with the Duke

Walter从小立志成为一名科学家,但因为不够聪明,硕士毕业之后只能靠成为一名出租车司机来维持生计。父母的失望、女朋友的离去让Walter的人生跌入谷底。在之后的一次宴会上,他认识了Diana,并得到了一台名为“Quark-Box”的虚拟世界模拟器。这台模拟器可以让用户成为任意一部电影中的任意角色,并能够在全息的模拟环境中身临其境的进行体验。但Walter也没想到,这台“Quark-Box”悄然之间改变了他和Diana的命运……

Vol.6 警察的眼睛】

A Cop's Eye

Worknesh是一名警察,在一个晚上,他接到了搜索离家出走的Lucy的任务。擅长计算机技术的Lucy为了不被发现,将自己在互联网上的所有痕迹全部抹去,同时也将自己的所有照片全部进行了模糊化处理。Lucy为什么要将自己所有的信息全部隐藏?在茫茫人海中,又该如何找到一个不愿被发现的人?Worknesh陷入了思考……

Vol.7 寻找戈多】

Looking for Gordo

2030年,一场特殊的辩论会正式开始。在国际法庭上,人们正在对是否该启动对于外星智慧生命探索的计划而针锋相对。此时,一个名叫Ursula的“外星替身“的出现引起了人们巨大的关注。Ursula是人工智能科学家Emily的团队基于他们发现的外星信号模拟而成,可以与人类进行无障碍交流。在法庭上,通过Ursula对自己所在星球情况的详细介绍,人类发现,Ursula所在的种族更加智慧,而接下来Ursula说出的一番话却让所有人的心情陷入了低谷……

Vol.8预言机器】

The Tell

我是一名魔术师,却意外地加入到了一场有关“预言机器”的秘密任务中。我必须穿越赌场的严密监控,将预言机器安装在预定的位置。这种预言机器可以将你储存在云端的所有信息全部窃取,同时还能看穿你的脑电波,洞察你的行为。在无人机的帮助之下, 我穿越重重障碍并成功安装了预言机器。但事实却没有我所想象的那么简单,当我自以为是这个计划的执行者的时候,我早已成为了计划的试验者,真正的“预言”才刚刚展开……

Vol.9 世界的另一种说法】

Another Word For World

ISS星球上有两个语言不通的种族,他们之间通过翻译器进行交流。翻译器不仅能够翻译对方的语言,还能评估对方的语气和情绪。此时,对于星球统治权的争夺愈演愈烈,为了避免一触即发的战争,两个种族派出使者进行谈判。通过翻译器,双方签订了和平共处协议,但出乎所有人的意料,战争的炮火因此打响。究竟是谁从中作祟,ISS星球的未来又将如何……

想要知道每个故事的结局?直接访问http://news.microsoft.com/futurevisions/,精彩故事要靠你亲自去探索~但究竟是什么样的黑科技让这些世界知名科幻小说家脑洞大开呢?让主页君Dr.田为你一一解读。


科学放着我来:看懂故事前你必须知道的科技知识背景

越来越强大的机器学习

人工智能的春天再次到来,很多人认为如今人工智能领域所取得的成就很难离开机器学习技术的发展与进步。机器学习离不开大量的数据、日益精良的算法,和庞大计算能力的支持。机器学习在某些程度上模拟人类的学习行为,更为计算机真正拥有智能提供了条件。《Hello, Hello》(Vol.1你好,你好)、《A Cop's Eye》(Vol.6警察的眼睛)和《Machine Learning》(Vol.4机器学习)这三篇小说也正是基于机器学习的技术背景来进行创作的。

在微软亚洲研究院的研究中,很多技术都有机器学习的身影。201511月,微软亚洲研究院将分布式机器学习工具包DMTK开源,满足了研究人员和开发者们日益增长的机器学习需求,让他们可以在超大规模数据上灵活、稳定地训练大规模机器学习模型,并有效降低分布式机器学习的门槛。

相关阅读:微软亚洲研究院开源分布式机器学习工具包

体验地址:http://www.dmtk.io

而在2015年微软推出的牛津计划也是应用机器学习技术的典型实例。牛津计划是一系列基于云端的机器学习相关API,可以帮助没有机器学习背景的人开发出智能应用。目前,牛津计划开放的API包括视觉(Vison),语音(Speech),语言(Language)三个方向,共10个不同的API,完善了计算机视、听、说等多方面的不同功能。

相关阅读:

不再从零开始:微软牛津计划,让每一个智能应用都能说会看

高兴,难过,还是生气?微软牛津计划告诉你

微软牛津计划:拥抱机器学习,再次升级

微软Project Oxford帮助开发人员创建更智能的应用

体验地址:https://www.projectoxford.ai/(英文)https://cn.projectoxford.ai/(中文)


人工智能——会听、会说、会看,还能懂你

人工智能该如何实现?过去几十年来,科学家们在自然语言理解、计算机视觉、语音识别等各自领域上的技术突破为计算机赋予了各种感官。除了在感官上不断实现突破,让机器进一步理解人类也是科学家们孜孜追求的目标。未来,我们甚至希望机器能够读懂我们的内心,能够与我们进行情感交流。

Skin in the Game》(Vol.3 风险共担)、《Looking for Gordo》(Vol.7寻找戈多)、《The Tell》(Vol.8预言机器)和《Another Word For World》(Vol.9 世界的另一种说法)四篇小说都涉及了计算机取代人类的部分或者全部感官功能,更是表现出了对于未来更有“人性”的机器的期待。

相关阅读:

微软研究员在ImageNet计算机视觉识别挑战中实现里程碑式突破

计算机的“眼”进化到哪一步了

人脸识别:应用开启创新潮,算法进展才起步

刷新神经网络新深度:ImageNet计算机视觉挑战赛微软中国研究员夺冠

计算机能“理解”多少我们的语言了?

会听、会说、会聊天:人工智能语音识别技术的漫漫长路

计算机的各种模拟感官不断发展,也让我们对人工智能提出了更高要求。小说中提到的人工智能无疑是拥有情感计算能力的高级人工智能,但这些拥有情感的人工智能带来的结果在小说中却繁复多样。那么我们究竟需要怎么样的人工智能呢?

相关阅读:

人工智能,一个很好的“左脑”

 

难辨真假——虚拟现实与增强现实

虚拟现实中的“virtual”是一个非常有意思的单词,它既有“虚拟”的意思,同时也有“事实上的”意思,这也许正是未来虚拟现实技术给我们的体验——难辨真假。虚拟现实是利用电脑模拟产生一个三维的虚拟世界,给用户视觉、听觉、触觉等感官体验,让用户身临其境,没有限制地观察空间内的事物的技术。Riding with the Duke》(Vol.5 与公爵同行)这部小说就精彩的讲述了虚拟现实技术是如何改变一个普通人的生活。

那么虚拟现实到底离人们的日常生活有多远呢?

此前,微软已经与NASA合作,将HoloLens成功送入太空,进入国际空间站,让专家能够远程指导宇航员完成一些不熟悉的任务。我们希望在未来,会有更多的虚拟现实和增强现实技术帮助人们完成更多不可能的任务,创造更多惊喜。

 

发展中的量子计算

至今为止,几乎所有计算机的原型都是图灵机,但以量子比特作为储存单位的量子计算机将在未来颠覆计算能力这一概念。《The Machine Starts》(Vol.2 运算开始)正是描绘了当我们拥有了量子计算机,世界可能发生的不可思议的变化。

微软研究院量子计算领域专家Krysta Svore曾预测,未来我们将通过云与量子计算机相连,解决传统计算机解决不了的问题,例如我们将能够更有效地生产人造肥料或从空气中提取含碳废物。当量子计算机真正出现在我们生活中的那一天,也许不仅仅是亿万倍计算速度的提升,可能是一个全新的世界将展现在我们眼前。


科幻反哺科技、让脑洞定义未来

受微软黑科技启发,在这9篇小说里我们能够发现一些小说技术设定的原型已经能在现实生活中找到他们的踪迹。例如在《Vol.1你好,你好》中拥有自主学习能力的语言翻译系统和《Vol.9 世界的另一种说法》中的“星球通”手持翻译器就可以在微软实时语音翻译Skype TranslatorMicrosoft Translator中找到原型。目前,Skype Translator能让用户采用视频交流的方式进行实时语音翻译,而Microsoft Translator还能支持智能手环、手表与手机之间的交互,让翻译交流更为简便。此外,微软聊天机器人小冰24小时“住”在手机里,为用户提供一定的感情支持,不也是多篇小说中拥有自主情感能力的人工智能的雏形吗!

怎么样,这些脑洞大开的科幻故事有没有为你开启新世界呢?你还有没有在小说中读出更多黑科技呢?用科幻反哺科技、让脑洞定义未来!不久前,来自微软研究院的16位顶级科学家还一起展望了2016年的技术发展和未来10年的技术走向,相比于距离我们尚还遥远的《Future Visions》,16位科学家的展望则显得与大家更为贴近。

推荐阅读:

从人工智能、数据科学到密码学:微软16位顶尖科学家的2016年展望


有了这些技术知识背景的武装,这本《Future Visions》相信你都已经能看懂啦~要是还有什么不懂的问题,就请在下方留言,说不定Dr.田就会为你解答哦~

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

机器学习的盛宴:NIPS 2015

$
0
0

作者:微软亚洲研究院实习生:林添

冰雪王国的浪漫 机器学习的盛宴

NIPSAdvances in Neural Information Processing Systems,神经信息处理系统进展大会)是每年12月由NIPS基金会主办的机器学习和神经计算领域的顶级会议,它由连接学派(connectionist)神经网络的学者于1987年在加拿大创办,后来随着影响力逐步扩大,也曾移师美洲、欧洲等地举办。每年大会都吸引了机器学习、人工智能、统计等领域的众多国际专家地参与。近年来,在工业界和科学界,神经网络构建的深度学习方法取得了很多突破性的进展,在计算机视觉、语音识别、自然语言处理等领域也出现了大量的创新应用,NIPS在机器学习领域的学术影响力变得举足轻重。

本次NIPS大会在加拿大魁北克省的蒙特利尔举行。蒙特利尔位于五大湖和圣劳伦斯河河口,是加拿大仅次于多伦多的第二大城市,同时也是加拿大的经济之都,拥有发达的金融、电影、设计、航空产业。加拿大是是冰雪的王国,得益于此,蒙特利尔最受欢迎的运动便是冰球。这里还有很多繁华的地下城,即便是外面大雪纷飞,里面依然灯火通明。蒙特利尔更有众多欧洲与北美风格融合的建筑,吸引了众多好莱坞大片来这里取景。下图便是蒙特利尔神圣、典雅的圣母院大教堂,加拿大著名歌手席琳·迪翁的婚礼就是在此举行。 

2015年的NIPS大会于127日至1212日在蒙特利尔的国会会展中心举行。大会获得了包括微软在内的多家知名IT企业的大力赞助。今年共有3755名来自世界各地的研究人员注册并参加了会议,相比去年参会人数几乎翻倍。此次大会覆盖的内容除了机器学习和神经科学领域,还包括认知科学、心理学、计算机视觉、统计语言学和信息论等多个领域。

大会日程包括教程(tutorials)、大会会议(conference sessions)、专题座谈会(symposia)和研讨会(workshops)四个部分。本次大会一共收到1838篇投稿,录用论文403篇,录取率为21.9%,论文淘汰的数量十分庞大。在这四百多篇论文中,论文方向极其多样化,其中占比最大为深度学习相关论文,占403篇录取论文中的11%,其次凸优化方向占了5%、统计学习理论占了3%。此次大会的论文展示环节主要包括口头报告(oral)、聚光灯(spot light)和海报(poster)三种展示形式。NIPS是计算机领域少数坚持单轨制(single track)的会议,这一制度这能让参会人员更加专注于会议报告本身,但也使得录取论文的展示时间相对有限。因此,仅有15篇论文获得了宝贵的20分钟口头报告的机会。同时,少量论文获得了5分钟时间的聚光灯展示,而剩余绝大部分的论文展示都是海报为主。

 

智慧激荡的论文 引人深思的讨论

本次会议由大会主席Terrence Sejnowski致开幕词,常任主席Corinna CortesNeil Lawrence介绍了本次会议的投稿、审议标准和论文录用等情况,这也揭开了NIPS2015的帷幕。本次大会的最佳论文奖颁给了“Competitive Distribution Estimation: Why is Good-Turing Good”(http://papers.nips.cc/paper/5762-competitive-distribution-estimation-why-is-good-turing-good.pdf)和“FastConvergence of Regularized Learning in Games”(http://papers.nips.cc/paper/5763-fast-convergence-of-regularized-learning-in-games.pdf)两篇论文。

Competitive Distribution Estimation: Why is Good-TuringGood”这篇论文属于统计学习的理论研究范畴,它对估计离散变量的分布律这一普遍问题,提出了基于Good-Turing估计量的两种改进方法,借助对先验的最优估计量,给出了针对任意分布律的近似最优的高效估计。论文不仅指出这两种方法可以快速收敛,同时还给出相应的理论分析。

Fast Convergence of Regularized Learning in Games”这篇论文属于博弈学习研究方向。博弈学习被广泛研究,而该文章中指出一类正则化的学习算法可以大大改进带问题本身有近期偏差(更倾向于近期的回报)的结果,它甚至可以被拓展到多玩家博弈的均衡问题。论文扩展了之前工作研究的二人零和博弈问题,指出在一类问题中如果每个玩家各自使用最优算法将达到更快收敛速度,大大拓展了原有理论对博弈的理解。

 Interactive Incremental Question Answering”则获得了本届大会的突出展示奖。类似于微软亚洲研究院几年前推出的人立方系统,该展示系统能够根据用户给出的人物事实性描述和背景,去猜测出用户希望知道的人名。在展示系统中,用户可以给出几句英文的描述,而系统基于依赖树的递归神经网络,学习用户意图,在语料库中能够找到答案,给出精准的回答。这一系统在大会上大受好评。

除了获奖论文,大会上还有很多令人印象深刻的报告。“Interactive Control of Diverse Complex Characters With Neural Networks”(http://papers.nips.cc/paper/5764-interactive-control-of-diverse-complex-characters-with-neural-networks.pdf)文章则研究了如何借助递归神经网络作为运动控制器的问题。在不进行运动捕捉以及任务相关的特征设计的前提下,实现了让不同形态和动力系统机器人做出像游泳,飞行,双足、四足行走等运动。

Sampling from Probabilistic Submodular Models”(http://papers.nips.cc/paper/5744-sampling-from-probabilistic-submodular-models.pdf),这篇文章研究了一个有趣的采样方法。次模函数是经常出现在经济或计算机领域选址、覆盖、图像背景分割等问题中常见的函数,它描述了边际效益递减的一类特性。作者针对采样概率是次模函数的函数值问题,提出了基于吉布斯采样的方法,不仅保证多项式时间的复杂度,且具有很好的混合时间。

此外,在专题座谈会上,众多专家、学者们还在分会场中开展了有趣而深刻的对话和讨论。“我们周边的算法:机器学习的社会影响力”专题中关于机器人伦理的话题就很有意思。例如自动驾驶技术上就有一个两难问题(Tunnel Problem)亟待解决:设想你坐在一辆自动驾驶的汽车上,沿着山路的单行线行驶,此时突然有个小孩闯入道路,来不及刹车的情况下,就会面临两难选择:是径直向前,可能直接撞死小孩;还是撞向山崖,可能掉下悬崖?换句话说,自动驾驶的汽车应如何反应?又由谁来决定汽车的决策方式?这一类问题的核心其实是,对于机器学习算法中存在的决策失败概率(风险),或者人类和机器的决策存在冲突时,我们该如何从法律、技术、道德等角度进行约束。

图片来自互联网


触手可及的未来 博采众长的前行

NIPS大会在展示了相关领域最新研究成果的同时,也预示了机器学习的未来的发展趋势。

首先是神经网络架构进一步复杂化。在图像、机器翻译等领域,越来越多的研究人员开始选择LSTM,利用不同的感知机、目标函数,卷积或者递归架构神经网络,在实际项目中实现更多有意思的应用。通过随机方法近似(stochastic approximation)的算法也受到不少关注。

其次是自动推断和黑盒学习技术的发展。今年大会上出现了不少和自动推理技术相关的论文,即通过机器自动推断模型、预测结果。而工程领域的强劲需求也促生了更多可以快速迭代、低学习曲线的算法和系统,例如在本机大会上崭露头角的STANpython-autograd等工具。

此外还有对概率推断的再审视。本次大会和研讨会中,出现了一些对于概率推断新认知的声音。正如同期发表在《科学》杂志上的论文(http://science.sciencemag.org/content/sci/350/6266/1332.full.pdf)所呈现的一样,相比深度学习对于大数据的需求,这种小样本甚至单个样本的模型都能得到不错的预测结果,也促使我们重新审视人类大脑的思维和认知方式。



对于我个人来说,这是我在NIPS上的第二篇论文。去年,我参与合作的以在线机器学习中组合问题的纯探索策略研究方向的论文有幸在NIPS的进行了口头报告。今年,在之前的基础上,我们深入研究,论文“Stochastic Online Greedy Learning with Semi-bandit Feedbacks”(https://papers.nips.cc/paper/5930-stochastic-online-greedy-learning-with-semi-bandit-feedbacks.pdf)被大会录用,并受邀于9号晚上7点至12点进行海报展示。这篇论文是与清华的李建老师以及微软亚洲研究院的陈卫老师合作,我们针对在线机器学习领域的组合学习策略研究,提出了一类新的模型,刻画了贪心的学习方法在解决老虎机问题(bandit)中应用。我们提出的模型能够借鉴贪心算法的优点,多次采样进行参数估计,求解该问题。

本文作者的论文海报

论文海报展示的过程也弥足珍贵,在国内,我们精心制作了2.4x1.2m的大幅海报,并进行了多次的展示演练。在现场展示过程中,我们获得了很多教授、研究员和同学的关注和驻足聆听。通过讲解自己的研究,回答听众们的问题,我将自己的成果分享给了在场的听众,同时,我也得到了很多同行们的建议与意见。通过与相关领域专家学者的深入交流,我也迸发出了更多的新想法,与会经历受益匪浅。


关于作者:林添,是微软亚洲研究院的一名实习生,也是清华大学高等研究院和微软亚洲研究院联合培养博士生,本科毕业于清华大学计算机科学实验班,主要研究方向为机器学习和社交网络分析,曾在ICMLNIPSEC等发表多篇论文。

 

 

 


了解微软亚洲研究院实习生项目,欢迎关注“明日之星”实习生项目介绍。更多实习机会请见:http://www.msra.cn/zh-cn/jobs/interns/internopenings.aspx

 

下载微软研究院在此次大会所有论文:Deep learning, machine learning advancements highlight Microsoft's research at NIPS 2015

推荐阅读

走近SIGGRAPH ASIA 2015

当学术邂逅浪漫 – 记MobiCom 2015大会

来自澳洲的数据秀场:记KDD 2015大会

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

刘铁岩:在微软大学的三次华丽转型

$
0
0

一个理想的研究人员成长轨迹应该是什么样的?  

微软全球执行副总裁沈向洋博士认为一个酷酷的研究员应该是这样的:“挑选一个雄心勃勃的目标,致力于端到端的研究,长久的坚持,而他的研究伙伴们也应该有着同样的激情,但最重要的是始终乐在其中。”

如果以这个标准来看,微软亚洲研究院首席研究员刘铁岩博士可谓是研究员的范本。2003年,从清华大学电子工程系博士毕业之后,刘铁岩直接进入了微软亚洲研究院,在这一待就是十余年。这十多年间,刘铁岩博士由原本的多媒体信号处理方向的博士,逐步成长为国际机器学习和信息检索领域的知名学者。这些转型在外人看起来十分巨大,但“三清”(本科、硕士和博士都就读于清华大学)出身的刘铁岩博士说:“微软亚洲研究院其实是我的第二所大学,这是一个培养人的地方,有了她的帮助,这一切其实过渡地非常自然。”


开放环境带来的首次转型

在结束了九年的清华校园学习时,摆在刘铁岩面前的选择有很多,例如知名大学教职等等,而微软亚洲研究院吸引刘铁岩的除了全球领先的研究环境之外,更重要的是可以和自己敬仰已久的顶尖行业大牛一起工作,对于一个刚开始入行的年轻研究员来说无疑动力巨大。因此,刘铁岩于2003年正式加入了微软亚洲研究院,并由原来的多媒体信号处理方向的研究转入了互联网搜索与挖掘领域,从此开始了对信息检索这一全新领域的探索。

这是刘铁岩在研究院的第一次转型,但这次转型并不像人们想象的那么艰难,因为微软亚洲研究院为研究人员提供了一个十分开放的科研环境,让研究员们有充分的自由和资源来调整自己的研究兴趣。在这里刘铁岩和很多不同研究方向的资深研究员们进行了交流,其中包括他后来的老板,现在的微软亚洲研究院常务副院长马维英博士。同时,借助研究院这个平台刘铁岩还与众多国际知名学者进行了深入交流,进一步拓宽了其科研视野,刘铁岩博士首次转型的领路人便是卡内基梅隆大学的文本分类领域的资深专家杨颐明授。2004年暑假,正处于转型期的刘铁岩博士遇见了前来微软亚洲研究院交流的杨教授,便一拍即合地展开了合作。他们当时共同搭建了当时世界上最大的、近三十万类的文本分类系统,相关论文收到了广泛关注,短短几年间就被引用了数百次。这次和杨教授的合作也成了刘铁岩进入到文本信息处理领域的第一个敲门砖。从那个时候起,铁岩开始了解什么是信息检索,什么是文本分类系统,他的首次转型也逐步成型。

 

挑选一个雄心勃勃的目标:排序学习

第一次转型之后,刘铁岩作为信息检索领域的新人,始终保持着旺盛的好奇心,不断思考着能为这个领域带来哪些新东西。当时围绕搜索引擎所开展的研究十分火热,信息检索更是人们关注的重中之重。通过大量的文献研究,刘铁岩发现这个方向大多数的研究者都是数字图书馆专业背景,因此研究方法都偏向经验化,缺少了对于优化系统方式和目标的科学思考。

基于对行业的洞察,刘铁岩开始深入学习机器学习的相关知识,并试图把机器学习的思想引入信息检索领域。由此,刘铁岩博士在学术界的第一个成名工作——排序学习(learning to rank)就这样诞生了,该方法为信息检索领域带来了重大变革。

随后,刘铁岩的研究便围绕排序学习展开。在20072008年,刘铁岩和他的团队在SIGIRWWWICML等顶级学术会议上发表了大量的关于排序学习的论文,还在主流会议上做主题讲座、主持专题研讨会。他的表现受到了学术界越来越多的关注,更多的研究人员跟随他进入到这个领域中来,短短的几年时间刘铁岩及其团队的研究实力便在全世界的信息检索领域内遥遥领先。而刘铁岩博士出的第一本学术专著也与排序学习相关。该专著已被多所大学作为教科书、并被其他学者引用了近千次。

 

致力于端到端的系统性研究

2008年到2009年左右,排序学习领域尽管很繁荣,但是多数人仍把排序学习作为应用级的研究。在机器学习领域的主流学术会议中,排序学习通常也会被分到应用领域(application track)。

刘铁岩很快就发现了这其中的原因:一个研究领域如果缺少科研理论的话,是无法被广泛认可的。因此在后来的几年时间里,刘铁岩和他的研究团队花费了大量时间从理论的角度把排序学习领域正式化,去阐述这个领域是什么、目标是什么、各种算法的关系是什么、有什么样的理论性质等等。他们在ICMLNIPSCOLT等顶级机器学习会议上发表了大量排序学习的理论文章,即使到今天这些论文的影响力也十分深刻。在这整个的研究周期内,刘铁岩及其团队把排序学习打造成一个完整的研究领域,并通过从算法到理论的一系列研究成果,让这个领域真正的火了起来,刘铁岩也成了这一研究领域当之无愧的代表人物。

这就是微软亚洲研究院里一个典型的研究案例。刘铁岩在微软内部的导师Rakesh Agrawal院士曾告诉他:“对于研究人员来说,并不是为了发表论文而发论文,而是要在特定的历史阶段,针对一个重要的问题,从表面到核心全部做到位。”一直到今天,排序学习一直都是很多会议的主要方向之一,仍然有很多学者在进行研究。正是因为这些工作,刘铁岩博士完成了他的第二次转型——由信息检索转变到了机器学习。

 

第三次转型:博弈机器学习

图片来源于网络

在微软亚洲研究院,研究员的研究成果除了作为论文发表出来之外,还会应用到微软的各个产品中。通过与产品部门合作,研究员们可以发现实际应用中的新问题。刘铁岩团队与微软的在线广告部门的合作就是其中一个非常有代表性的实例。

这项合作始于排序学习,刘铁岩和团队成员帮微软广告部门离线训练了一个效果极佳的机器学习模型用于必应广告搜索中的竞价排名。上线之初模型立刻带来了很大的效益,但随着时间的推移,广告效益却大打折扣。刘铁岩和他的团队发现了这个问题,并找到了奇怪现象的根源:广告竞价排名过程常常涉及到人(广告主)的因素,广告主会因为算法的改变带来的价格变化,敏锐地调整自己的广告投放策略,这是一个动态过程。如果不考虑经济规律和人的动态策略,离线地进行机器学习模型的训练,结果自然会产生很大的偏差。

如果想把广告竞价这个动态问题解释清楚,仅有机器学习的知识背景显然是不够的。所以刘铁岩便带领其团队开始学习博弈论,计算经济学等等,组名也改成了“互联网经济研究组”,这便是他第三次转型的开始。在这个转型过程中,他发明了一种全新的技术,称为博弈机器学习,把博弈论的思想引入到机器学习的过程中,来对人的动态策略进行建模,从而解决上文提到的难题。

如果你了解博弈论和机器学习分别是什么的话,就会发现这两个领域差别巨大,完全是不同的体系,那么这次转型的难度也可想而知。刘铁岩博士说:“对于任何一位研究人员,如果不是在微软亚洲研究院的话,这种转型都是非常困难的。因为,如果你开始学习新东西,想要有这个领域的人认识、认可你,并产生顶级的影响力是十分艰难的。但当我们真正去做的时候,发现微软亚洲研究院给了我们很多帮助,这让我们对新领域的研究变得轻松不少。”当刘铁岩和他们组的研究员们开始涉足互联网经济领域时,不仅有来自微软其他研究院在博弈论领域颇有建树的同事(如Noam Nisan)的帮助、也有很多来自学界的博弈论专家(如邓小铁教授、叶荫宇教授等)抛出了橄榄枝。他们互相访问,一起参加各种学术活动,互相交流,在很短的时间内,刘铁岩他们就对博弈论这一研究方向有了很多深刻的认识:不仅在算法博弈论领域的顶级会议上发表了多篇论文,还在互联网经济研究组成立不到两年的时间里,以程序委员会主席的身份把全世界第二的算法博弈论会议——互联网经济大会(WINE)带到中国。


黄金三镖客:电子,数学和计算机

微软亚洲研究院 人工智能组

三次转型,成就了刘铁岩博士一路创新不断的探索和发现,然而这背后也离不开其整个研究团队的支持与努力。现在,刘铁岩博士带领的团队更名为“人工智能组”,继续在当下火热的机器学习和人工智能领域进行深耕。不久前,微软亚洲研究院对外开源的DMTK(分布式机器学习工具包)便是这个小组的研究成果。

如果给这个研究组寻找一个关键词的话,那一定是“求知欲”。从刘铁岩的三次转型中也不难发现,现名为人工智能组的研究员们绝非循规蹈矩之人,他们有着强烈的求知欲,就像初生牛犊不怕虎一样,知难而进,什么不会学什么,什么难做什么,朝气十足。

而另一方面,该团队的组合十分有趣,就像微软亚洲研究院的一个小小缩影一样。研究员们的专业覆盖面既不是全部精钻于机器学习,也不是全部埋头在博弈论上。目前,人工智能组有三分之一的研究员出自数学系,专业包括计算数学、概率论和组合数学,这涵盖了该团队所需要的所有数学基础。另外三分之一的研究员,包括刘铁岩在内都是来自电子工程专业,刘铁岩博士认为,电子工程专业出身的人有一个很大的优点便是有着非常好的直觉,并且不局限自己的思路,十分开放。而其余三分之一的研究员则是计算机专业出身,他们都拥有很强的计算机技能。当数学、电子和计算机三拨精英碰撞在一起的时候,就没有什么研究方向能难得住他们了。

此外,人工智能组还是一个十分重视学术和工程实践相结合的团队。他们的很多启发与灵感都来自于与微软产品部门的合作,因此,这是一个不断提出新问题的团队。在人工智能组发表的论文中你可以看到一个很明显的特点:团队很少循规蹈矩地解决别人提出的问题,而是经常提出新的问题,并给出一个力所能及范围内的最优解。这样的论文常常有很高的引用数,平均下来,刘铁岩和他的团队发表的论文几乎每篇都有上百次的引用。

三次转型带来了如今人工智能研究组的团队凝聚力。一加一大于二,小组的很多论文都有至少一个电子,一个计算机和一个数学背景的研究员参与,这样的论文都非常有特点,也能满足各种要求,无论是定力证明、直觉、还是实现的精巧,都可圈可点。

 

“争吵文化”与“真理不辨不明”

刘铁岩博士带领的人工智能组还有一个十分有趣的“争吵文化”。在接受采访时,笔者对刘铁岩博士嘴里说出的“争吵文化”感到十分难以置信。坐在对面的刘铁岩博士穿着经典款的男士衬衫,外套一件淡灰色的羊毛开衫,学院气息浓厚,让人似乎很难将他与“争吵”联系在一起。

“我们团队几乎会天天争吵。”刘铁岩博士笑言。但这其实是研究组最有活力的状态,开会的时候,大家不会在乎职位高低,就一个问题会针锋相对地表达自己的观点。人工智能组全组上下都坚持的一个信条是“真理不辨不明”。在刘铁岩的带领下,整个组会相互批判的看问题,就连待久一点的实习生也会自然的融入其中,和他的导师间也是一种互相辩论,互相学习的关系。

因此,对于实习生来说,进入微软亚洲研究院会带来巨大的成长。首先是知识的积累,很多实习生在进研究院之初知识非常有限。但微软亚洲研究院计算机专家资源密集,超过两百名的计算机专家们的研究经历、方向和视角各不相同,向他们学习一定会有所收获。其次,实习生们在这里学会的更多是研究经验和研究方法,“争吵文化”在这里便得到了很好的体现。无论是什么大牛发了什么论文,都应该抱有一种“破坏性”的思想,先客观地分析,从中立甚至批判的视角来研究。因此,人工智能组培养出的实习生也都个性十足,颇有“小牛”风范,从不盲目崇拜。

 

在微软亚洲研究院大学:成长于中国,却能影响世界

作为三清毕业的博士、微软亚洲研究院首席研究员,刘铁岩博士的研究之路始终都未离开中国本土。而作为国际机器学习和信息检索领域的知名学者,他的国际影响力也毋庸置疑。刘铁岩的论文多次获得最佳论文奖、最高引用论文奖;他担任了SIGIRWWWNIPSAAAI等众多顶级学术会议的程序委员会主席或领域主席,ACM信息系统会刊(TOIS)、ACM万维网会刊(TWEB)等主流学术期刊的副主编;他和他的研究成果也被美国国家公共电台、中国中央电视台、MIT技术评论等国内外知名媒体所报道。此外,他还受邀在包括卡内基梅隆大学(CMU)、诺丁汉大学在内的国内外知名高校担任客座教授、博士生导师。对于所获得的诸多成就,刘铁岩无不感动地说:“最重要的原因其实是我来自微软亚洲研究院,如果我博士毕业没有来到研究院,我都不敢想象会有今天的影响力。”

微软亚洲研究院从199811月成立的第一天开始,就在国际学术界扮演着举足轻重的作用。这么多年来,研究院以一贯开放的心态,与学术界展开积极的合作,而研究院开放的学术环境也为研究人员们构建了一座与学术界的桥梁,两者相辅相成。甚至有国外学者戏称微软亚洲研究院是一个让人“又爱又恨”的机构。爱在它的研究成果,为学术界带来了诸多创新,也“恨”在其彪悍的实力,让别人望尘莫及。

除了学术合作,微软亚洲研究院为研究员们还提供了接触用户,服务用户的可能。微软亚洲研究院的研究员也和微软的产品部分积极展开合作。刘铁岩博士带领的人工智能组的技术转化也体现在微软必应搜索的搜索结果排序和广告排序,小冰的自动问答技术等微软的产品和服务中。

刘铁岩博士谦虚的表示,“能成为包括CMU在内的众多知名高校的客座教授,很大程度源于学术界对微软亚洲研究院的信任。甚至人工智能组的实习生,也成为了CMUoffer收割机,这都得益于我们开放的科研环境和紧密的学术交流。因为微软亚洲研究院,我们的研究被更多人关注,我们的新人也被更多人认可,这就形成了一个良性循环。类似于国外的师承关系,从这个角度来看,微软亚洲研究院着实就像是一所大学了。”

 

推荐阅读

微软亚洲研究院开源分布式机器学习工具包

方兴未艾的计算广告学

来自澳洲的数据秀场:记KDD 2015大会

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:



 

【微软亚洲研究院年度合集】这些是你一定不能错过的

$
0
0

小年将至,不知道现在看到这篇推送的你是正准备回家过年呢,还是已经回到了家中呢?这一年临近尾声,这时候总少不了对过去一年的盘点和总结。

微软亚洲的微信微博已经拥有了很大一批的固定粉丝,感谢各位一直以来的信任与陪伴。无论你是何时开始加入微软亚洲研究院这个“田村”大家庭的,总有一些遗珠你可能没有看到。

为了不让你错过微软研究院最前沿的技术突破,最有用的开源工具,最干货的大会分享……小编特意根据推送文章的阅读量和打开率等数据作为参考,给大家精心挑选了以下文章作为推荐。大家可以根据对应的描述和自己的喜好各取所需,点击链接即可进入对应的文章。

【年度技术创新观点合集】计算机视觉,自然语言,机器学习…你想了解哪个?

人工智能是什么?我们又需要怎样的人工智能?计算机科学家们试图利用计算机强大的计算能力来模拟人类的一些基本的感官能力。随着机器学习和大数据的日渐发展,计算机已经逐步会听、会说、会看……

该合集从计算机模拟人的多项感官入手,对计算机的视、听、说等能力进行深度解读。微软亚洲研究院的人工智能发展到哪一步啦?看完你就知道。

【年度开源、工具合集】牛津计划,DMTKGraph Engine…提高你的工作效率!

该合集包括以下三个部分。

1微软亚洲研究院过去一年的所有开源合集,如分布式机器学习工具包DMTK等。

2利用微软研究院的技术提高工作效率工具合集,如让没有机器学习背景的开发人员也能开发出智能应用的牛津计划等等。

3包含微软研究院技术转化的应用合集,如微软自拍,微软绝句等等。

【年度学术大会合集】SIGGRAPHKDDAAAINIPS…这些你想参加的会议

据统计在计算机领域,如果对全世界的大学、科研机构和公司进行排名的话,微软研究院无论是在论文数量、论文引用数、还是最佳论文数量上都稳居世界前列。微软研究院始终坚信,发表论文以及参与学术大会始终是进行技术交流的一种极佳方式。在过去一年内,微软亚洲研究院走出国门、参与大会的研究员和实习生们的数量数不胜数,相关的论文也颇为优质。

参加XXX大会是什么样的感受?无论你是否参与过国际学术大会,这份合集涵盖了从年初的WSDM直至年末的NIPS等众多计算机领域的主流大会,总有一款满足你的需求。

【年度励志合集】是鸡汤,还是干货?

漫漫科研路,有辛酸也有喜悦。也许你曾遇到过问题踟蹰不前,也许你也遇到过春风得意,让人欢欣鼓舞之时。在这份年度励志合集中,微软全球资深副总裁洪小文博士会教你做科研的时候需自信与谦虚并行;2015 Johnvon Neumann Lecture Award的获得者,微软新英格兰研究院和微软纽约研究院院长Jennifer Chayes会教你如何平衡好工作和生活;微软学者奖学金获得者为你示范优质博士的养成之道。这也许是鸡汤,但仔细一看,鸡汤还带勺哦!

【年度研究院活动合集】从编程之美到二十一世纪的计算大会…

你也许还没有参加过微软亚洲研究院的活动,但是你一定听过这些名字。编程之美、微软学生夏令营、二十一世纪的计算大会、微软亚洲研究院 “合作创 • 研” 年会……微软亚洲研究院面向学生与高校组织的活动众多,与学术界积极展开合作,让基础研究和前沿技术点亮更多人的灵感之光!

看完微软亚洲研究院年度合集,说不定今年的编程之美,就能看到你的身影哦!

【年度视频合集】小进步,大飞跃

文字能表达的内容非常有限。看完上述内容之后,来看些视频轻松轻松吧!在微软眼中5-10年后的世界是怎么样的?Microsoft Hyperlapse是如何让第一人称视频更快更流畅的?Skype Translator实时语音翻译技术到底有多神奇?看完你就知道!


推荐阅读

【微软亚洲研究院年度合集】这些是你一定不能错过的

【年度技术观点合集】计算机视觉,自然语言,机器学习…看看顶级科学家们怎么说

【年度开源、工具合集】牛津计划,DMTK,Graph Engine…提高你的工作效率!

【年度学术大会合集】SIGGRAPH,KDD,AAAI,NIPS…这些你想参加的会议

【年度励志合集】是鸡汤,还是干货?

【年度研究院活动合集】从编程之美到二十一世纪的计算大会…

【年度视频合集】小进步,大飞跃

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

【年度开源、工具合集】牛津计划,DMTK,Graph Engine…提高你的工作效率!

$
0
0

本篇合集包括以下三个部分的内容:

1、微软亚洲研究院过去一年的所有开源合集,如分布式机器学习工具包DMTK等。

2利用微软研究院的技术提高工作效率的工具合集,如让没有机器学习背景的开发人员也能开发出智能应用的牛津计划等等。

3、包含微软研究院技术转化的应用合集,如微软自拍,微软绝句等等。

微软亚洲研究院过去一年的所有开源合集

2015520日,微软亚洲研究院Graph Engine 1.0预览版正式发布。Graph Engine是一个基于内存的分布式大规模图数据处理引擎,能够帮助用户更方便地构建实时查询应用和高吞吐量离线分析平台。Graph Engine在学术界有个更广为人之的名称是Trinity。此外,Graph Engine 还可与强大的集成开发环境Visual Studio以及微软云计算平台Azure无缝集成。无论本地开发还是云端部署,Graph Engine都可以给开发者带来极佳的用户体验。了解更多↓↓↓

大规模图数据处理小能手来了~


201561日,微软亚洲研究院系统组开发的分布式系统开发框架——Robust Distributed System Nucleus通过GitHub平台正式开源,rDSN将为广大的开发者、学生和研究人员提供一个快速搭建和运维高性能和高鲁棒的分布式系统的开放式框架。rDSN内置了一些开发运维工具和分布式框架,包括自动测试,错误重现,()自动复制等,都能无缝集成基于rDSN的应用,帮助解决“瘫瘫瘫”的问题。了解更多↓↓↓

分布式系统开发神器强势来袭!


2015720日,微软研究院软件无线电项目Sora 正式通过GitHub开源。Sora是一个完全可编程的高性能软件无线电系统,能够快捷而有效地实现当前最前沿的无线通信技术。软硬件平台的创新使得SoraPC上就可以完成高性能的无线信号处理。自2009年首次发表以来,Sora已在学术界获得多项最佳论文和演示大奖。目前,已有50多家大学和科研机构在教学和科研中使用Sora。为了满足研究者们日益迫切的研究需求,完全开源的Sora系统提供了大量特性,其中包括:支持定制的射频前端,RCB和通信模式。了解更多↓↓↓

软件无线电系统哪家强?

20151110日,微软亚洲研究院于日前将分布式机器学习工具包(DMTK)通过GitHubhttps://github.com/Microsoft/DMTK)开源。DMTK由一个服务于分布式机器学习的框架和一组分布式机器学习算法构成,是一个将机器学习算法应用在大数据上的强大工具包。无论是学术界的研究人员还是工业界的开发者,DMTK可以帮助他们在超大规模数据上灵活稳定地训练大规模机器学习模型。当前版本的工具包包括三个部分:1DMTK分布式机器学习框架(参数服务器+客户软件开发包SDK);2LightLDA(用于训练主题模型的高效算法);3,分布式词向量。了解更多↓↓↓

【开源】分布式机器学习工具包

20151216日,微软亚洲研究院系统算法组开发的图数据库GraphView通过GitHub平台开源。GraphView是一款中间件软件,方便用户使用关系数据库SQL Server Azure SQL Database高效地管理和处理大规模图数据。GraphView 在物理数据表达以及系统运行行为上和原生图数据库完全一致,填补了关系数据库和图数据库之间的鸿沟。它还继承了关系数据库领域数十年的科研成果,可以提供市面上原生图数据库难以媲美的性能。GraphView的功能包括:完备的查询语言,索引,事物处理和系统管理等等。了解更多↓↓↓

微软亚洲研究院开源图数据库GraphView

利用微软研究院的技术提高工作效率的工具合集

微软牛津计划

假设你是一名对关于健身的应用充满奇思妙想的开发人员。在你的理想世界中,它包含各种酷炫的功能,例如从照片中识别出用户,或能够理解锻炼者对它所发出的启动和停止追踪一段跑步的指令。但是,这些多样的功能都只能通过复杂先进的机器学习来实现,而你却没有实现它们所需的时间或资源。

20154月,在美国旧金山举行的Build 2015开发者大会上,微软提出了一种解决方案,一组被称为“Project Oxford”(牛津计划)的技术,将允许开发人员创建更智能的应用,即使这些应用的开发者并非机器学习相关领域的专家,也可以实现人脸识别和自然语言解析等功能。牛津计划首次开放的内容包括:人脸识别(Face APIs)、语音识别(Speech APIs),计算机视觉(Computer Vision APIs)和语言理解智能服务(LUIS)。↓↓↓

微软Project Oxford帮助开发人员创建更智能的应用

牛津计划发布之后,便受到了广大开发人员的欢迎。201510月,牛津计划中的语言理解智能服务(LUIS)的覆盖面进一步扩大,包括测试版的推出、支持中文和提供更多的预设模型。此外,牛津计划面部识别、可视化工具和语音识别SDK的测试版也可以通过GitHub获取。↓↓↓

【牛津计划】拥抱机器学习,再次升级 

201511月,Movember(胡子月)这个活动吸引了大家的注意。每年的11月是胡子月(Movember),大家用蓄须的方式号召大家关心男性健康。2015年,微软与Movember Foundation联手,通过MyMoustache.net号召更多人关注并参与到胡子月的活动中。MyMoustache.net能对你上传的人脸图像进行分析,给你的胡子做出评价,还会依据胡子长度,表明你的胡子长度击败了多少用户。没有胡子,该网站还能为你自动生成一个。

201511月,微软牛津计划再次更新,此次更新发布了面部情绪分析工具(Emotion APIs)、拼写检查(Spell Check APIs)以及人脸识别APIFace APIs)的更新。试试看对尔康表情包进行面部情绪分析吧!↓↓↓

【牛津计划】高兴,难过,还是生气?计算机替你察言观色

201512月,说话者识别APISpeaker APIs)和视频APIVideo APIs)推出,自定义智能语音识别服务(CRIS)也已经开放邀请。↓↓↓

【不再从零开始】微软牛津计划:让每一个智能应用都能说会看

微软牛津计划是由一系列基于云的机器学习相关的APISDK和相关服务等组成,期待更多强大功能?让我们一起期待2016年的更多开放内容吧!

微软学术搜索​

文献检索对于每一个从事学术研究的人来说都不陌生。微软亚洲研究院院长洪小文博士提到,做研究很重要的一个素质是knowledgeable(博学),即要了解自己研究方向的现状,也要对自己研究领域上不同方向的信息了如指掌。因此,拥有一个极为强大的学术搜索引擎也十分重要。

微软学术搜索是“微软学术”服务推出的免费学术搜索引擎,可以帮助用户全面、准确地查找学术论文、国际会议、权威期刊、研究专家及领域等专业学术资源。而为了方便用户使用,微软学术搜索已嵌入必应搜索引擎,在必应搜索首页就能找到哦。↓↓↓

从第一步,到每一步:微软学术搜索 

为了帮助你了解这个智能学术搜索引擎是怎么工作的,我们还提供了一套漫画为你讲解哦~↓↓↓

【都市传说】微软学术搜索图书馆背后的故事

近年来,国内外的学术界也一直在反思以引用数衡量论文质量是否合理,并开始倡导发展更加丰富多元、求真务实的评价机制,但落实到搜索引擎中,则苦于没有更为合理的排序策略能够取代传统的引用数排序。

不久前,由微软研究院和著名学术出版商Elsevier在第九届网络搜索与数据挖掘国际会议(ACM International Conference on Web Search and Data Mining,简称WSDM)共同举办的WSDM CUP WSDM挑战杯)上就以论文搜索排序为题,向学术界发出号召,旨在为学术用户探索出合理有效的论文搜索排序算法,以期改善文献检索体验。经过评选的最优算法最终会应用到微软学术搜索中哦,快去试试看吧!↓↓↓

颠覆传统,论文搜索排序由你定!


Quick Insights

大数据时代,很多重要的灵感都暗藏在数据的背后,你真的知道如何处理数据和分析数据吗?微软亚洲研究院和Power BI团队合作推出的Quick Insights功能,可以利用多种洞察模型自动分析数据,并将结果可视化地呈现,提供快速、专业、双向的数据分析服务。↓↓↓

成为数据专家,你只差一个Quick Insights的距离 


在这个部分的结尾,小编还要推荐一个计算机科学的学术好帮手,一个由微软研究院开发的网站Research Newshttps://www.researchnews.com)。目前,这个网站收录了大量顶级优质资源,包括顶级大会,期刊,相关网站等,它能帮你省下大量搜索信息的时间,从而更专心在自己研究上,让你不出实验室,也知天下事哦!

包含微软研究院技术转化的应用合集

聊完了看似高深的技术和工具,让小编给你带来一些生活中的微软应用吧!有了这些黑科技,你会发现生活竟可以如此美妙~

如果你热爱文学,那这些黑科技你肯定不能错过!微软字谜可以陪你猜字谜,当你输入谜面后,系统会自动给出谜底。不仅如此,系统还可自动生成谜面,当你输入单个字谜底后,它便能自动生成多个谜面供你选择;微软绝句则基于统计机器翻译模型,能够辅助你创作格律诗。你只需选择一些关键词生成首句,系统会自动推荐后续诗句哦!↓↓↓

元宵晚会猜灯谜利器

这个端午节,你有的不仅仅是粽子…

统计机器学习——让计算机学会吟诗作赋

如果你爱好旅行,这儿也有为你量身打造的强大应用↓↓↓

收拾行李的时候,也别忘了这些微软旅行神器

从贴心的天气预报到语言翻译,你的一切出行需求都由我们承包啦~

当然,旅行的过程怎么能少了拍照和摄像↓↓↓

拍延时视频哪有那么麻烦?一个手机就能搞定


针对喜欢自拍的你,还有微软自拍这一神器!它不仅能够针对自拍照片中出现的所有人脸的年龄和性别进行差异化一键自然美颜,还能自动进行智能降噪和曝光增强,无论光线环境如何复杂,都能让你拍出理想的照片。你知道吗,刚发布的两周内,就有近70万人下载了微软自拍哦↓↓↓

微软自拍:让黑科技拯救不会拍照的你


使用微软自拍停不下来,不小心拍了太多张怎么办?没关系,还有这些照片整理黑科技↓↓↓

假期结束,教你帮手机相册“减肥瘦身”


什么,还不够?那小编就再介绍一些高大上的产品!

Torque中文版是一款为安卓平台的中国用户度身打造,首个以手势驱动、语音交互的人工智能产品。Torque凭借革命性的创新界面、强大的语音功能和必应大数据技术,让安卓用户简单挥动手臂即可与智能手表和智能手机进行语音交互。是不是很帅气?↓↓↓

微软推出首个安卓平台可穿戴设备人工智能产品Torque中文版

由大数据拼接起来的虚拟望远镜——万维天文望远镜融合了来自全球数十个天文望远镜、天文台和探测器的观测数据,直观展现天体之间的关系让观测数据可视化。其中,深受天文学家与教育工作者喜爱的向导漫游功能可真实还原3D场景,无论是星体形成还是宇宙大规模结构探索都能让用户有身临其境的感受,满足你足不出户实现你漫游太空的愿望~↓↓↓

冥王星之外...




推荐阅读

【微软亚洲研究院年度合集】这些是你一定不能错过的

【年度技术观点合集】计算机视觉,自然语言,机器学习…看看顶级科学家们怎么说

【年度开源、工具合集】牛津计划,DMTK,Graph Engine…提高你的工作效率!

【年度学术大会合集】SIGGRAPH,KDD,AAAI,NIPS…这些你想参加的会议

【年度励志合集】是鸡汤,还是干货?

【年度研究院活动合集】从编程之美到二十一世纪的计算大会…

【年度视频合集】小进步,大飞跃

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

【年度学术大会合集】SIGGRAPH,KDD,AAAI,NIPS…这些你想参加的会议

$
0
0

据统计在计算机领域,如果对全世界的大学、科研机构和公司进行排名的话,微软研究院无论是在论文数量、论文引用数、还是最佳论文数量上都稳居世界前列。微软研究院始终坚信,发表论文以及参与学术大会始终是进行技术交流的一种极佳方式。在过去一年内,微软亚洲研究院走出国门、参与大会的研究员和实习生们的数量数不胜数,相关的论文也颇为优质。

参加XXX大会是什么样的感受?无论你是否参与过国际学术大会,这份合集涵盖了年初的WSDM直至年末的NIPS等众多计算机领域的主流大会,总有一款满足你的需求。


时间2014128日至1213

会议简称NIPS 2014

会议全称Advances in Neural Information Processing Systems,神经信息处理系统进展大会

地点:蒙特利尔,加拿大

关键词:深度学习、神经网络、机器学习

作者:微软杰出科学家、机器学习领域的领军人物John Platt

相关分享:了解机器学习的三大趋势→机器学习向何处去?


时间2015125日至130

会议简称AAAI 2015

会议全称:美国人工智能协会年会(AAAI the Association for the Advance of Artificial Intelligence

地点:奥斯汀,美国德克萨斯州

关键词:人工智能、机器人技术、机器学习、图灵测试、道德

作者:微软亚洲研究院应用算法组研究员黄铂钧

相关分享:人工智能的正确打开方式是什么→别恐慌,大众关心的人工智能问题学界都在努力求解

其他信息:大会总共收到超过2000篇投稿,最终收录论文500余篇。


时间2015131日至26

会议简称WSDM 2015

会议全称ACM网络搜索与数据挖掘会议,ACM International Conference on Web Search and Data Mining

地点:上海,中国

关键词:数据挖掘、网络搜索、数据分析

作者:微软亚洲研究院实习生钟文

相关分享:如何用好大数据→严谨与特色并行——WSDM 2015大会见闻记

其他信息WSDM非常重视论文质量——本届会议共收到238篇论文投稿,其中来自16个国家,44个科研机构的39篇文章入选,接收率仅为16.4%(比去年的18%又有所下降) 。此次会议的冬令营是本届会议新增环节,旨在为参会者尤其是学生介绍互联网搜索和数据挖掘相关基础理论和前沿科技,涵盖了深度学习、自然语言处理、社会网络、分布式机器学习等领域。


时间2015418日至423

会议简称CHI 2015

会议全称The ACM Conference on Human Factors in Computing Systems

地点:首尔,韩国

关键词:人机交互、个性计算、健康、搜索

相关分享:共同缔造更为个性化的计算体验→CHI 2015大会:着眼于更加个性化的人机交互

其他信息:约70位来自微软的研究人员在此次会议中出席并展示了他们最新的研究成果。从创建3D互动社区地图到提供优化网络搜索结果,展示内容涵盖的范围十分广泛。

时间2015518日至522

会议简称WWW 2015

会议全称The International Conference of World Wide Web,国际万维网大会

地点:佛罗伦萨,意大利

关键词WebLightLDA

作者:老师木!!!微软亚洲研究院研究员袁进辉

相关分享:了解机器学习的三大趋势→WWW 2015:一个神奇的会议

其他信息WWW 大会的一个特点就是主题多样,所收录的论文几乎覆盖与Web相关的方方面面,而每个主题都有其所对应的顶级国际会议,譬如KDD, SIGIR, CHI, ICML, STOC, EC等。


时间2015518日至522

会议简称MobiSys 2015

会议全称The 13th International Conference on Mobile Systems, Applications, and Services

地点:佛罗伦萨,意大利

关键词:移动系统设计中的核心问题、移动系统所能带来的新奇有趣的新应用

作者:微软亚洲研究院研究员张健松

相关分享:如何用好大数据→改变生活的移动计算——感受 MobiSys 2015

其他信息:近年来,随着智能手机、平板电脑以及可穿戴设备的普及,业界对移动系统的讨论越发热烈,MobiSys的受关注程度也不断提高,甚至大有赶超 “老大哥”Mobicom的趋势。据大会统计,今年的MobiSys收到了创纪录的233篇投稿,但仅接收了其中的29篇,录用率只有12.4%。而微软研究院的研究员们贡献了这29篇收录论文中的6篇,大约1/5的比例也很符合微软研究院在顶级计算机系统会议上给人的印象。

时间201578日至710

会议简称:微软教育峰会Faculty Summit 2015

会议全称Microsoft Research Faculty Summit 2015

地点:微软雷蒙德研究院,美国

关键词:人工智能的现状。挑战、迷思与未来

相关分享6位人工智能界大牛都说了什么→一场关于人工智能的头脑风暴

其他信息:该研讨会的主持人为“AIArtificial Intelligence,人工智能)先生”——美国人工智能学会主席、微软雷德蒙研究院院长Eric Horvitz博士。研讨会嘉宾包括微软研究院的杰出科学家Christopher Bishop,艾伦人工智能研究所执行总裁Oren Etzioni,斯坦福大学计算机科学副教授李飞飞,布朗大学计算机科学教授Michael Littman,以及麻省理工学院的Josh Tenenbaum教授。


时间201567日至612

会议简称CVPR 2015

会议全称28IEEE计算机视觉与模式识别大会,28th IEEE Conference on Computer Vision and Pattern Recognition

地点:波士顿,美国

关键词:计算机视觉、深度学习、3D扫描

相关分享:微软在计算机视觉图像分类和3D扫描方面取得新突破→火眼金睛看这里!

其他信息:本届大会最新的研究突破包括了对计算机视觉图像识别速度的显著提升,以及可以提高通过Kinect等传感器3D扫描图像的清晰度的全新算法等。

时间2015725日至731

会议简称IJCAI 2015

会议全称:国际人工智能联合会议,International Joint Conference on Artificial Intelligence

地点:布宜诺斯艾利斯,阿根廷

关键词:人工智能军备竞赛、计算可持续、伦理学、图像识别

相关分享:这场大会上还提交了一封包括霍金在内等超过1000名科学家的联名信……→人工智能前沿技术猜想——IJCAI大会

其他信息IJCAI是人工智能领域最顶尖的会议之一,从1969年以来,每单数年举办一次。

时间2015810日至813

会议简称KDD 2015

会议全称:国际数据挖掘与知识发现大会,ACM SIGKDD Conference on Knowledge Discovery and Data Mining

地点:悉尼,澳大利亚

关键词:大数据,数据挖掘,数据库,知识提取

作者:微软亚洲研究院实习生王英子

相关分享:如何获得大数据?→五分钟带你回顾 KDD 2015 大会

其他信息:每年吸引全球数据挖掘领域的学者为之疯狂的KDD今年也收获颇丰,共吸引了1008篇投稿,其中研究论文819篇,最终有160篇录用;政府和工业届应用论文189篇,录用68篇,这也是过去15年中录取量最高的一届。

时间2015827日至829

会议简称SoCC 2015

会议全称ACM 云计算研讨会,ACM Symposium on Cloud Computing

地点:夏威夷,美国

关键词:云计算,数据库、数据中心、存储、图计算

作者:微软亚洲研究院实习生肖文聪

相关分享SoCC虽然是一个年轻的会议,但已经成为了云计算领域的顶级会议→SoCC 2015大会全知道

其他信息SoCC至今仍是一个“小而精”的会议,本届SoCC仅有三十几篇论文和约130位参会者。这其中有62个参会者是学生,会议资助的学生有35个,超过半数,这都给这些云计算领域研究的先锋者们提供了更多相互交流的机会。

时间201597日至911

会议简称MobiCom 2015

会议全称 国际移动计算与网络大会,International Conference on Mobile Computing and Networking

地点:巴黎,法国

关键词:网络通信、无线通信、移动计算、系统安全和功耗、感知和定位

作者:微软亚洲研究院主管研究员刘云新

相关分享:历史平均论文录用率只有13%的大会。→当学术邂逅浪漫  MobiCom 2015大会

其他信息:和其它ACM的顶级会议一样,MobiCom有着非常严格的审稿过程,通常一年只录用30篇左右的论文。每一篇被录用的论文都要经过技术程序委员会(Technical Program Committee)成员的讨论通过,并安排专人对论文最终版本的修改进行指导,以保证审稿意见的采纳和所有被录用论文的质量。近年来,论文的录用数量和录用率都有所上升,但历史平均论文录用率仍然只有13%

时间20151022日至1024

会议简称CNCC 2015

会议全称:中国计算机大会,China National Computer Congress

地点:合肥,中国

关键词:人工智能、互联网、自然语言处理、情感计算

相关分享:在CNCC中,微软亚洲研究院主办的“互联网时代的人工智能”专题论坛上都讲了什么?→互联网时代:从技术的眼光解读人工智能

其他信息CNCC是由中国计算机学会(CCF)主办的全国计算机领域规模最大、规格最高的学术、技术、产业交融互动的大会。

时间2015112日至116

会议简称SIGGRAPH ASIA 2015

会议全称:国际图形图像协会(ACM SIGGRAPH)在亚洲举办的SIGGRAPH电脑图像和互动技术展览及会议

地点:神户,日本

关键词:电脑图像、互动技术、图形学、动画、3D

作者:微软亚洲研究院实习生王鹏帅

相关分享:这更是一场光影的视觉盛宴→发表了SIGGRAPH ASIA 2015的论文并参加大会是什么体验?

其他信息:与其他国际会议不同,SIGGRAPH系列会议并不只是单纯的学术会议,而是一个学术界、工业界、艺术界的盛会,因此除了技术文章之外,现场还有很多动画和新兴技术的展览。



推荐阅读

【微软亚洲研究院年度合集】这些是你一定不能错过的

【年度技术观点合集】计算机视觉,自然语言,机器学习…看看顶级科学家们怎么说

【年度开源、工具合集】牛津计划,DMTK,Graph Engine…提高你的工作效率!

【年度学术大会合集】SIGGRAPH,KDD,AAAI,NIPS…这些你想参加的会议

【年度励志合集】是鸡汤,还是干货?

【年度研究院活动合集】从编程之美到二十一世纪的计算大会…

【年度视频合集】小进步,大飞跃

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

【年度研究院活动合集】从编程之美到二十一世纪的计算大会…

$
0
0

你也许还没有参加过微软亚洲研究院的活动,但是你一定听过这些名字。编程之美、微软学生夏令营、二十一世纪的计算大会、微软亚洲研究院 “合作创 • 研” 年会……微软亚洲研究院面向学生与高校组织以及科研机构的活动众多,与学术界积极展开合作,让基础研究和前沿技术点亮更多人的灵感之光!

看完微软亚洲研究院年度合集,说不定今年的编程之美,就能看到你的身影哦!

2015525日,来自中国大陆、香港、台湾及日本、印度的50名编程小能手齐聚微软(亚洲)互联网工程院苏州分院,为2015编程之美挑战赛展开最终的角逐。本届编程之美挑战赛的决赛以人工智能为主题,分为Cortana NextNews Recommendation两题,编程大神们摩拳擦掌,不仅用神秘的代码、滔滔不绝的口才还用活泼的画笔生动形象的为我们再现了他们脑中的好点子!↓↓↓

Duang~传说中的“编程六美”来了…

8月,来自全国32所大学微软学生俱乐部及香港台湾的132名同学齐聚火热的古城西安,一场以“青春创想,古城筑梦”为主题的微软学生夏令营由此开启。短短四天,从破冰到熟识,再到齐心协力完成车库“骇客马拉松”创意,夏令营中的交流与灵感的碰撞都给大家留下了美好的回忆。对于同学们来说,骇客并不是推广技术,而是一种精神~↓↓↓

2015微软学生夏令营】体验骇客精神,放飞青春创想 

事实上,微软学生俱乐部已经走过了15年的历史,15年间,我们见证了学生们的点滴进步与成长,也见证了微软学生俱乐部的成员们走出校门,成长为各自行业中的翘楚,更见证了微软学生俱乐部从零开始发展到全国32个高校。多年来,微软学生俱乐部平均每年影响的学生人数超过5000名。回望过去,路途上都有哪些让人记忆深刻的点点滴滴?↓↓↓

梦想起航的地方——关于微软学生俱乐部15年的回忆

江湖上一直流传着微软学生夏令营的传说,那么问题来了 ↓↓↓

【知乎】参加微软学生夏令营是一种什么样的体验?

2015618日,清华大学校长邱勇院士、美国华盛顿大学校长Ana Mari Cause女士以及微软公司CEO Satya Nadella共同宣布合作建立全球创新学院 GIX),通过在大西雅图地区建设开创性教育机构,建造专业配套设施,打造创新生态系统。9月, 习近平主席访美之行向全球创新学院赠送了象征蓬勃生命力的水杉,祝福两校友谊常青,祝愿GIX茁壮成长。想知道全球创新学院——一个“来自世界各地的学生可以通力合作、共同创新,充满大学学术的无限活力,满载业界拼搏的实践真知”的地方,是如何一步一步建立的?请看↓↓↓

解码习大大访美热点:全球创新学院诞生记 

2015917日,微软亚洲研究院和敦煌研究院在敦煌举办 “文化遗产智能保护与传承研讨会”,微软亚洲研究院的多位资深研究员从自然语言理解、计算机视觉、网络图像、视觉计算、人机交互、创新工程等多个领域和敦煌研究院的研究人员交流了最前沿的研究成果。在图像采集的基础上,微软亚洲研究院希望在数字化呈现、知识库问答、人机交互等更多方向为敦煌研究院提供更多技术支持。文化遗产不能再生,也不能永生,用不断进步的现代科技来保护和传承珍贵的文化遗产,是微软,更是所有人共同的责任。↓↓↓

让莫高窟穿越时空,邂逅科技 

在过去近百年的时间里,计算机科学的持续演进以及深层神经网络、机器学习、计算机视觉和语音等与 “人工智能” 交界的技术的不断发展,让冰冷的机器变得越来越 “聪明”,“人工智能”终于不再只是人类的联翩浮想,而成为拥有无限可能的技术探索方向,甚至可能是下一代智能化互联网的基石。以“人工智能,无限可能”为主题的第十七届“二十一世纪的计算”大型国际学术研讨会在20151028日在北京举办,本届大会由微软亚洲研究院与清华大学联合主办,有幸邀请到包括两位图灵奖获得者在内的多位全球计算机科学领域的大师作为演讲嘉宾,讲述了他们在各自领域取得的最新成果、解读人工智能背后的科研故事。如果你错过了这次人工智能的盛宴,没关系~↓↓↓

听顶级科学家解读未来计算——第十七届二十一世纪的计算大会亮点

和众多高校、研究机构的交流合作一直是微软不断前行的推动力。2015年1127日,微软亚洲研究院 “合作创•研”年会 在微软亚洲研究院举行。本次活动汇集了来自中国大陆、香港、台湾、新加坡等地区多所知名院校及科研机构,和来自微软亚洲研究院联合实验室的110位学者,通过演示环节、学者报告、联合实验室主任会议等形式,展示和报告了11个微软亚洲研究院近年来与亚太区高校的创新科研合作成果。了解本次交流展示中的精彩成果↓↓↓

合作创研 携手共赢——2015微软亚洲研究院 “合作创 • 研” 年会

2015年1128日,第十一届大学计算机课程报告论坛在天津举行。本次计算机课程报告论坛由教育部主办,邀请到来自全国700余所高校的1000多名计算机相关专业教师,共同分享计算机教学中的经验,并探讨未来计算机教学的新思路。微软携手教育部成立了“产学合作专业综合改革项目”,以培养学生的“计算思维”为切入点,携手中国高校共同推进大学计算机基础课程改革。正如微软亚洲研究院学术合作总监潘天佑博士所描述的那样:“十五世纪各行各业的杰出人才聚集欧洲佛罗伦萨,彼时跨领域交叉将文艺复兴推向高峰,并带来数百年人文与科学的荣景。当下第二次大规模的跨领域交叉正在发生;而这次的佛罗伦萨叫做‘计算机科学’。” ↓↓↓

计算思维 科“际”效应——“产学合作专业综合改革项目”再出发


推荐阅读

【微软亚洲研究院年度合集】这些是你一定不能错过的

【年度技术观点合集】计算机视觉,自然语言,机器学习…看看顶级科学家们怎么说

【年度开源、工具合集】牛津计划,DMTK,Graph Engine…提高你的工作效率!

【年度学术大会合集】SIGGRAPH,KDD,AAAI,NIPS…这些你想参加的会议

【年度励志合集】是鸡汤,还是干货?

【年度研究院活动合集】从编程之美到二十一世纪的计算大会…

【年度视频合集】小进步,大飞跃

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:



 

【年度视频合集】小进步,大飞跃

$
0
0

语言能表达的内容非常有限。看完上述内容之后,来看些视频轻松轻松吧!

首先为大家呈现一波微软黑科技

↑↑↑为打造更大规模、更安全、更智能的云计算,微软研究院开发了带有FPGA“硬件加速芯片”的“Catapult主板”来提升数据中心的整体性能和能源利用效率。根据实验结果,该项目仅需调用一半数量的服务器即可有效提速必应的服务哦!

↑↑↑微软研究院与华盛顿大学联手开发一种称为HyperCam的低成本相机技术。这种超光谱相机同时使用可见光和不可见的近红外光来拍摄物体内部,以捕捉一些不可见的细节。HyperCam是为普通消费者推出的新型低价相机,视频展示了该相机的神奇效果。


↑↑↑MobiCom 2015 大会上,微软亚洲研究院的论文Optimizing Smartphone Power Consumption through Dynamic Resolution Scaling通过实现动态调整手机分辨率缩放的方式来降低移动设备上的电池耗电量获得了本届大会的最佳展示奖。实验显示,该技术平均节约30.1%的系统能耗,最高可达60.5%。对于手机党来说,以后出门可能不再需要充电宝啦~


↑↑↑微软剑桥研究院应用全新的数据模型和软件分析工具,开发了一套生态系统预测模型。它可以根据用户需求,提供更加个性和高效的天气气候、食品安全等与我们生活息息相关的预测结果。用大数据分析,预测生活的点点滴滴~


微软一直致力于创造个性化的计算体验,提高人们的生产力。牛津计划作为实现这两个目标的实例之一。牛津计划由一系列基于云端的机器学习相关的APISDK和相关服务等组成,旨在让开发人员们不需要繁复的机器学习背景也能开发出跨平台的更智能和更交互的应用。


黑科技之外,自然少不了改变你的生活的轻应用~

↑↑↑微软自拍(Microsoft Selfie)是微软推出的一款智能的应用。它能够针对自拍照片中出现的所有人脸的年龄和性别进行差异化一键自动美颜。此外,微软自拍还能自动为你的照片降噪补光,无论光线环境如何复杂,都能拍出理想的照片。


↑↑↑这是一个全天候待命的同声传译器,它可以让不同语言在手机和智能手表之间,用户和用户之间进行无缝切换~你只需对其中一个设备说话,另一设备就会立刻显示出用户想要翻译的语言。有了它,语言再也无法阻止你环游世界了!是的,它就是Microsoft Translator


↑↑↑微软研究院最新研发的MobileFusion能让普通手机在不需要任何的外界设备和网络的情况下进行3D扫描。该程序可以在你眼前创建全彩色的3D网格模型,由此产生的三维扫描能应用于3D打印,甚至用于增强现实游戏哦!


↑↑↑微软发布的Hyperlapse技术和其系列产品,可以帮助我们将抖动的第一人称录像转化成具有延时效果、且稳定流畅的视频。还等什么,做自己人生的导演,从Hyperlapse开始吧!

在微软眼中,未来​5年后的生活会是怎么样的?请看↓↓↓

这些极具创造力的技术和应用究竟如何诞生?

↑↑↑微软车库是微软鼓励各个部门和领域的员工、实习生和团队来参与创新的地方。工作之余,有创新想法的员工可以在公司内部招募成员、组建团队,将其变为现实。让我们用影响为你还原这个彰显微软员工创新基因的地方!

无处不在的触摸屏,以及自然无缝的交互体验,充满智能的工作与生活。

当然,帮助每个人一直是微软努力的目标

↑↑↑钢铁侠主演小罗伯特唐尼联合微软为7岁的残疾儿童Alex Pring送去了钢铁侠主题版的3D打印智能义肢。这也是微软OneNote团队CollectiveProject计划的首推项目,旨在实现更便宜、更智能的义肢,帮助更多残疾人便捷的生活。

最后,给大家献上一份干货视频合集作为结尾,访问http://www.msra.cn/zh-cn/um/events/21ccc/2015/,和包括图灵奖得主在内的计算机领域大师在21世纪的计算大会上一起探寻人工智能时代的无限可能!↓↓↓



相关阅读

【微软亚洲研究院年度合集】这些是你一定不能错过的

【年度技术观点合集】计算机视觉,自然语言,机器学习…看看顶级科学家们怎么说

【年度开源、工具合集】牛津计划,DMTK,Graph Engine…提高你的工作效率!

【年度学术大会合集】SIGGRAPH,KDD,AAAI,NIPS…这些你想参加的会议

【年度励志合集】是鸡汤,还是干货?

【年度研究院活动合集】从编程之美到二十一世纪的计算大会…

【年度视频合集】小进步,大飞跃

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

【年度励志合集】是鸡汤,还是干货?

$
0
0

漫漫科研路,有辛酸也有喜悦。也许你曾遇到过问题踟蹰不前,也许你也遇到过春风得意,让人欢欣鼓舞之时。在这份年度励志合集中,微软全球资深副总裁洪小文博士会教你做科研的时候许自信与谦虚并行;2015 John von Neumann Lecture Award的获得者,微软新英格兰研究院和微软纽约研究院院长Jennifer Chayes会教你如何平衡好工作和生活;微软学者奖学金获得者为你示范优质博士的养成之道。这也许是鸡汤,但仔细一看,鸡汤还带勺哦!

一提到理工女,很多人便会产生敢想敢为,直接爽快、不拘小节的形象。但微软亚洲研究院主管研究院王丽娟博士告诉你,理工女也有温柔与知性的一面。从清华到微软,王丽娟博士一路从容应对,只因为“对科研和所学领域充怀有炽热的爱。只有具备这种热爱,才能够去面对科研路上随时可能会遭遇的挫败和打击,才能够让你在身心疲惫时依然可以重新出发。” ↓↓↓

王丽娟:从清华到微软,从容应对多重角色


“家庭是非常重要的,两个人在一起共同扶持、共同生活是非常有幸福感的事情”,“ 在工作中真正遇到一些问题,当你说出来,别人会给你想法和建议,也会给你鼓励和肯定。压力只有被释放,你才能进入下一个阶段,”,“自信是最重要的,绝对不要在你尝试之前就否定自己,也不要因为别人告诉你的一些“道理”就让你自卑。因为你的生活只有你自己把控,你的目标和理想也只能靠自己去完成。”,“无论文化背景也好,成长环境也好,你始终都是你自己,永远不要被环境限制。”微软新英格兰研究院和微软纽约研究院院长JenniferChayes的人生感悟你get到了么?↓↓↓

Jennifer Chayes: 生活始终在你手中


科研的特征是什么?研究者又该具备什么样的素质?选择工业界还是学术界?如何应对挫折?又该怎样创新?科研环境重要吗?相信你一定有过这些烦恼,让微软全球资深副总裁洪小文博士用满满的鸡(gan)汤(huo)为你指点迷津:“真正结合自己的兴趣爱好和个人理想,make a big decision first!” ↓↓↓

【科研人员必看!】微软亚洲研究院院长洪小文博士谈科研:自信与谦虚并行


“和‘恋爱’一样,寻找适合自己的项目,找到自己适合的导师才是最重要的。”在计算机专业“四大”之首的卡内基梅隆大学计算机学院副院长Philip Lehman眼里,优秀的博士生需要自主性(initiative)、原创性(originality)、独立性(independence)、表达能力(communication skills)、判断力(judgement)、知识(knowledge)和智慧(intelligence)这七项素质,对于一个博士生而言,其中什么是最困难的呢?对于硕士和博士申请者,CMU所看重的特征又有什么差别?↓↓↓

【申请季】与CMU计算机学院院长面对面

微软学者奖学金是微软亚洲研究院在1999年启动的一项面向亚太地区重点高校的计算机科学、电子工程、信息科学或应用数学专业低年级博士生的项目。该奖学金项目用于发现、鼓励和资助优秀的、有潜力的低年级博士生更好地开展基础研究工作。想知道今年脱颖而出的“微软学者”们是如何炼成的么?请看↓↓↓

优质博士的养成之道

很多我们已经习以为常的技术都来源于基础科学研究,为什么微软一直重视基础研究?微软全球资深副总裁周以真博士是这样说的:“是基础科学研究创造了知识,并促进了我们对于世界的基本理解。是基础科学研究让今天的技术成为了可能,并将引领未来的技术突破。这是建设一个强大企业乃至一个强大经济体的关键所在。” ↓↓↓

为什么微软如此重视基础研究?


推荐阅读

【微软亚洲研究院年度合集】这些是你一定不能错过的

【年度技术观点合集】计算机视觉,自然语言,机器学习…看看顶级科学家们怎么说

【年度开源、工具合集】牛津计划,DMTK,Graph Engine…提高你的工作效率!

【年度学术大会合集】SIGGRAPH,KDD,AAAI,NIPS…这些你想参加的会议

【年度励志合集】是鸡汤,还是干货?

【年度研究院活动合集】从编程之美到二十一世纪的计算大会…

【年度视频合集】小进步,大飞跃

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:



 

【年度技术观点合集】计算机视觉,自然语言,机器学习…看看顶级科学家们怎么说

$
0
0

“最深奥的技术是哪些我们感觉不到存在的技术,这些技术自如地融入我们日常生活,不知不觉地成为生活的一部分。”——马克·魏瑟

1956年夏天,明斯基、罗切斯特、申农等一群年轻人进行了一次聚会,Artificial Intelligence(人工智能,缩写AI)这个词就此出现,这也标志着一门新兴学科——人工智能的正式诞生。今年是“人工智能”一词诞生的60周年,还有关于人工智能的许多问题亟待我们去探索。人工智能是什么?我们又需要怎样的人工智能?

如今,人工智能、机器学习、大数据已经日渐深入到我们生活的每个角落,这些技术虽然不够具象,但是却能够让我们随时随地得到我们所要,实现我们所想。这是一场悄无声息却改变全球几亿人生活的隐形革命。

首先,大家来回顾一下微软全球资深副总裁,微软亚太研发集团主席兼微软亚洲研究院院长洪小文博士对人工智能的看法。↓↓↓

洪小文:人工智能,一个很好的“左脑”

在洪小文博士看来,计算机应该是一个很好的“左脑”。通过相应的算法,计算机可以做大量重复性及逻辑推理的工作,这与负责逻辑思考和推演解决问题步骤的“左脑”十分相近。而机器并不需要深不可测的独立意识。人和机器之间的关系,更多的是Human(人)+Machine(机器)=Superman(超人)的关系,两者擅长的能力相结合,最终会做出人独立做不到、机器也独立做不到的事情。

因此,计算机科学家们试图利用计算机强大的计算能力来模拟和人类的一些基本的感官能力。随着机器学习和大数据的日渐发展,计算机已经逐步会听、会说、会看……

会看:计算机视觉

计算机的“眼”进化到哪一步了

↑↑↑这篇文章是微软全球执行副总裁沈向洋在Ignite 2015大会上做的主题演讲。沈向洋博士作为一名深耕于计算机视觉领域长达25年的研究人员,他在这篇文章里讲述了最初进入这个领域进行探索的原由,并分享了微软是如何利用深层神经网络不断完善计算机的视觉能力的。

计算机视觉——让冰冷的机器看懂这个多彩的世界

↑↑↑那么问题来了,计算机究竟是如何看懂世界的呢?从计算机视觉到深层神经网络的联系又是如何建立起来的呢?在这篇文章里,微软亚洲研究院计算视觉组首席研究员孙剑博士就亲自为大家理清楚了计算机视觉的前世今生。无论你是计算机视觉的门外汉还是对此有所研究,这篇文章都十分有助于你理清思路。

从上篇文章中,你也许已经知道了深层神经网络是如何不断完善计算机的视觉能力的,但这是否意味着计算机能成功取代人眼了呢?值得高兴的是,在20151月的一篇论文中提到,微软亚洲研究院的一个四人计算视觉小组成员在ImageNet计算视觉识别挑战赛中实现里程碑式突破,计算机识别物体的能力首次超过人眼,系统错误率已经低至4.94%。而在此前同样的实验中人眼辨识的错误率大概为5.1%。↓↓↓

微软研究员在ImageNet计算机视觉识别挑战中实现里程碑式突破

ImageNet计算机视觉挑战赛由来自全球顶尖高校和公司的研究员组织举办,近年来已经成为计算机视觉领域的标杆,其比赛结果总能十分直观地反映出计算机视觉这一热门领域中各研究机构的研究进展和突破。今年12月,在微软亚洲研究院首席研究员孙剑的带领下,这个四人研究小组再次做出突破,用152层的深层残差网络(deep residual networks)上的新突破,以绝对优势获得图像分类、图像定位以及图像检测全部三个主要项目的冠军,该系统识别错误率已经低至3.57%。↓↓↓

刷新神经网络新深度:ImageNet计算机视觉挑战赛微软中国研究员夺冠


从以上内容可以看出,计算机视觉方面的基础研究进展是大家有目共睹的。那么从研究到应用,计算机视觉能力是如何服务于普通用户的呢?

借计算机一双慧眼

↑↑↑鼠标发明人Doug Engelbart曾经针对人工智能的简称AI提出了另一个理念——Augmented Intelligence,增强智能。在他看来,人已经足够聪明,我们无需再去复制人类,而是可以从更加实用的角度,将人类的智能进一步延伸,让机器去增强人的智能。智能眼镜就是这样的产品,去超市的时候带上一副,看到心仪商品上的文字,自动搜索出详细信息:生产商情况、在不同电商平台的价格等等。让智能眼镜读懂文字的正是OCR技术。微软前不久推出的OfficeLens应用,就已经可以通过视觉计算技术自动对图像进行清理并把它保存到OneNote,而OneNote中基于云端的OCR技术将对图片进行文字识别,随后你就可以拥有一个可编辑、可搜索的数字文件,为上述未来应用场景打下基础……

人脸识别:应用开启创新潮,算法进展才起步

↑↑↑风靡全球的How-Old.net(微软颜龄机器人)和TwinsOrNot.net(微软我们)巧妙地将人脸识别与社交网络中的人际交往结合在一起,虽然不能做到百分之百精确,但高科技加诙谐的人际交往和传播效果,可以说是人脸识别技术和社交网络发展到一定阶段、自然而然的应用创新。这篇文章解释了人脸识别技术中的难点和痛点,快去看看吧!

用线条解码甲骨文的秘密 

↑↑↑不同于英文、法文等表音文字,方块状的汉字在一笔一划之间都蕴含着无穷的奥妙。以象形、指事、会意、形声、转注、假借的六书为构字系统,汉字也在不断发展变化。如今,汉字的起源——甲骨文仅能被一些专业汉语言学者们所辨认。但普通人想要解码甲骨文间的秘密,却显得难上加难,那么能不能用先进的计算机视觉技术能帮助人们解决这个难题呢?

动静之间,从视频到语言

↑↑↑前面说了这么多,相信大家对计算机能够看懂静态图像的工作原理已经有所了解了。但是我们知道,计算机要真正取代人眼,静态的图像肯定是不够的,目前的技术能否满足计算机看懂动态的视频呢?对于计算机来说,画面内容的识别,动作的捕捉,都要经过复杂的计算才能得出。微软亚洲研究院的最新技术能让计算机不仅能看懂视频,还能用自然语言描述出来哦!

会听、会说:语音识别与自然语言理解

在人类的众多感官中,视觉固然重要,但听、说能力的重要性更是不容忽视。

20121025日,在由微软亚洲研究院主办的第十四届“二十一世纪的计算大会”现场,时任微软研究院全球负责人的Rick Rashid发表的主题演讲中,首次公开演示了微软实时语音翻译技术。这套系统实时的把Rick Rashid说出的每一句英文翻译成中文,并用Rick本人的声音用中文表达出来。这对语音识别和机器翻译的发展而言,这都是一个关键的时刻。三年时间内,这一技术原型被转化成产品,成功应用到了Skype Translator实时语音翻译中。↓↓↓

挑战中英实时语音翻译,Skype Translator 中文预览版登陆中国

多年来,制造出像人类一样能够理解自然语言的的计算机的追求是如此的困难和不可思议,似乎只有科幻小说才能实现如此神奇的事情。拥有语音识别功能的应用和工具逐步从虚构走进了我们现实生活中,而且这些技术每天都在进步。下面这个故事分享的是微软过去二十多年来在语音识别技术走过的漫漫之路。↓↓↓

会听、会说、会聊天:人工智能语音识别技术的漫漫长路

看到这里你也许会问了,当计算机能够识别人类的语音,但这是否代表计算机真的明白这些语音背后的含义呢?微软亚洲研究院首席研究员周明博士在下面这篇文章中解读了自然语言理解技术的前世今生。让我们一起看看自动问答的小冰,和掌握了字谜、对联、绝句在内的机器人作家是如何炼成的。↓↓↓

计算机能“理解”多少我们的语言了? 

会思考:聊天代理(conversational agent

当计算机的多个感官功能逐步完善,如何将其聚合这个问题也就出现在了我们面前。无论是学术界还是工业界,科研人员们都力求让人们能够拥有自己专属的人工智能助理。

人工智能助理,其本质作用是能够帮人们解决问题的,这背后涉及的一个技术核心便是搜索。我们现在正在构建的未来搜索就包括这样的三种能力——知识挖掘(knowledge mining)、机器学习(machine learning)、信息检索(information retrieval)。还有自然语言的理解和生成所需要的基本功能,甚至还会加上一些基本的常识。人工智能有机会可以和人类学习更多的知识,并产生个性化交流,在一个更自然的交互界面中,智能的帮人们完成任务。↓↓↓

《科学世界》:搜索的新时代

看罢过去微软研究院过去一年最前沿的技术创新与观点,想必你对接下来一年的技术走向和发展更是充满了信心。在迈开新年的步伐之前,这里有一份来自微软16位顶级科学家站在各自的领域上对未来一年和未来10年的预测。数据科学从到量子计算,从深度学习到安全技术,相信这份预测能为你接下来的研究和规划提供真知灼见。↓↓↓

从人工智能、数据科学到密码学:微软16位顶尖科学家的2016年展望



推荐阅读

【微软亚洲研究院年度合集】这些是你一定不能错过的

【年度技术观点合集】计算机视觉,自然语言,机器学习…看看顶级科学家们怎么说

【年度开源、工具合集】牛津计划,DMTK,Graph Engine…提高你的工作效率!

【年度学术大会合集】SIGGRAPH,KDD,AAAI,NIPS…这些你想参加的会议

【年度励志合集】是鸡汤,还是干货?

【年度研究院活动合集】从编程之美到二十一世纪的计算大会…

【年度视频合集】小进步,大飞跃

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:



 

洪小文博士写给你的新年书单

$
0
0

新年将至,除了美食和聚会,别忘了给自己的头脑也充点电!春节七天乐,我们特地邀请微软亚洲研究院院长洪小文博士为大家推荐了七本书,包含了科学、科幻、商业、政治、管理等多个主题的内容。读完洪院长的春节书单,相信你一定会有一个收获颇丰的春节假期。

除夕—— 《超级智能:路线图、危险性与应对策略》(Super IntelligencePaths, Dangers, Strategies

http://book.douban.com/subject/26308917/

这本书深入细致地探讨了超级智能与人类生存的相关战略、方法、风险和哲学问题,虽然有些内容比较抽象,涉及的领域非常广且很多内容属于预测性范畴,但作者Nick Bostrom提出的问题和见解有很高的远见和启发性。在阅读这本书时,你仿佛进入了一场引人入胜的有关人类目前的处境、智能化的未来的思考旅程。在这场旅行中,你不仅需要选择前行的方向,更需要在危险面前做出你自己的选择。

院长推荐理由:

本书可谓是目前对人工智能发展探讨最为深刻的少数几本著作之一。书中就未来人工智能对人类所产生的威胁的思考和观点发人深省:如果说随着克隆生物等技术的发展,人类传统观念中的“造物主”对所创造的世界已经失控,那么在未来,人类所创造的机器是不是也有可能会失控呢?其实,这个问题一直饱受争议。2015年初,包括斯蒂芬-霍金和伊隆-马斯克等在内的一批科学家和企业家共同签发了一封公开信,呼吁人工智能研究领域的科研人员应朝正确的方向去发展人工智能技术并正视人工智能未来发展所产生的问题,避免人工智能研究出现可能导致人类社会毁灭的风险。

从我的个人观点来看,一方面我相信由于意外而产生的Bug,确实有可能让智能机器失控,类似电影《黑客帝国》中所描述的那样。另一方面,我相信人类的良知,因此对人工智能的发展持乐观的态度。正如我在《我们需要什么样的机器人》一文中提到的:“正常状态下,工具对人类来说大多有着至关重要的正面价值。真正决定其用途的,是背后的使用者……只要科技对人的帮助远大于伤害,那我们就该正面、乐观地看待它,并继续向前走。”

 

正月初一—— 《未来愿景Future Visions

http://www.amazon.com/Future-Visions-Original-Inspired-Microsoft-ebook/dp/B0182NCTWS/

这是一部由微软研究院出版的科幻小说集,2015年末,9位世界顶级的科幻小说家受邀访问了微软研究院,并在微软最新科技的启发下,创造出了9个“脑洞大开”的科幻小说。“人工智能”,“机器学习”,“量子计算”等等,当这一个个高深的科学技术邂逅科幻小说,究竟会擦出怎样的火花?在这本《未来愿景》中,相信你会找到答案。

院长推荐理由:

这应该是第一次有多位知名科幻小说家亲临计算机研究机构,从现实世界的科学研究中获得创作灵感。其实科研人员与科幻小说家有很多相似之处,因为我们每天都在畅想未来。科幻小说家对于未来的幻想一向都十分超前,比如1968年就拍摄完成的《2001太空漫游》,影片中展现的技术至今也未能完全实现,但却激励了一代又一代的科学家。而科研人员与科幻小说家不同的是,在幻想未来的同时,我们需要通过对技术的研发,让幻想变为现实。而这本书可以说是科研人员与科幻小说家所碰撞出的火花。

 

正月初二—— 《世界秩序》(World Order

http://book.douban.com/subject/26435040/?from=tag

继《论中国》后,92岁高龄的基辛格的最新力作让你一本书读懂当今世界格局。在书中,基辛格系统梳理了全球各地区的战略逻辑和地区秩序观,从文化、宗教、地缘等综合因素解读了这些不同秩序观的形成、冲突和合作,并结合网络科技等当前新的战略要素,解析了当下时局的挑战与机遇。本书不仅将视野拓宽到全世界,而且将时间拉长至400年,集结了基辛格60年外交生涯的理念精髓,可以说是一部大开大阖、谈古论今、求索国际关系治理之道的集大成之作。

院长推荐理由:

基辛格是中国多年的朋友,一直用中立的视角、全球的视野看待并解读国与国之间的关系,特别是中美关系,并促进区域间合作。同时,基辛格也是微软的良师益友,常常就微软在中国等地区的发展战略提出建设性意见。对于中国读者来说,则可以通过该书了解西方世界眼中的中国。

 

正月初三——《零边际成本社会》(The Zero Marginal Cost Society

http://book.douban.com/subject/25986746/

在《零边际成本社会》书中,纽约时报畅销书作者Jeremy Rifkin向我们介绍了互联网以及新兴的物联网是如何给我们带来一个零边际成本的社会。数十亿的传感器被连接到我们每个人,大量数据形成了一个全球性的神经网络,这极大地提高了生产率,但也导致社会的边际成本暴跌。在日益加强的全球依存关系面前,一个零边际成本的社会又将给我们的生活与市场带来什么样的剧变?

院长推荐理由:

互联网的快速发展为电子商务、物联网等发展提供了良好的平台,供应商与消费者间的直接交易不仅降低了边际成本还让世界变得更加全球化。中国如今已经成为了互联网的巨大市场,而中国人勤奋努力且不以利少而不为的特点将会让中国在边际成本不断降低的时代背景下发展得更加茁壮。但是,互联网经济发展是否真的会让我们更加接近社会主义乌托邦或者大同世界?为私营部门提供基础设施平台的企业是否会形成新型的垄断?移动互联网继续发展的方向是什么,会面临哪些问题,这些问题应如何解决?都值得大家在看完此书之后进行更加深入的思考与探讨。

 

正月初四—— Super ForecastingThe Art and Science of Prediction

http://book.douban.com/subject/26435820/

不管你是否注意,其实我们所做的每一件事如工作、购物甚至是结婚,都蕴含我们对于未来的预测,但事实上,和专业人士相比,我们并不擅长预测。而沃顿商学院的教授Philip Tetlock正希望通过《Super Forecasting》这本书让我们了解预测中的艺术与科学,通过展现更合理的分析预测手段与方法,帮助我们无论是在商业领域还是在个人生活中都能够做出让自己受益的预测与决定!

院长推荐理由:

历史上的成功人士很多被我们称之为“先知”,原因是他们都拥有超强的预测能力。对于做研发的人来讲,对未来的预测更为重要,因为预测将决定一个公司是否能够在纷繁复杂的商场上取得先机。其实,今天大家热议的大数据和互联网思维,就是基于数据以及用户的反馈来预测未来的产品、战略、商业模式等等,洞察其中的商机,从而研发或者改进相应的产品或者服务。虽然目前我们基于大数据的技术还不能预测长期的结果,但是在预测有限时间内特定事件的结果方面我们已经做的越来越好了,比如必应世界杯奥斯卡等事件的预测Urban Air空气质量预测等等。值得一提的是,微软公司CEO萨提亚·纳德拉也推荐了这本书。

 

正月初五—— 《从01开启商业与未来的秘密》(Zero to One)

http://book.douban.com/subject/26297606/

在科技剧烈改变世界的今天,想要成功,你必须找到创新的独特方式——在一切发生之前研究结局,从01,为自己创造无限的机会与价值。在这本书中,Paypal创始人、Facebook第一位外部投资者彼得•蒂尔在本书中详细阐述了自己的创业历程与心得,包括如何避免竞争、如何进行垄断、如何发现新的市场。《从01》还将带你穿越哲学、历史、经济等多元领域,解读世界运行的脉络,分享商业与未来发展的逻辑,帮助你思考从01的秘密,在意想不到之处发现价值与机会。

院长推荐理由:

“大众创业,万众创新”的大环境下,如何让你的创业项目获得成功?拥有创业者和投资者双重身份的彼得•蒂尔,通过分享自己的亲身经历来帮助读者从硅谷那些异军突起的创业公司的成功故事中得到启发。我相信创业者的初衷都是因为一个理想,在创业的过程中除了坚定的理想之外,还要拥有前面《Super Forecasting》书中强调的预测能力,在红海和蓝海中发现机会,找个合适的位置,并通过颠覆性创新取得成功。

 

正月初六—— Organizing Genius: The Secrets of Creative Collaboration

http://www.amazon.com/Organizing-Genius-Secrets-Creative-Collaboration/dp/0201339897/

本书由南加州大学工商管理学特聘教授、哈佛大学肯尼迪政府学院的中心顾问委员会委员Warren Bennis所著,通过分析六个百年来最有成就的组织的成功经验与教训,揭示了创新合作的秘密,正如作者在书中所说:“none of us is as smart as all of us”(我们中的任何人都不会和我们所有人一样聪明),如何成为一个具有合作精神的成功领导者,在这本书中你会找到答案。

院长推荐理由:

在如今的创新时代,我们要如何管理一群天赋禀异的人?作为微软亚洲研究院的院长,我充分的体会到对于这些智慧超群的科研人员,管理者需要做的更多是引导,而不是领导,应当给予团队足够的自由度和空间。此外,促进团队内部协作,以及跨部门、跨领域、跨机构、跨行业间的相互交流与合作也至关重要。如何更好的创新合作,本书中的很多观点值得我们借鉴。

这份诚意满满的书单从时下最火热的人工智能话题开始,到未来科技远景,再到国际格局分析,分享了商业和创业成功案例,最后是人才管理秘诀,相信在充实你七天假期的同时,定会让你有所收获。那么现在就去翻开书页,get猴年新知识吧!

(注:本文部分书籍简介来源于互联网)



推荐阅读

【微软亚洲研究院年度合集】这些是你一定不能错过的

【年度技术观点合集】计算机视觉,自然语言,机器学习…看看顶级科学家们怎么说

【年度开源、工具合集】牛津计划,DMTK,Graph Engine…提高你的工作效率!

【年度学术大会合集】SIGGRAPH,KDD,AAAI,NIPS…这些你想参加的会议

【年度励志合集】是鸡汤,还是干货?

【年度研究院活动合集】从编程之美到二十一世纪的计算大会…

【年度视频合集】小进步,大飞跃

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

海洋深处的数据中心——微软Natick项目

$
0
0

数据中心(data center)是云计算的支柱,云计算的蓬勃发展离不开数据中心在建造运营方面的不断创新。但云端数据中心的运行过程中会产生大量热量,冷却降温过程则意味着巨大的能源消耗,这意味着需要庞大的资金。如何解决数据中心的能耗问题对云计算的进一步普及十分重要。针对这一问题,在一份内部提案启发下,五位微软工程师于2014年夏天开始了Natick项目,研究在世界各地建造、运营海底数据中心的可行性,期待建立部署便利、成本更低、响应快速、环境友好的数据中心。


全球半数人口沿海居住,数据中心为什么不呢?

2013年春天,曾在美国潜艇上服役三年的Sean James在微软年度创新活动 Think Week(思考周)”上递交了一份提案——建立水下数据中心。这一提案的基本理念是将数据中心服务器装入防水的容器中,放入海底,利用寒冷的海水带走服务器工作中产生的大量热量,达到冷却的目的。

“我不知道大家对这个主意怎么看。”微软云计算基础设施与运营的高级研究项目经理Sean已在微软数据中心工作了15年,“我有在水下安装复杂电子设备、并防止它们被海水腐蚀的经历,那些严苛的设计、测试流程帮助我联想到建造海底数据中心的可能性。”

随后,这一充满创新的提案被送到微软研究院NExT特殊项目负责人Norm Whitaker面前,并立即引起了注意。第二年夏天,NormSean等五位工程师正式组队,启动了Natick项目。

创新不一定是全新,它也可以是用现有技术联系本无关联的事情

Natick项目的构想充满创意,但海底设备容器问题、设备供电问题、数据延迟问题、建造周期问题、环境问题却是摆在项目组研究人们面前的一个个挑战。

针对设备容器问题,经过综合考虑,项目组决定选用圆筒形容器包裹住数据中心,因为圆筒形的容器承受海底高压,保证数据中心的正常运转。而最终,一个重量约17吨,高10 英尺,直径超过7英尺的圆柱体也摆在了项目成员的面前。

在解决设备供电问题时,研究人员原本设想通过陆上发电站进行供电,但之后的一个设想令所有人都感到惊喜:为什么不从不断运动的海浪中获取能源,为数据中心供电呢?在未来,Natick项目将使用更多潮汐能、风能等方式对设备进行功能,降低成本的同时也对环境更加友好。

事实上,云端数据中心的延迟也是研究人员面临的一个重大挑战。考虑到全球半数人口居住在距海岸线200公里以内的地方,将Natick项目的海底数据中心设计在离海岸线较近的地点是一个明智的选择,靠近人口密集区域不仅降低了维护运营成本,同时也让数据传输距离大大减少,传输速度更快,延迟更低。

如果一个项目需要巨大的时间成本进行测试,那么在实际应用时,这一项目便很难得到广泛推广。但令人振奋的是,Natick项目还具有快速部署的优势。打造第一个海底数据中心原型Leona Philpot,项目组仅用了90天。

Natick项目带来的另一大惊喜是对海洋环境影响微乎其微。第一座海底数据中心原型机Leona Philpot下水后很快融入环境,海洋生物并不排斥它,还很快在上面定居。数据中心发出的噪音甚至都被周围小虾游动时发出的咔嗒声掩盖了。

这是Natick项目的一小步,也许是数据中心的未来的一大步

20158月,名为Leona Philpot的第一座海底数据中心原型机被安置到加州中部海岸附近。除了一位潜水员每月做一次例行检查,实验的三个月里,项目组成员一直通过数据中心上的相机、传感器在微软总部雷德蒙德园区对其进行包括温度、湿度、电流等数据的监测。这期间,Leona Philpot还经历了一次小型海啸,但安然度过。

未来,Natick项目组还将设计建造容量更大,处理能力更强的水下数据中心,相信未来Natick项目将更好服务于云端数据中心的建设与维护工作。

了解更多关于Natick项目的详情,请访问http://www.projectnatick.com/

Natick项目时间轴

 

推荐阅读

【微软亚洲研究院年度合集】这些是你一定不能错过的

洪小文博士写给你的新年书单

刘铁岩:在微软大学的三次华丽转型

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

芮勇博士荣获2016年IEEE 计算机学会技术成就奖

$
0
0
微软亚洲研究院常务副院长 芮勇 

日前,电气电子工程师学会(the Institute of Electrical and Electronics Engineers, IEEE)计算机学会(Computer Society, IEEE CS宣布了本年度的五位技术成就奖(IEEE CS Technical Achievement Award)获得者微软亚洲研究院常务副院长芮勇博士因其在“多媒体分析与检索领域开创性的贡献”For pioneering contributions to multimedia analysis and retrieval获此殊荣,其他四位获奖者分别为加州大学洛杉矶分校的丛京生(Jason Cong)教授, 圣母大学Patrick Flynn博士, 乔治梅森大学Sushil Jajodia 博士和米兰大学Pierangela Samarati教授。

电气电子工程师协会(IEEE)是一个国际性的电子技术与信息科学工程师协会,是世界上最大的专业技术组织之一。计算机学会IEEE CS 技术成就奖创立于1985年,旨在表彰学者在过去10-15年中所做出的显著推动本领域技术进步的卓越研究和贡献。曾获得该奖项的还有IEEE计算机学会的首任主席Edward J. McCluskey博士(1985),以太网络的发明人Robert M. Metcalfe博士(1987)等人。

“芮勇博士获得IEEE CS技术成就奖可谓实至名归,这是对他多年来在多媒体分析与检索研究领域开拓与成就的高度认可,”微软全球资深副总裁,微软亚太研发集团主席兼微软亚洲研究院院长洪小文博士表示,“作为优秀的科学家,芮勇博士在多媒体领域的研究成果在学术界产生了深远影响,我们为他所取得的成就感到骄傲。”

事实上,芮勇博士在计算机视觉领域的研究开始于1995年。那是一个互联网技术才刚刚起步的时代,今天在搜索引擎上让计算机自动检索图像的技术在当时看起来十分不可思议。“当我们开始做多媒体搜索的时候,那个年代还没有网络浏览器,更没有搜索引擎。二十年前在什么都没有的背景下,我们做图像检索的想法十分超前。”芮勇博士说。

芮勇博士当时在伊利诺伊大学香槟分校大学攻读博士学位。彼时,美国政府和美国国家自然科学基金会正在协力推动一个名为“数字图书馆”的信息化项目。全美共有五所高校参与该项目,伊利诺伊大学正是其中之一。伊利诺伊大学工学院一直是与麻省理工学院、加州大学伯克利分校工学院齐名的工学院,芮勇十分感谢他的母校能够提供这样的机会,让他能够在攻读博士期间便有幸参与这一项目的研究。

“数字图书馆”构建于多媒体检索技术的基础上——那时,人们在做多媒体检索时往往都基于“对内容和多媒体信息的理解”,例如将目标内容的图像色彩、纹理特征、空间分布等“特征”抽取出来与数据库中的信息比对——而芮勇则另辟蹊径,一举找出了相关反馈relevance feedback理论与多媒体检索的关系。

他是当时图像搜索领域第一批使用“相关反馈relevance feedback”概念的学者。“相关反馈”能够在搜索引擎中基于先前用户对先前检索结果的反馈对检索结构进行调整,使得搜索结果更符合用户的需求。当时,该算法主要应用于文本搜索领域,但芮勇博士创造性地提出将该算法应用到图片搜索当中。芮勇的一篇论文被其他研究者引用两千多次,成了多媒体领域的经典必读论文,也荣获了2010Journal of Visual Communication and Image Representation (JVCIR) 著名的“十年最多引用论文奖”;另一篇文章则高踞同年IEEE Transaction on Circuits and Systems for Video Technologies所有论文被引用数的第一位。他提出这一思想的相关论文至今已被引用几千次,他也曾多次高居爱思唯尔(Elsevier)年度中国高被引学者(Most Cited Chinese Researchers)计算机科学榜单的前列

其实,这项工作不仅对该领域的研究人员产生了重要影响,也让我们今天能够更容易地搜索出自己想要的图像。“后来的事实证明,这个结构具有颠覆性意义。有了这个算法,图像检索的精确度和速度得到了显著上升。随后更多的学者受此启发,在此基础上带来了很多的创新成果。”芮勇博士说。

芮勇博士在微软已经工作了17年,在微软的很多产品和服务中,例如微软人工智能姐妹花小冰和小娜,帮助没有机器学习背景的开发人员开发智能应用的牛津计划等当中,你都能发现芮勇博士和他所领导的团队在其中做出的重要贡献。如果说芮勇博士之前的研究方向主要是利用计算机视觉去识别对象的特征,例如物体的形状或者颜色的话,那么近些年来,他的研究已经扩展到图像理解领域,即利用计算机视觉技术对图像进行识别与描述。不久前,他所领导研究组的研究甚至能计算机看懂短视频,并用自然语言对视频内容进行描述该项技术背后的算法表现也取得了迄今为止全世界最好的实验成绩,这也是目前学术圈公认的最好算法。

谈及在微软的工作,芮勇博士坦言在这里工作的一个巨大优势便是有机会接触到从基础研究到产品开发等一系列端到端的过程。芮勇在博士毕业之后,便进入美国微软研究院总部工作。7年之后,他于2006年初回到中国,先后担任微软亚太研发集团首任战略总监 (2006-2008), 负责制定和执行集团的整体研发战略;研发总监 (2008-2010), 负责公司第一款教育产品在华的研发;以及微软亚洲工程院副院长及微软亚太研发集团中国创新孵化部总经理(2010-2012), 负责集团在华产品的创新及孵化。在这之后,芮勇博士回归基础科研,加入微软亚洲研究院担任常务副院长,负责多媒体搜索、大数据挖掘等领域的研究,以及全院各领域的工程创新项目。芮勇在微软的17年涵盖了企业研发的四大支柱:战略制定,基础科研,创新孵化,及产品开发。

在做好企业研发的同时,芮勇博士也始终活跃在学术界。他是国际电气电子工程学会院士(IEEE Fellow) ,国际模式识别学会院士(IAPR Fellow), 国际光学工程学会院士(SPIE Fellow) 和国际计算机协会杰出科学家(ACM Distinguished Scientist)。获得美国及国际技术专利五十余项。他还是国际多媒体最权威学刊IEEE Multimedia Magazine的主编,也是国际计算机协会多媒体专委会 (ACM SIG Multimedia)中国区首任主席,同时还担任中国计算机协会常务理事。

谈及此次获得的IEEE CS 技术成就奖,芮勇表示:“获得这个奖项不仅是对我科研工作成果的肯定,更重要的是它将会鼓励更多年轻的研究人员投身于基础研究工作,意义重大。在微软的17年里,尤其是加入微软亚洲研究院以来,我有机会带领多媒体领域的各个研究组解决科研问题,实现技术突破并向微软的产品和服务中进行转化,让更多的用户能够真正享受到基础研究进步带来的成果。这对一位科研人员来说是非常值得自豪的。”


相关阅读:

Dr.Yong Rui Named Recipient of IEEE Computer Society 2016 Technical Achievement Award

Yong Rui wins IEEE Computer Society 2016 Technical Achievement Award

从密歇根湖畔到“中国硅谷”中关村——访微软亚太研发集团总监芮勇博士

动静之间,从视频到语言

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

和中国计算机学会一起做“面包”的十年

$
0
0

作者:微软亚洲研究院学术合作部中国区经理 马歆

今年春节期间,一则消息备受瞩目,国内外媒体都对此进行了广泛的报道——2016211日,在美国国家科学基金会召开的发布会上,LIGO研究者藉由他们在20159月发现的一个引力波信号像全世界证明了引力波的存在,此时离爱因斯坦首次提出引力波概念已经过去了一百年。

图片来自互联网 

我作为微软亚洲研究院学术合作部中国区经理,与学术圈的同仁们交往颇深,看到其他从事基础研究的科研人员做出有益于人类发展的技术突破自然有着切身之喜,但作为扎根于中国的科研人员,我们也会反思,面对这一类投入大、耗时长的重大基础科研发现时,我们能够缺席吗?

做好我们的“面包”

一百年前的中国正值内外交困的局面,但彼时的洋务运动却以“实用”为目的打开了西学之门,首次大量引进了西方的科技和著作文献,一定程度上帮助中国走上了现代化道路。与此同时,在太平洋西海岸的美国本土,美国著名物理学家、美国物理学会第一任会长亨利·奥古斯特·罗兰在美国科学促进会(AAAS)年会上做了题为“为纯科学呼吁”的演讲。该演讲的文字随后发表在了1883824日出版的《科学(Science)》杂志上,并被誉为“美国科学的独立宣言”。

亨利·奥古斯特·罗兰 

他说,“我时常被问及,科学与应用科学究竟何者对世界更重要,为了应用科学,科学本身必须存在,如停止科学的进步,只满足于应用,那么是无法取得长久进步的,而当我们追问原理,这些原理就构成了纯科学。我们能总是匍匐在尘土中去捡富人餐桌上掉下的面包屑,并因为有更多的面包屑而认为自己比他人更富裕吗?不要忘记,面包才是所有面包屑的来源。”

在科学家罗兰的这席话中,我们不难看出罗兰将基础科学研究比作是面包,而基于这些科学突破产生的应用则被称之为面包屑。一百多年过去了,我们做出了多少纯科学的“面包”?我想这是值得每一位科研工作者思考的问题。

学术界常会用论文发表的数量和质量来衡量一个人乃至一个国家的基础研究水平。近年来国内的科研水平发展迅速,以计算机科学为例,10多年前我刚加入微软亚洲研究院的时候,能够在国际顶级会议或期刊上发表论文的国内学者寥寥可数,如今在国际顶级会议上发表论文已不再算是什么大新闻了。

记得一个很有意思的小故事是在2005SIGIR大会的时候,那时我们的研究员都没有什么参与国际大会的经验。SIGIR每年收录论文标准及其严格,每界大会仅接受大约五十多篇。而那一年的SIGIR,单微软亚洲研究院就中了13篇论文,震撼了国际学术界。当时也就是现在微软亚洲研究院的常务副院长马维英博士还特别为研究员们做了统一的队服,研究员很初生牛犊不怕虎的就去参会了,十分高调也非常引人注目。也就是在那段时间,中国的学者开始越来越多的参与到国际学术的交流中,并发出自己的声音。从这个角度来说,微软亚洲研究院可谓与中国计算机科学基础研究是一同成长起来的。

守护未来的一代:优博十年

支持本地化人才培养是微软公司对中国教育的长期承诺。我非常有幸加入到了微软亚洲研究院的学术合作部,我不仅有机会与研究院内部的各个研究组进行交流,更能够与研究院外部的各个高校和学术机构打交道,进而了解微软能够帮助中国学术界做些什么。

秉承着同样理念的中国计算机学会秘书长杜子德在2006年找到了我们。熟悉子德的都知道,他是一位在计算机科技界极富影响力的活动家。当时中国计算机学会正着手设立“中国计算机学会优秀博士学位论文奖”(简称“优博”),该奖项每年评选一次,会在全国范围的优秀博士学位论文申请者中评选出不超过十名的获奖者。子德当时就邀请微软亚洲研究院来赞助支持“中国计算机学会优秀博士学位论文奖”。

中国计算机学会秘书长 杜子德

这个需求子德一说出口,我们当下便决定进行支持,理由其实很简单,微软亚洲研究院自成立之日起就践行着“为中国本土计算机人才”创造机会、与中国学术界共同成长的理念;这与中国计算机学会为一直以来致力于帮助中国计算机人才成长的做法不谋而合。子德曾说过想让中国计算机学会能够真正服务于计算机科学相关领域的人士,真正能做些实事来帮助他们,这也是中国计算机学会实行(个人)会员制的原因。

而为什么选择“优博”背后的想法也十分简单,因为中国计算机领域的发展与突破始终离不开对后备人才的培养的。10年前,每年评选的“全国优秀博士学位论文评选”(简称“全国百篇”)中各个学科竞争非常激烈,计算机领域的博士生获奖凤毛麟角这对推进信息时代的发展也是不利的。因此,微软亚洲研究院与中国计算机学会共同提出设立“中国计算机学会优秀博士学位论文奖”,对那些计算机领域博士期间取得优秀成绩的学生进行表彰,从而鼓励更多计算机科研领域的新鲜血液们作出更多创新。

今年,是“中国计算机学会优秀博士学位论文奖”走过的第10年,也是微软亚洲研究院赞助支持该奖项的第10年。在过去的9年里,有93位来自全国各顶尖高校和科研机构的博士获得了“中国计算机学会优秀博士学位论文”称号。而让我们自豪的是,他们之中大部分获奖者的科研经历都与微软亚洲研究院有着密切的联系,其中,有超过30人曾在微软亚洲研究院实习,18人获得了“微软学者奖学金”荣誉,有10名“优博”获奖者毕业留校后通过“铸星计划”项目以青年访问学者的身份前往微软亚洲研究院进行了半年的学术访问。此外,他们之中很多人的科研项目也都得到了微软亚洲研究院的支持。微软亚洲研究院与中国计算机学会的合作,从来都是身体力行。

帮助最新鲜的血液:青年教师

始于“CCF优秀博士学位论文奖”,秉承着同样的使命和愿景,微软亚洲研究院和中国计算机学会一直都在切身寻找有没有更多实际有效的方式来帮助青年学者。

2008年,“微软青年教师铸星计划”正式启动,中国计算机学会第一时间通过他们的渠道将消息扩散了出去。“微软青年学者铸星计划”为入选的青年学者提供为期六个月在微软亚洲研究院访问的机会,并为每一位访问学者安排微软员工作为研究合作伙伴,使他们能够亲身参与到微软亚洲研究院的研究项目中。有很多的青年教师便是通过中国计算机学会这样的一个平台了解到这个项目,并最后真的成为了微软青年访问学者。例如2010年的“优博”奖项获得者刘譞哲博士在2007年也曾获得了“微软学者”的称号,在他毕业几年之后,又通过“铸星计划”来到微软,与微软亚洲研究院主管研究员刘云新等人进行科研合作,后续在国际顶级会议和权威期刊中发表了多篇文章。如今,中国计算机学会也开展了“CCF青年人才托举计划”,这两者对于青年学者的帮助更是相得益彰。

微软亚洲研究院青年学者铸星计划2014级秋季班毕业合影

事实上,中国计算机学会和微软亚洲研究院的合作更多的是为青年老师提供一个平台,让他们有机会与领域内更多资深研究员进行交流对话,而这种交流的机会大多以活动的形式来呈现。目前,中国计算机学会最具影响力的系列性活动有青年计算机科技论坛(CCF YOCSEF)、中国计算机学会学科前沿讲习班(CCF ADL)、中国计算机大会(CCF CNCC)等等,而在这些活动上也都有微软亚洲研究院的身影。

青年计算机科技论坛(YOCSEF)正是中国计算机学会面向青年学者的一个极具创新和思辨的活动,论坛由来自全国有激情、有思想且有社会责任感的学者、企业家及其他各界青年精英参与策划、组织,就计算机领域的重大问题展开专题讨论,并进行及时研讨和思辨,向全社会发出声音。微软亚洲研究院的研究员们也多次受邀参与论坛并发表见解。记得我曾参与过2013YOCSEF举办的“在线教育是改良还是革命” 特别论坛,当时部分在场学者的观点十分具有前瞻性,如今这些观点正在被逐步印证。而去年屠呦呦获诺奖之后,YOCSEF又极有效率地举办了一次论坛共议屠呦呦获诺奖的启示:重大奖励评价应从项目到个人转变,非常勇于批评与自我批评,这对于学术研究也是十分难能可贵的。

中国计算机学会学科前沿讲习班(ADL)则让青年学者可以了解计算领域学科的前沿进展,加强学术交流,开拓科研眼界,提高学术水平,并为促进其职业发展提供机会。ADL围绕计算领域的不同专业开设,每年10期,每期3天,由国内外各领域顶级专家担任讲师,深入、系统地讲解计算领域的理论、技术和发展趋势,学员有机会和专家面对面沟通交流。创办两年来广受欢迎,每年的ADL,也都有很多来自微软亚洲研究院的研究员担任讲师。

微软全球资深副总裁、微软亚太研发集团主席、微软亚洲研究院院长洪小文在2015年CNCC大会进行主题演讲

而中国计算机大会(CNCC)是由中国计算机学会主办的全国计算机领域规模最大、规格最高的学术、技术、产业交融互动的大会。创建于2003年,会议包括大会特邀报告、主题论坛、专题论坛、展览展示等多种形式的交流活动。2015年十月在合肥举办的CNCC大会中,微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长洪小文出席论坛并做了以“人工智能时代:聚合智能、自适应智能、隐形智能和增强智能“为主题的演讲,而微软亚洲研究院与中国计算机学会推出的“互联网时代的人工智能”专题论坛,向在场听众分享了人工智能的前沿科技,并从技术角度对人工智能进行了深入解读,整个论坛现场十分火热。

做不容易做的事情

长久以来,学术机构一直承载着最先进技术的科研发展方向。在国外有IEEE(电气电子工程师学会),ACM(美国计算机协会)等学术协会,他们制定行业标准,在全世界范围举办讲座和会谈,促进学术界的交流与合作。可以说,如今人们能接触到的高科技产品背后都少不了这类学术机构在基础科研方面的推动。

在我国,中国计算机学会就是这样一只有着深厚积淀的坚实力量。在微软亚洲研究院与中国计算机学会的合作已走过十载时候,我们收到了来自于中国计算机学会十年合作的感谢牌,这其中包含的更多的是来自中国学术界对微软亚洲研究院在推动中国计算机领域发展的投入的肯定与赞扬。杜子德当时恳切地说:“中国计算机学会和微软亚洲研究院之所以能够合作十年,而且还要继续合作,非常重要的是双方均有崇高的价值观且取向高度一致,即都非常乐意为中国的学术发展和人才培养贡献力量。其次,双方在各自领域内都有很高的知名度,各自有独特的资源且有很强的互补性。经过十年的合作,双方彼此高度信任和默契,因而合作起来非常流畅。中国计算机学会和微软亚洲研究院的合作,应该称之为国内NGO合作的一个典范。”

本文作者 微软亚洲研究院学术合作部中国区经理 马歆 

2015年年末,在中国计算机学会第十一届会员代表大会上,微软亚洲研究院常务副院长芮勇博士当选了中国计算机学会常务理事,而我和微软亚洲研究院首席研究员周明博士则当选了中国计算机学会理事,这意味着我们与中国计算机学会的联系更加紧密了。担任中国计算机学会理事并不是一件轻松的事情,依照传统,如果理事缺席中国计算机学会的活动达到一定次数,便会强制开除出理事会,无论你在学术界有着何种地位。因此,这对芮勇博士,周明博士和我来说都是一份十分慎重的决定。但我们却未曾犹豫,因为这就像微软长期坚持推动计算机基础科研一样,不求回报的坚持走有价值、有意义的道路。

做“不容易的事”是基础科研的艰难所在,却也是科学理想与追求的最好体现。而这样的科学氛围与匠人精神正是我们所欠缺的。当下创业风潮火热,我们在欣慰的看到有更多的年轻人积极投身实践的同时,也要守住基础科研的一方天地,传播科学的精神与方法,不以一尺一寸之间的利益为目标,而是踏实做出一些有益于人类长远发展的突破——“面包”。这是中国计算机学会多年来一直坚守的准则,也是微软多年来一直坚持对基础研究投入的原因。

推荐阅读:

这就是微软为何如此重视基础研究的原因

芮勇博士荣获2016年IEEE 计算机学会技术成就奖

洪小文博士写给你的新年书单

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

前沿理论、反思创新、产学结合——你不能错过的WSDM 2016大会

$
0
0

第九届ACM网络搜索与数据挖掘国际会议(ACM International Conference on Web Search and Data Mining,简称WSDM)已于上周(222-25日)在旧金山腹地Mission Bay 会议中心举办。而今年的WSDM大会上,有关数字和经济的名词将会难舍难分。那些数据和隐藏在数字间的奥秘有时候就像一片等待寻宝人的宝藏,与会者们仿佛拿着数字的钥匙,转动了财富的锁。网络搜索、大数据、云、风投、经济这些你早已熟悉的词将被行业大佬和新秀们重新审视和讨论。

WSDM涵盖互联网和社交网络的搜索与数据挖掘方面的理论、模型、算法、评测、实验、应用等多个方面,既重视基础研究,也重视实际应用。正因为如此,WSDM越来越具影响力,并已经成为互联网搜索与数据挖掘领域的顶级国际学术会议,给网络搜索与数据挖掘领域的专家们提供了一个绝佳的交流平台。

今年的WSDM 2016会议设置了3场主题报告,4场实践和经验特邀报告,论文报告,5个研讨会,3次辅导报告,1场博士生论坛。此外,这次会议还特别设立风投产业日,并增加了WSDM CUP挑战赛项目。下面就让小编带你走进这场有关搜索与数据的盛会!


永恒的焦点——大会论文

WSDM极为重视会议论文质量,据了解,本届会议共收到来自全球368篇论文投稿,67篇文章入选,接收率仅为18.2%。而在这67篇论文中,微软研究院就贡献了6篇,一起来了解一下吧~

谁动了我的微博

当你将照片或者文字上传到微博或朋友圈,也许心中会默默期待那个TA的回复和转发吧!你的自拍或者分享又期待谁的点赞呢?到底谁动了我的社交平台?微软研究院的论文Who Will Reply to/Retweet This Tweet? The Dynamics of Friendships and Online Social Interactions给出了答案。论文颠覆了把社会纽带作为一个固定值的思维,进行动态关系讨论,并建立了一个模型,预测社交网络行为。

在论文中,研究员们收集了超过7千万公开的在线聊天互动的数据,并通过分析微博回复、转发等互动过程中的所蕴含的时间性、语境的要素,建立了一个预测模型。该模型可以预测如果你的发出一条微博,你的哪些朋友更有可能进行回复和转发。这项模型不仅揭示了现实关系如何影响网络社交行为,更为未来的在线社交平台应用的开发提供一些新的思路。事实上,微软亚洲研究院的这项工作也是目前为止,第一次从用户和微博内容上建立关于回复和转发的预测模型。

博采百家之言

当你在医院体检时,往往需要在不同的科室对身体的各项指征进行检查。医生也需要通过综合多项指标数据才能确定你健康与否。互联网广告商业也与此类似,我们也需要考虑用户、商家、网站信息的一系列信息才能做出最佳的报价评估。因此,在多观点学习研究中,不同信息观点之间的建模工作是一大挑战。

Multi-view Machines这篇论文正是基于这项问题提出了一种多视角机(multi-view machinesMVMs),MVMs可以被应用到各种各样的监督机器学习过程当中,并分析源自不同观点的特征之间是否存在关联和互动。相比于传统的模型,MVMs能够进行全阶相互作用分析,并能够更好处理稀疏参数估计。

发散思维找问题

在很多以“提问-回答”方式进行互动的网站,例如百度知道,雅虎知识堂等,如果你采用关键词检索的方法进行查询,经常会反馈出一些描述极为接近的问题。但事实上,还有很多问题的本质相近,问题描述的文字缺大相径庭的类似问题,例如“健身时我该如何安排自己的三餐?”与“运动期间需要注意的饮食问题?”这两个问题都是与运动和饮食相关的同质性问题。对于网站本身的检索反馈系统来说,如何将这类问题合并与同时呈现给用户是一个较大的挑战。

Learning Distributed Representations of Data in Community Question Answering for Question Retrieval这篇论文提供了解决该问题的一个新思路。微软的研究员通过将文字和问题同时嵌入空间向量办法,寻找不同描述的问题中暗含的联系,并使用上百万的数据进行反复训练,最终建立了一个高效准确的检索模型。同时,这篇论文中涉及的模型代码也开源到了Github,你可以访问https://github.com/ComputerHobbyist/cqa获取更多信息。

Multi-Score Position Auctions On obtaining effort based judgments for Information retrievalImproving IP Geolocation using Query Logs三篇论文则在付费广告拍卖、信息相关性和IP地理定位等方向提出了一些新的模型与算法。

产业与学术并进——风投产业日

学术研究的开展离不开产业的支持,产业的革命也依赖学术领域的突破。如何将二者有机的结合在一起,并促进二者共同前进,也是此次WSDM大会提出的思考之一。为此,WSDM 2016创新性地设立了风投产业日。

在活动当日,与会人员主要围绕了网络搜索与数据挖掘和风投产业的互动这一议题展开讨论。大会还特别邀请了微软集团全球执行副总裁陆奇博士做了题为“一个新兴数字社会的剖析:从产业发展前景窥探未来”(the Anatomy of an Emerging Digital Society: A Look into the Future from an Industrial Development Perspective)的主题演讲。

微软集团全球执行副总裁 陆奇

IT行业正在快速进入移动和云的时代,移动设备和云设备正从本质上改写我们的产业与社会,如何激发我们的潜力并打造出新一代功能更加强大的数字平台是全球工业界与学术界研究者共同面临的挑战。同时这也是一次极大的机遇,而我们期待与你共同挑战未来。

学术搜索排序的未来——WSDM CUP

相比于往年的WSDM大会,本次大会的新增项目WSDM CUP学术搜索挑战赛环节更是十分引人注目。首届WSDM CUP是由微软研究院和著名学术出版商Elsevier共同举办的,以论文搜索排序为题,号召学术界为学术用户探索出合理有效的论文搜索排序算法,以期改善文献检索体验。

事实上,对于每个科研人员来说,了解行业内的研究动向十分重要。当某些细分方向某些论文提出了某一新观点,虽然短时间内相关论文的引用数相对有限,但并不影响学者们对此类论文的重视度。但目前通过关键词进行查询,出现在搜索结果前几位的论文往往是那些引用次数较高,但观点可能不甚新颖的“旧论文”,学术界的新星论文却不易被学者们获取。近年来,国内外的学术界也一直在反思以引用数衡量论文质量是否合理,并开始倡导发展更加丰富多元、求真务实的评价机制,但落实到文献检索工具,则苦于没有更为合理的排序策略能够取代传统的引用数排序。

整个WSDM CUP分为三个阶段,在大会开始之前,参赛者们经过重重筛选,仅有少数参赛队伍能够进入决赛。值得一提的是,在学术搜索挑战赛的第二阶段,由初赛中获胜的八只队伍优化过的算法进入了微软必应学术搜索中,面向所用用户进行了公测。因此,在此期间进入必应学术搜索中进行搜索行为的用户们,你们的搜索将决定着学术检索算法的未来。(相关活动信息已在微软亚洲研究院的微博、微信以及相关网站页面进行了公开。)

此外,基于此前WSDM CUP挑战赛过程中,部分公测用户热情贡献的建议和想法,微软学术搜索开发了极具创新性的语义搜索功能,完善智能搜索的新体验。通过语义搜索技术,搜索引擎的工作不再受限于用户所输入查询的字面本身,而是透过现象了解本质,准确地捕捉到用户所输入语句后面的真正意图,并以此来进行搜索,从而更准确地返回最符合用户需求的搜索结果。

例如,用户希望了解学术领域“speech recognition”的内容,具体到微软研究院的洪小文院长(Hsiaowuen Hon)在学术会议(ICASSP)发表过的某篇文章时,可采用如下查询:papers about speech recognition by hsiaowuen hon in icassp。该查询通过语法开关papers启动语义查询功能,并由语法介词by标示作者,in标示会议;同时,语法介词可多次叠加,以优化的搜索结果,如about可用来细分领域、by标示多个合著作者、from标示作者单位或限定作者于某段科研经历期间发表的论文等等。

此外,微软学术搜索还带来了全新的筛选功能。搜索结果中,与主题相关的内容会分别展示在多维度过滤条件中,供用户筛选搜索结果。如搜索主题为洪小文(Hsiaowuen Hon),其合著作者、研究领域、发表期刊、参加会议、所在机构等,均可作为筛选条件展示在过滤器中,选中相应条件即可过滤内容,获取更精准的论文搜索结果。快去试试吧~~

BIG 2016 CUP编程挑战赛

WSDM CUP论文搜索挑战赛只是探索论文排序搜索未来的第一步,如果你还在遗憾过错了这个改变论文排序搜索未来的机会,那么也许今天刚刚开放报名的BIG 2016 CUP你不该错过。

BIG 2016 CUP是大数据创新收集大会(BigData Innovators Gathering)的一部分,将与WWW 2016大会同时进行,关注的焦点主要集中于大数据与网络领域。此次BIG 2016 CUP主要关注的问题是数据库中论文和作者匹配错误的现象。BIG 2016 CUP希望参赛者可以从机器学习、信息检索、图数据分析等多个角度入手,提供一个可以验证论文和作者是否匹配的RESTful服务端口。

相比于前几届BIG编程挑战赛,本次BIG 2016 CUP更加鼓励将数据处理和在线查询相结合的创新解决方案。微软则为本次挑战赛提供了微软学术图谱数据集和在线的图查询编程接口。如需了解更多详情,请访问http://big2016.org/big-2016-cup/

相关报名地址:https://cmt3.research.microsoft.com/User/Login?ReturnUrl=/BIG2016



推荐阅读:

【年度学术大会合集】SIGGRAPH,KDD,AAAI,NIPS…这些你想参加的会议

从第一步,到每一步:微软学术搜索

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

AAAI-16: 源远流长,博大包容

$
0
0

本文作者:微软亚洲研究院实习生 孙诗昭

AAAI是人工智能领域的顶级会议,每年举办一次,今年已是第30届,可谓源远流长。这届的AAAIAAAI-16)共收到2132篇投稿,最终录取549篇,其中包括了自然语言处理,机器学习,信息检索,机器人,以及博弈论等多个领域的文章,涵盖了人工智能领域的方方面面。AAAI-16的举办地在美国亚利桑那州的菲尼克斯,这是一个干旱炎热的热带沙漠城市。虽然会议在2月份举办,当北半球绝大多数地方正处于寒冷的冬季,菲尼克斯的气温仍在30摄氏度以上。此次会议为期6天,前两天是主题讲座(tutorial),后四天是特邀报告(invited talk)及技术研讨会(technical session)。

AAAI-16的举办场所Phoenix Convention Center
AAAI-16参会人员正在排队注册


丰富多样的主题讲座和特邀报告

AAAI-16共举办了16场主题讲座,每场持续4个小时。这些主题讲座严谨考究地梳理了某些特定研究领域的发展历史和前沿成果。今年的主题讲座中,有对人类与人工智能的探讨,如Organ Exchanges A Success Story of AI in HealthcareAI for Disasters等;有为人工智能新人准备的入门讲座,如Deep Learning: from Foundations to ImplementationHow to Automatically Machine Read the Web等;有人工智能领域的方法及理论的探讨,如Symbolic Methods for Hybrid Inference,Optimization, and Decision-makingAnswer Set Programming ModuloTheories等。其中,Deep Learning: from Foundations to Implementation是最为火爆的一场主题讲座,不仅座无虚席,甚至在过道中都站满了人。这场讲座从线性分类器讲起,指出了在特定的特征下,所有的分类的问题都可以用线性分类器解决。因此,问题便转换成为如何提取好的特征。在机器学习发展的历程中,人为的手动挑特征和利用核函数生成特征都是比较常用的方法。然而,人为的手动挑特征效率极低,不适合在高维特征和复杂问题时使用;核函数的设计不仅十分困难,并且依赖于具体问题。神经网络提供了一种从数据中学习恰当特征的方法,它有效地避免了人为的手动挑特征和核函数的弊端。

此外,AAAI-16还举办了多场特邀报告。特邀报告的主讲人既有来自高校的著名教授,也有来自企业界的项目负责人。比起主题讲座,特邀报告更加宏观,更加偏重对人工智能领域发展的展望和预测。例如,AAAI主席Tom G. Dietterich教授阐述了人们对于稳健AI的需求,提出了通往稳健AI8种途径;Toby Walsh教授组织了关于人工智能与劳动力市场的讨论,分析了人类如何面对越来越多的工作不断的被自动化的机器所取代的趋势等等。

特邀报告准备中
座无虚席的特邀报告现场


别出心裁的学生活动

在多场主题讲座,特邀报告和技术研讨会之外,AAAI-16还为学生特别主办了多场活动。其中最为火爆的是招聘会(job fair)和快速约会(speed dating)。在招聘会中,由AAAI的主办方请来了多家业内顶尖公司,其中国内的百度,华为和嘀嘀打车也前来参与招聘。AAAI-16的参会学生可以自由参与招聘会,听取招聘方的介绍,投递简历及与招聘主管面对面交流。

在快速约会中,参与的学生每四人为一组,在五分钟之内互相介绍自己的研究兴趣。当五分钟到时,铃声会响起,学生轮流依次交换座位,形成新的四人组,向新的伙伴介绍自己的研究兴趣。在为期一个小时的快速约会中,我认识了很多和我有同样研究兴趣的同学,其中既有来自国内高校的也有来自国外高校的。此外,通过和一个做强化学习(reinforcement learning)的同学的交流,我快速地理解了最近兴起的深度强化学习(deep reinforcement learning)和传统的强化学习的区别。由于AAAI是一个综合性的会议,在快速约会中我还与不同研究方向的同学进行了交流,比如来自自然语言处理,博弈论等方向的同学,这一类活动的举办对于年轻的参会学生来说是非常有益的。 

微软在AAAI-16

微软在AAAI-16在主会场设置了自己的展台。在茶歇时,很多参会者都会到展台观看产品介绍,与工作人员互动和了解招聘情况。此外,微软还向参会者着重推荐了自己的分布式深度学习工具:CNTK。与其他的深度学习开源框架相比,CNTK具有效率上的巨大优势。这种效率优势不仅体现在单机单卡的环境下,而且在单机多卡及多机多卡上均有体现。事实上,微软亚洲研究院的机器学习组(Machine Learning Group)目前仍然在致力于用他们推出的开源分布式机器学习工具DMTK来提高CNTK在多机多卡时的运行效率,期待DMTKCNTK的结合可以为我们带来更高效、更易用的分布式深度学习工具。

微软的分布式深度学习工具

微软亚洲研究院在AAAI-16上发表了多篇论文,可谓收获颇丰。这些论文来自多个方向,比如来自信息检索领域的文章Improving Recommendation of Tail Tags for Questions in Community Question Answering,来自机器学习与网络领域的文章Hashtag-Based Sub-Event Discovery Using Mutually Generative LDA in Twitter等。

我们团队的论文“On the Depth of Deep Neural Networks: A theoretical View”是一篇关于深度学习理论的文章。深度学习在各个应用领域取得的成果不胜枚举,但是在理论方面却相对欠缺。我们的论文将关注点放在神经网络的深度上,从统计学习理论的角度,研究了深度对深度神经网络泛化能力的影响。我们的理论结果定量地描述了:随着深度的增加,神经网络的泛化性能(用Rademacher Complexity衡量)变差,但是逼近性能(用Betti Number衡量)变好。从而,神经网络存在最优的深度。我们在论文的准备过程中,首先重新回顾了神经网络理论的发展历史。在90年代,神经网络曾经风靡一时,涌现出了一大批关于神经网络的理论的文章。由于当时计算机计算能力和数据规模的限制,所用的神经网络大多不是深层的,因此这个时期的理论也没有关注深度问题。2006年之后,深度神经网络被重磅推出,然而,对于深度神经网络,很多现象都难以用90年代的理论去解释了。这也是我们做这篇文章的初衷。我有幸对我们的工作进行了口头报告。值得高兴的是,我们的工作得到了大家的关注,报告现场挤满了人,报告结束后后举手提问的人也非常多。这个是让我非常意外又惊喜的事情,因为在准备过程中我一直有点担心理论的文章受众范围小并且难以让观众快速理解,从而造成提问环节的冷场,但事实上大家对这个理论问题还是很感兴趣的,也愿意多了解一些。

总的来说,这次参加AAAI-16让我收获颇丰。AAAI是一个综合性很强的大会,在会议上我接触到了很多新的领域并且认识了不同领域的研究者。此外,AAAI组织的各种主题讲座和特邀报告请到的都是非常资深的研究人员,从他们身上我不仅学到了新的知识,还学到了很多演讲技巧。会议的整体氛围也很好,无论是在中场休息(coffee break)还是海报环节(poster session),随处可见讨论的人。

作者介绍

我是孙诗昭,是微软亚洲研究院的一名实习生,现在就读于南开大学,同时也是南开大学-微软亚洲研究院联合培养博士项目的一名成员。我的研究兴趣是深度学习理论和并行化机器学习。

微软亚洲研究院的实习经历使我成长许多。在这里,我从优秀的研究员们身上学到了很多。除了学到了如何完成论文之外,我还收获了很多其他技能,比如团队的合作,时间管理,进度控制等。此外,在研究院我还认识了很多非常棒的实习生,他们都可以说是身怀绝技各有所长,与他们一起学习生活给我带来了很多乐趣。

 

 


了解微软亚洲研究院实习生项目,欢迎关注“明日之星”实习生项目介绍。更多实习机会请见:http://www.msra.cn/zh-cn/jobs/interns/internopenings.aspx





推荐阅读:

前沿理论、反思创新、产学结合——你不能错过的WSDM 2016大会

【年度学术大会合集】SIGGRAPH,KDD,AAAI,NIPS…这些你想参加的会议

机器学习的盛宴:NIPS 2015

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 

始于最初的念念不忘,最终必有回响

$
0
0

——记微软亚洲研究院主管研究员罗翀

又是一年“三八国际妇女节”,如今的女性在各行各业都绽放着她们独特的温柔力量,让世界充满了爱与想象。但我们不能忽视的是,目前在STEMS代表Science科学,T代表Technology科技,E代表Engineering工程,M代表 Mathematic数学)这类学科的教育中,女性参与的比例仍然较少。今天,微软发布了一个视频来鼓励全世界的女生们参与到计算机科学教育中来,一起“创造未来”。

对科学的热爱是不分性别的。在微软亚洲研究院,同样也有着这样一批独立、自信、热爱科学的女性,她们有时会被打上各类标签,如“女博士”、“智商超群”、“勇于尝试”、“有韧性”…… 但这些标签通常都是外界的想象,而当你与她们接触时,你会发现她们与世界上的大多数人都是相同的,会在取得成绩时喜悦,也会去寻找工作与生活之间的平衡;但她们每一个人又是如此的与众不同,因为她们用自己的力量投身于基础科学研究,拥有着力图用科研影响世界的魄力。

这一次,与我们分享她的故事的是微软亚洲研究院网络多媒体组的主管研究员罗翀博士。在2000年与微软亚洲研究院初次结缘便念念不忘,直至今日,已经过去了十多年,罗翀一直坚持在基础研究的前线,主攻于多媒体通讯,无线速率适配,传感器网络和多媒体云等领域,并始终乐在其中。


能力出众,筑梦微软亚洲研究院

 “选择基础研究这条道路,可能一开始并不是显而易见的,但也并不是意料之外。” 罗翀博士回忆道。罗翀出生于上海,深受均为数学老师的父母潜移默化地影响,罗翀从小就显现出来她对数学的热爱和天赋。1996年,罗翀收到了复旦大学的录取通知书,在选择专业时,罗翀博士很自然的选择了当时火热的且与数学密切相关的计算机专业。

在进入大学之后,计算机专业的数学课并没有难住这个上海女孩。本科期间,罗翀在所有和数学有关的科目上都拿了A,这让她成了当时复旦大学计算机系里的一个“传说”。罗翀与微软亚洲研究院的结缘开始于她的本科毕设时期。那时,罗翀刚进入学校的多媒体实验室不久,她的导师便推荐她去微软亚洲研究院的张宏江博士那里去访问实习。出于对科研的好奇和对微软亚洲研究院的向往,在2000年的春天她来到了微软亚洲研究院,也正是这一段实习经历,在罗翀的心中埋下了科研的种子。

当时罗翀的导师是陈向荣博士和晏洁两位行业新星,研究课题是目前依旧火热的人脸检测问题。虽然罗翀与微软亚洲研究院的首次接触只有短短不到三个月的时间,但她在这里接触到的研究环境是过去在大学中不曾体验过的,而这里先进的研究理念、热情年轻的态度以及影响世界的雄心壮志深深感染了她。于此同时,罗翀优异的科研能力也给张宏江博士留下了极为深刻的印象。当时张宏江博士盛情挽留罗翀,希望她能留在微软亚洲研究院工作,这也是微软亚洲研究院向本科毕业生敞开大门的先例之一。但当时罗翀已经拿到了新加坡国立大学硕士录取通知,虽然罗翀在那一年的初夏惜别了微软亚洲研究院,但她相信有一天她还会回到这一片充满激情和梦想的热土,而来自微软亚洲研究院的这一份执着的研究精神,也一路伴随着她接下来的研究道路。

硕士期间,罗翀的科研依旧非常顺利,她也顺利地拿到了美国高校的博士录取机会,似乎所有事情都在朝着顺利的方向发展,但此时一场看似无关的事件却改变了这一切。

阴错阳差,再续前缘

2001年,911事件爆发,国际局势瞬间变得微妙而紧张。在911事件爆发之后,很多前沿技术行业的人员申请美国签证必须进行安全审查。罗翀博士的研究领域人脸识别正是必须接受审查的专业之一。虽然罗翀对于安全审查颇为自信,但寄出去的资格申请却一直杳无音讯。签证也迟迟未来…… 多年后,有传言说,大使馆的安全审查机构遭遇了一场火灾,很多资格申请表都付之一炬,而这个传言是否真实也无从查证。于是,这场“大火”阴错阳差的推迟了罗翀的博士梦,但也帮她和微软亚洲研究院之间再度牵起了“姻缘线”。

在等待签证的期间,微软亚洲研究院再次向罗翀伸出了橄榄枝。 20036月,罗翀博士正式加入了微软亚洲研究院大家庭,从事多媒体方向的研究。接下来的几年,罗翀全身心地投入研究工作,也拥有了自己的家庭,可她心头一直有一株小火苗在跳跃着,这株小火苗就是她意外中断的博士梦。对于一个女性而言,再去深造读博士似乎十分困难。但幸运的是在2006年,她燃烧了多年的博士梦在微软亚洲研究院找到了出口。

千呼万唤,圆梦微软亚洲研究院

2006年初, 一个去上海交通大学读联合培养博士的机会出现在了罗翀的面前。这个项目由微软亚洲研究院和上海交通大学联合举办,该联合培养博士生项目能够整合高校和微软亚洲研究院双方优势资源,为计算机领域输送创新人才。微软亚洲研究院的研究员们也能够借此机会进一步深造。罗翀当时的老板李江第一时间推荐并通知了她,得到这个消息的时候,罗翀惊喜地反复确认了好多遍才敢相信。

这个项目得到了微软亚洲研究院的全力支持。在项目期间,微软亚洲研究院不仅给研究员们提供了全额的学费以及机票费用,甚至在研究员读博期间工资全额照发。同时,为了保障这群博士生们的工作需求,微软亚洲研究院还特地在微软离上海交大最近的办公室为研究员们安排了工位。

因此,罗翀和其他6位研究员享受了既拿学分又拿工资的踏实的校园生活。其实,微软亚洲研究院对参与这个项目的研究员们并没有什么硬性的要求,例如毕业之后一定要为公司服务多少年等等,相反微软切身的为这些研究员们考虑了一切,用各种方式充分保证了研究员们能够安心完成学业。这么多年过去了,当时参与这个项目的6位研究员无一例外的都仍在微软,这让人十分动容。采访中,罗翀说:“那是一段难忘的经历,不仅重回校园、圆梦博士,更感激的是微软亚洲研究院所带来的家的感觉。”

从博士到博导,从圆梦到助梦

在读博士期间,罗翀的研究和工作几乎毫无冲突。2009年在移动通讯的国际顶会MobiCom上,罗翀博士的论文Compressive Data Gathering for Large-Scale Wireless Sensor Networks 成功发表,并成为了当时中国大陆第一批在MobiCom会议上发表论文的学者,这在当时是很多人都不敢想象的。

罗翀博士说,她论文的发表需要感谢两个人,一个是她当时的老板吴枫,另一个便是她的丈夫。当时罗翀做的研究是将压缩感知技术应用到无线传感器当中,用来做传感器网络高效能的数据搜集。尽管那时中国大陆还没有论文在MobiCom大会上发表过,但她的老板十分鼓励她去实践这一想法。此外,在准备论文期间,她的丈夫也在家庭生活中为其工作全力提供了支持。工作和生活的平衡,缺少不了来自同事的信任和家人的支持。

罗翀和她的双胞胎女儿

除了做好自己的本职工作,罗翀博士还希望能用自己的能力影响更多人。从完成自己的博士梦想,到培养出自己的第一个中国科学技术大学(中科大)博士生,再到如今担任中科大的博士生导师,罗翀博士不仅仅实现了自己的博士梦,更在帮助更多的学生实现他们的博士梦。


梦想接力,你也可以

有的人认为,当女研究员很酷;也有人认为,当女研究员很苦。但在罗翀博士看来,个人的职业规划、选择与个人的兴趣爱好密切相关,而与性别无关。有的人天生就喜欢做研究进入研究机构,有的人也天然热衷于相夫教子选择回归家庭,这都是个人兴趣之下的选择,并不存在差别。在IT公司里女性虽然较少,但是女性对整个工作环境能够带来润滑的作用,还能增进一个团队的向心力。

对于年轻的女性研究员,罗翀博士认为,“如果你对这个行业是发自内心的热爱,并且能够证明自己有能力做好研究的话,就不要有太多的顾虑。社会上有很多顾虑,如家庭方面、工作压力方面,而事实证明很多事情都是可以兼顾的,不仅仅是我,微软的很多女性研究员都证明了这一点。只要你自己喜欢研究并相信自己的能力,那你一定能做到!”




相关阅读:

Jennifer Chayes: 生活始终在你手中

马歆: 内外兼修 垦育研究院人才成长的沃土

黄泠:收放自如 把握研究院的经络脉门

欢迎关注

微软亚洲研究院官方网站:http://www.msra.cn

微软亚洲研究院人人网主页:http://page.renren.com/600674137

微软亚洲研究院微博:http://t.sina.com.cn/msra

微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:


 
Viewing all 620 articles
Browse latest View live