今日要闻
新智元专栏
作者:邓侃
编辑:三石
[1]
如果说计算机的理论基础,归功于图灵,计算机的工程实现,归功于冯诺依曼设计的计算机体系。那么商用计算机的研制,尤其是硬件,头号功臣应该是 IBM,软件的头号功臣,应该是 Bell Labs,因为 Bell Labs 发明了 Unix 操作系统和 C 语言。
IBM TJ Watson Research Center 在纽约北边,Bell Labs 在纽约西南,两地相距 1 个多小时车程。这两个研究中心有很多相似之处,譬如走进正门,醒目位置都是历史陈列室,里面都陈列著各自的大神及其成就。
走进 Bell Labs 历史陈列室,自然要去拜拜 Ken Thompson 和 Dennis Ritchie 两位大神,Unix 操作系统的第一版,主要由 Ken Thompson 研发,而 C 语言,基本是 Dennis Ritchie 的作品。
说到操作系统,不能不提另一位大神,Abraham (Avi) Silberschatz。他执笔写的《Operating System Concepts》一书,深入浅出,要言不烦,是操作系统的经典教科书。不仅如此,他还写了 PPT,方便教学,非常贴心。这本教科书,一版再版,至今已经第十版了 [1]。
除了《Operating System Concepts》,Avi Silberschatz 还写了另一本经典教科书《Database System Concepts》。这本书也保持了他的一贯风格,深入浅出,要言不烦,还附带 PPT。这本书也一版再版,至今已经第五版了 [2]。
如果一本书成为某个领域的经典教科书,被广泛接受,那么被书中重点介绍的内容,便成为事实上的业界标准。如果中国学者能写一本人工智能的教科书,被全球引为经典,将会极大地促进中国,引领全球人工智能的发展。
Figure 1. 《Operating System Concepts》各个历史版本的封面。
http://codex.cs.yale.edu/avi/os-book/OS10/covers-dir/index.html
Figure 2. 《Database System Concepts》各个历史版本的封面。
http://db-book.com/
[2]
之所以一版再版,是因为相关技术更新很快,不仅需要添加新内容,而且先前的技术,有些已经被淘汰,需要删减。
早年的计算机使用磁带作为存储介质,后来被淘汰了,于是相关的串列存储内容,需要删减。随着云计算兴起,虚拟机渐热,这部分内容需要添加。另外,移动互联网使得安卓手机操作系统变成热门,安卓的内容也得添上。
以特斯拉为标杆的智能汽车,以大疆为标杆的无人飞机,以波士顿动力为标杆的机器人,涉及的硬件不同,需要解决的任务也不同,它们对操作系统提出了新需求。
不仅操作系统的教科书,要与时俱进,其它方向的教科书,也需要跟得上技术发展的节奏。
《Artificial Intelligence: A Modern Approach》初版于 1995,当时被学界誉为人工智能经典教科书。2003 再版,2009 年出第三版。从 2009年到现在,快 10 年了,没有再版。从 1995年到现在,人工智能技术取得了巨大的进步,尤其是深度学习的进展日新月异。现在深度学习几乎成了人工智能的同义词。如果要出版《Artificial Intelligence: AModern Approach》第四版的话,估计 2/3 的内容要重写。
如何才能快速地撰写并更新教科书呢?
Figure 3. 《Artificial Intelligence: A Modern Approach》第三版封面。
http://aima.cs.berkeley.edu/cover.html
[3]
自然语言处理(Natural Language Processing, NLP)是人工智能的一个分支。这个领域的经典教科书是《Speech and LanguageProcessing》。这本书的第一版,于 2000 年前后出版。其实这本书的草稿,在 1997 年前后,就已经在学界流传,并广受赞誉了。
Figure 4. 《SPEECH and LANGUAGE PROCESSING》第一版封面。
这本书最初是一本论文汇总,选择了若干优秀论文,根据不同主题,编排成若干章节。当时这本论文汇总的内容,偏重于 Speech Recognition,NLP 的内容不太丰富,而且几乎没有深度学习的内容。
Figure 5. 《SPEECH and LANGUAGE PROCESSING》第一作者Daniel Jurafsky。
本书的主要作者,是 Daniel Jurafsky。Dan 说,这本书最初只是一个论文精选目录,目的是让同学们快速了解该领域的研究前沿。后来同学们觉得一篇一篇下载论文原文 PDFs,太麻烦。于是,Dan 把这些精选论文汇总成册,为懒人们提供方便。
后来懒人们又建议,读论文全文,太费事。要是能对每篇论文,做个简单介绍,深入浅出,要言不烦,那就更方便了。于是 Dan 又继续做好人,写论文介绍,逐渐形成这本书的第一版。
现在这本书的内容,已经完全变样了。Speech Recognition 的内容,被大大缩编,而且被放进正文后的附录中去了。传统的 NLP 方法,舍卒保车,主流的传统方法被保留了一些,支流几乎消失殆尽。同时,大大强化了深度学习的最新成果的介绍。
Figure 6. 《SPEECH and LANGUAGE PROCESSING》第三版目录。
Daniel Jurafsky 本科博士受教于加州大学伯克利分校,毕业后去 University of Colorado Boulder 任教。在这期间,他不仅做出了很多亮丽的研究成果,而且持续更新《Speech and LanguageProcessing》的内容,逐渐成为 NLP 领域大师。随后,Dan 转校到斯坦福大学任教。
Dan 的成功经验,有三点值得重视,1. 广读论文,并且写读后感,2. 把众多读后感,分门别类编辑成书,3. 持续更新书的内容。
[4]
单枪匹马地更新教科书,工作负担太重。
2018年9月9日到14日,DeepMind 主办 Deep Learning Indaba 2018 学术会议,会上有专家梳理了 NLP 前沿进展,并发表演讲 [4]。该演讲广受业界好评。
如果比较一下近年来 NLP 的前沿进展,与《Speech and Language Processing》的内容,会发现刚刚出版的经典教科书,又需要更新了。一本书从写作到印刷出版,至少要一年。而最近深度学习的进展实在太快,一年前的话题,已经略显老旧。
一个可能可行的办法,是发动学者们共同协作,既是读者,也是作者。
1. 先在 GitHub 上罗列一个精选论文清单,类似于这样 [5]。值得特别点赞的是,这个论文清单,是中国学者罗列的。
2. 发动相关学者,给每一篇论文写介绍,深入浅出,要言不烦。
3. 把众多论文的介绍,根据不同主题,串连成章节,形成教科书。
4. 定期出版教科书的最新版本,并持续更新论文清单和论文介绍。
Figure 7. A review of the recent history of NLP
https://www.kamperh.com/slides/ruder+kamper_indaba2018_talk.pdf
Figure 8. 生物医学领域的机器学习应用的论文清单
https://github.com/xuhanvsxuhan/An-Incomplete-ML-Paper-Collection-for-BioMedical-Applications
参考文献:
1. Operating System Concepts
http://os-book.com/
2. Database System Concepts
http://db-book.com/
3. Speech and Language Processing
https://web.stanford.edu/~jurafsky/slp3/
4. Frontiers of Natural Language Processing
https://www.kamperh.com/slides/ruder+kamper_indaba2018_talk.pdf
5. An Incomplete ML Paper Collection for BioMedicalApplications
您可能敢兴趣
声明: 凡注明为其他媒体来源的信息,均为转载自其他媒体,转载并不代表本网赞同其观点,也不代表本网对其真实性负责。如系原创文章,转载请注明出处; 您若对该稿件内容有任何疑问或质疑,请即联系,本网将迅速给您回应并做处理。邮箱:mail@laishu.com
为您推荐
校园贷再曝乱象这到底是什么情况,了解最新消息?
2018-04-15 21:34
8月分手魔咒:不平衡的爱情注定走不远
2018-08-21 11:37
饮食提醒切记红薯的“死对头”
2018-02-21 03:39
红唇族加烟酒 罹癌增123倍 医师告诉你危害不只这些...
2019-11-06 17:37
秋葵,生菜
2020-01-27 07:42:15
滑坡毁百年铁轨 怎么回事
2019-02-02 05:46
解读改善你的饮食的3款创新菜肴
2018-02-25 03:39
李湘为女儿庆生 一家人真是太有爱了
2019-01-25 19:26
生完二胎后首露脸!福原爱瘦14公斤身材纤细
2019-07-27 12:32
2018CBME孕婴童展益生碱奏响全球备孕最强音
2018-08-01 13:46
月经不调饮食来调
2018-04-01 10:37
粗盐热敷4个部位治好4大顽疾可惜很少有人会用
2019-03-05 22:46
讨厌金牛座的人 是因为不懂金牛座 他们其实和你想像中的不同
2019-07-02 16:13
他才出生四天,四肢黑到要截肢、一碰就可能死亡!这一切只因爸妈一个无知的决定…
2018-02-17 12:45
石家庄现天价板面 为何如此天价 哪些人来吃
2019-02-02 04:47
统一西武双狮联名活动 日职传奇球星东尾修开球
2019-07-15 21:31
街头最红三大台式水果茶!!斗分量斗特色斗选择
2018-05-13 22:37
9个月婴儿如何进行认知能力训练
2018-02-15 01:00
最会伤人、伤人至深的十二星座排行榜 人必有一死 死于天蝎或死于水瓶
2018-05-03 06:34
对现任够深情 对前任够狠心的星座 第一名:金牛座
2019-07-08 16:18
滴滴顺风车回归 具体何时能归 消费者:等你回归
2019-04-15 20:39
从“出汗多”看体质?谨记养生方法,值得收藏!-今日头条(www.toutiao.com)
2018-01-11 23:45
备孕 你知道备什么吗?
2018-09-05 09:51
宝宝颅内出血、脑死亡竟是因为掉床 孩子坠床后万不可做错这3件事…
2018-10-16 12:57
日职/令和的怪物石垣岛初上陆 专属商品卖翻天
2020-09-17 12:51:25
新光三越彩虹市集改装结集60家餐厅品牌这5家人气超旺
2018-05-11 12:39
蝉联七年癌症死因第一名!预防大肠癌吃两物:越浓稠越抗癌,日本人爱吃、不想得癌更要吃|每日健康 Health
2019-03-21 21:53
每日排尿1500CC. 与尿路结石说再见
2019-10-25 18:35
原来这个八卦卦序的原理是这样的 其背后隐藏高深的宇宙奥秘
2018-05-10 04:36
只不过用硬币刮“这里”,不到3天!!五脏六腑的毒素竟然全排光了!便秘没了、气色也好了!效果太惊人。。。
2018-01-27 16:45
今日要闻
Dr. Martens联名X-GIRL释出霸气厚底系列!音乐人、潮流人都该来一双
真的来了!GD亲晒PEACEMINUSONE x Nike AF 1,白色“Para-Noise 2.0”超欠买!
adidas推出城市Online Run!王阳明、雷理莎脚踩Supernova、Boston 9限定鞋畅跑信义区
德国鞋履品牌Trippen秋冬新入荷!经典&创新任你选!
阿部千登势再推神作!sacai x Nike Vaporwaffle联名释出,四款新色攻陷你的荷包!
还有机会入手!Off-White x Air Jordan 5“色违”版本联名鞋即将开卖
Joel Embiid首代签名篮球鞋“UA Embiid One”台湾正式发售
Dr. Martens经典再进化!Heritage Distortion系列“双黄线”震撼登陆