中国有句老话,叫做“知易行难”。
作算法的朋友应该更有体会,想把 paper 上的公式转变为可以运行的代码,这是件考验功力的事情。
Toby Segaran 写的这本《Programming Collective Intelligence》,是修炼此种功力的武林秘笈之一。
这本书最显著的特点是,实战性极强!
针对每个算法,他从头到尾演示了一个完整的实现过程:从获取数据,组织存储,到算法实现,加载运算,再到最后的结果的分析利用。书中所有的例子均基于实际系统的真实数据,作者演示了大量的开放 API 的使用,Delicious、Amazon、Last.fm、Google News,各个都是大名鼎鼎,每步都是真刀真枪。跟着书中的操作这样一趟走下来,你会豁然开朗,原来这些看似神秘复杂的系统,也不过如此。但不幸的是,其中的大部分 API 已经不能工作了。比如 del.icio.us API,你就得换这个了,http://www.michael-noll.com/wiki/Del.icio.us_Python_API。