Archive for December, 2007

2007年总结

Monday, December 31st, 2007

07年马上就过去了,总结一下还是很有必要的。受一些人的影响,也分以下几个部分:

一、所购图书

A. Topics on complex systems:

1 Scale-free networks: complex webs in nature and technology, G. Caldarelli, Oxford University Press, 2007
2 Systems Biology, Isidore Rigoutsos, Gergory Stephanopoulos, Volume I: Genomics, Oxford University Press, 2007
3 Systems Biology, Isidore Rigoutsos, Gergory Stephanopoulos, Volume I: Networks, Models and Applications, Oxford University Press, 2007
4 复杂网络,郭雷,许晓鸣,上海科技出版集团,2006
5 Complexity and Criticality, Kim Christensen, Nicholas R. Moloney, 复旦大学出版社,2006
6 Modeling Complex Systems, N. Boccara, Springer, 2004

B. Topics on my major.

1 Introducing Molecular Electronics, G. Cuniberti, G. Fagas, K. Richter, Springer, 2006
2 Electronic Structure: Basic Theory and Practical Methords, Richard M. Martin, Cambridge University Press, 2004
3 Molecular Electronic-Structure Theory, T. Helgaker, P. JorgensenJ. Olsen, John Wiley & Sons. LTD, 2000
4 Atomic and Electronic Structure os Solids, E. Kaxiras, Cambridge University Press, 2003
5 Nano and Molecular Electronics Handbook, Sergey E. Lyshevski, CRC Press, 2007
6 Chemical Dynamics in Condensed Phases: Relaxation, Transfer, and Reactions in Condensed Molecular Systems, A. Nitzan, Oxford University Press, 2006
7 Charge Migration in DNA: Perspective from Physics, Chemistry and Biology, Springer, 2007
8 Charge Transfer in DNA: From Mechanism to Application, H.-A. Wagenknecht, Wiley-VCH, 2004
9 Transport in Nanostructure, D. K. Ferry, S. M. GoodnielCambridge University Press(世图影印),1998
10 Quantum Transport: Atom to Transistor, S. Datta, Cambridge University Press(世图影印),2006

C. Topics on Statistical Physics

1 A modern Approach to Critical Phenomena, I. Herbut, Cambridge University Press, 2007
2 Statistical Mechanics: From First Principles to Macroscopic Phenomena, Cambridge University Press, 2007
3 Topics in Statistical Mechanics, Brian Cowan, 复旦大学出版社,2006
4 Lectures on Statistical Physics and Protein Folding, 复旦大学出版社,2006

D. General Topics

1 Numerical Simulation in Molecular Dynamics: Numerics, Algorithms, Parallelization and Applications, Michael Griebel, Stephan Knapek, Gerhard Zumbusch, Springer, 2007
2 并行计算导论,张林波,迟学斌,莫则尧,李若,清华大学出版社,2006
3 数值并行算法与软件,李晓梅,吴建平,科学出版社,2007
4 数值分析与算法,徐士良,机械工业出版社,2007
5 发生函数论,Herbert S. Wilf著,王天明译,清华大学出版社,2003

E Other Topics

1 Writing for Science, R. Goldbort, Yale University Press, 2006
2 博尔赫斯诗选,河北教育出版社,2003
3 机遇与混沌,上海世纪出版集团,2005
4 天地有大美,上海世纪出版集团,2005
5 复杂性:一种哲学概观,上海世纪出版集团,2005
6 语言与因特网,上海世纪出版集团,2006
7 现代物理学前沿选讲,黄祖洽,科学出版社,2007
8 戴望舒经典,南海出版公司,2007

后面的几个部分先挖个坑放这吧

PageRank,马尔科夫链及个人推荐

Sunday, December 9th, 2007

Google之所以能如此高效搜索主要是基于其创始人Larry PageSergey BrinStanford读研究生期间提出的PageRank算法。PageRank完全由WWW的超链接结构所决定,它大约没隔一个月重新计算一次,而与任何网页的实际内容或搜索请求无关。当用户发出搜索请求时,Google找出符合请求的网页,并把他们按PageRank值的大小依次列出。从这个意义上讲,这正是Google公司值得尊敬的地方,做过数值计算的人都知道这么大的矩阵运算实在是非常困难。但是这也是其欺骗了用户的地方,在Google的工具条上有一个查看PageRank值的地方,这个值并不是现在的Rank值。

我们在网络上闲逛的时候,每次都从当前网页随机选择一个超链接进入下一个网页,可以想象这个网页最终将中止于一个没有网页链接出口的网页,或者进入一个由相互链接组成的死循环。这种随机游走在数学上称为马尔科夫链(Markov Chain)或马尔科夫过程(Markov Process)。当这样的随机浏览过程无限进行下去时,某个网页被访问的概率就是它的PageRank值。概率越大,PageRank值就越大。

对于Google公司而言,可以设某个根网页开始,沿一系列超级链接到达的所有网页组成了一个集合,而且这个集合不断的变大。这个集合构成一个矩阵,解这个矩阵特征值就得到了每个网页的PageRank值。比如Sina网的PageRank值是7,俺们学院的PR值是2,本博的PR值为1,本博母校PR值为6等。到目前为止,这个集合已经超过60亿了。这么庞大的计算量对任何人来讲都实在是很夸张。

然而,对于经常使用Google的人来讲,可以发现今年Google搜索的准确度明显不如04年了。我们要找到自己所需要的信息越来越难了,比如刚才我搜索本博的名字得到424项搜索结果,到底那些项是我自己呢?好在跟我同名的人不是很多,搜索我一个朋友恰恰同学得到的信息条数是152000条,很明显要找到我那个朋友的信息还是有点难的。经常光顾本博的Princess Lin同学,在Google上能搜到126000条,要在网上找到她绝对叫大海捞针,我要找到她本来直接到她办公室就好了,当然前提是我知道她的办公室在哪儿。所以我们可以得到这样的结论,信息过载等于没有信息。

要解决这个问题怎么办呢?目前Web 2.0技术似乎为解决这个问题打开了一扇门。但是个性怎么体现呢?比如在化妆品网站上面,网站通常根据销量大小和其他的商业目的给出推荐产品。但是通常每个人的喜好都不一样,怎样调和大众口味和个人喜好,这也是一个需要解决的问题。所以当我们从解决好这个问题之后,给出合适的推荐算法,这绝对具有重要的商业前景。在这方面恰恰同学已经灌了篇水了(Phys.Rev.E, 76, 046115(2007)).

ps. Google的另一个创始人也结婚了,新娘很漂亮!

贴素描美女一张。
sumiao1.jpg