作者:潘希 来源:科学时报 发布时间:2010-11-25
“我和微软合作已经有好几年时间,和中科院动物所的合作也已经两年了。而且,与微软的合作我们取得了重要的成果,这种跨学科的合作让双方都找到更新、更有意思的研究课题,当然是一种数学交叉科学的成功。”在中国科学院院士马志明的办公室里,有很多进进出出的研究生,其中一些人同时还在企业进行实习,并且在交叉领域已经有很出色的研究工作。
正是基于此,在中国科学院数学与系统科学研究院筹建国家数学与交叉科学中心的规划中,马志明的角色尤为重要——在六个交叉研究部中的生物医学研究部和经济金融研究部,他都担任着研究骨干的重任。
“我认为作数学交叉科学研究最重要的,是数学家一定不要坐在办公室里闭门造车,而是要真正和在应用领域的人进行交流合作,这是我一贯的观点,而且现在我也是这么做的。”马志明在接受《科学时报》专访时表示。
“数学很好用”
“我们与微软的合作,主要是将数学应用在互联网信息检索的领域,特别是应用于搜索引擎设计中的网页重要性排序研究。”
时隔几年,马志明还能回忆起合作之初的情景。
2003年,马志明开始对随机复杂网络产生浓厚的兴趣。
此后一年多的时间中,他和兴趣相投的几位同事巩馥洲、闫桂英等一起办起了讨论班。“当时我们好几个同事在一起商量,认为随机复杂网络是很新的一个领域,是引起物理学家、经济学家、数学家都关注的新内容。”
那时,参加这个讨论班的人相当多,但令马志明没想到的是,这也成了他和微软开始合作的起点。
“事情是这样的,微软的一个实习生听说我在做随机复杂网络后,主动给我发来电子邮件,说对这个讨论班很感兴趣,想来向我请教几个问题。”马志明回忆说,这个实习生说他想与我讨论他们遇到的一些问题,我很爽快地答应了,并要求他能来给我们讲一讲。
几天后,那名微软的实习生果然如约到来,并把Google搜索引擎的由来和发展生动地讲给了马志明和他的同事。合作也就从这里开始了。
2008年7月,在新加坡召开的第31届国际信息检索大会上,一位年轻人报告了她的论文——《浏览排序:让因特网用户为页面重要性投票》,论文获得了会议设立的唯一最佳学生论文奖。
这位年轻人就是马志明的博士生刘玉婷,那时的她和几位同学在马志明开始与微软合作之后,正在微软亚洲研究院做实习生。
新加坡会议后,“浏览排序”成了业内热门话题,在互联网搜索工业界引起广泛关注和讨论。当然,要为浏览排序设计一套可行的算法,并非易事。微软亚洲研究院也做了大规模模拟实验。
“在这个方向还有许多课题需要进一步研究。但从中不难看出,在其他领域,数学也非常好用。”马志明说,在与微软的合作研究中,他们提炼出一种新的数学框架,叫做“网页马氏骨架过程”。网页马氏骨架过程可以很好地描述用户上网行为,不仅有很好的应用前景,而且从理论上丰富了随机过程的内容,具有数学研究的价值。目前马志明和他的同事们正在从理论和应用两个方面进一步开展这个新的研究课题。谈到这一新的研究方向,马志明高兴地对记者说:“数学与应用领域的交叉,不仅是应用领域的需求,而且反过来也促进了数学自身的发展。”
生物领域大有可为
在马志明的办公桌上,堆放着大量厚厚的书籍,而其中有一本非常特别。
“现在我手里的这本书《DNA序列发展的概率模型》,作者是Rick Dnrrett,他是一位很有名的概率学家,也是美国科学院院士。可以说,他是一名纯粹的数学家和概率学家,而他现在在数学与生物的交叉领域做得很有成效。”说起与生物学的交叉研究,马志明显得很兴奋。
其实,马志明很早就开始注意到数学在生物学领域的巨大作用。
马志明说,在生物领域需要用数学来解决的问题有很多。比如,在DNA序列的研究中就涉及到许多数学问题,包括概率、统计、运筹、图论等等,还涉及到大量的计算问题。不仅要用到已有的高深的数学工具,比如统计推断、扩散过程、分枝过程等,而且还正在呼唤新的数学工具。例如,如何处理生物领域里的海量复杂数据,就是对数学工作者的一个挑战。
“我们和中科院动物所一起开讨论班大概有两年的时间了。只要是双方的导师都在,我们两边的学生就会在每周一的晚上,一起讨论共同关心的问题。现在,我们每周讨论的就是《DNA序列发展的概率模型》这本书。”马志明说。
最初提出在讨论班上研究这本书的,是马志明的合作方中科院动物所副所长张德兴。
“提议说讨论这本书的时候,我非常赞成,因为这是一本数学家写的书。”在马志明看来,一本数学家写的书却让生物学家如此感兴趣,说明数学与生物交叉科学研究需求量之大,同时说明这本书也得到了交叉领域的认可。
讨论班上场面都非常活跃,数学家在跟生物学家学生物,而生物学家也跟数学家学数学。
如果单说DNA序列,只是A,C,G和T这4个字母的排列。但是,如果从生物的起源来看,DNA序列经过漫长时间过程的遗传和变异,现在看到的排列方式和古时候是不一样的。
“生物学家和数学家用分枝过程、马氏链、扩散过程等多种数学模型来刻画DNA序列的变异过程。”马志明解释说,目前看到的生物DNA序列,可以看做是某个随机过程的样本。我们观测到DNA序列在不同位点的变化,通过建立恰当的数学模型,就可以推断它们的祖先是什么样子,以及种群的演变、种群的大小和分布等。
目前,有很多生物学家正在致力于这个方向的研究。并且已经出现一些软件可以计算,但其准确性和效果还值得进一步探讨。
“现在用这些软件做出的结果是对还是不对,仍没有很好的方法去验证。我想这是一个数学家大有用武之地的研究方向,做出好的研究成果能推动科学的发展,我正在鼓励我的几个学生从事这方面的研究。”马志明认为,在这个研究方向一旦有突破,对生物学领域和数学领域都会有重要意义。
难得的“冰山一角”
作了如此多的数学交叉科学研究,马志明却将数学的应用比喻为“冰山一角”。
“应用要做好,纯数学必须要有非常深厚的功底。我经常讲,应用数学只是‘冰山一角’,是整个体系中露在水面上很少的一部分,实际上,水下面是雄厚的数学基础。”马志明的比喻很形象。
因此,不论是在企业做实习生,还是在交叉领域作研究,马志明对自己的研究生都有十分明确的要求——一定要让他们继续学习基础数学。因为,纯数学研究的深入才是在数学交叉领域的最大优势。
马志明常常说的一句话是,做数学要“顶天立地”。
在他的话里,“顶天”意味着纯数学研究要走在国际前沿,而“立地”则表示应用数学在交叉领域真正与应用领域相结合,得到应用领域的承认。
“作数学交叉科学研究的人,首先就要具备数学家的素质。有人说,应用数学对数学家的要求比做纯数学要高。”马志明认为,数学功底好交叉领域才能做得好,为此,他举了这样一个例子。
陈锡康是中科院数学院研究员,也是一位知名的运筹学家。我国有13亿人口,粮食安全关系到国计民生。从上世纪70年代末,国家就希望做好粮食产量预报工作,以便党和政府及早采取相应措施,调剂丰歉。陈锡康领导的研究小组对此作出了重要贡献。
“他们的预报成果不仅十分接近于全国每年的粮食实际产量,误差很小,而且在每年的四五月间就能作出全年的预报,提前约有半年的时间。他们之所以能这样快而准确地作出预报,关键就在于使用了数学与运筹学的方法来处理预报中诸多关系问题。”马志明介绍说。
马志明的观点也很明确,要做应用,数学家就一定不能“纸上谈兵”,要与交叉领域的专家多交流、多探讨,让数学应用真正对交叉领域有贡献。
此外,国际上对数学内部的交叉也越来越关注。
“以往的菲尔茨奖很少奖励给概率统计方面的研究,但在2006年,就有两位菲尔茨奖获奖者的成果用到概率统计,2010年的4位获奖者,其中有3位做的研究工作涉及遍历测度,因而与概率论有关。”马志明分析说,现在越来越多的数学分支用到概率的方法,这说明数学内部不同分支的交叉和融合已经是当今数学发展的重要趋势。
在谈到未来时,马志明说:“在数学交叉科学研究上,我提倡合作。比如,我和我的学生不可能像生物学家那样对生物学有那么透彻的理解,反之亦然。因此,要更鼓励合作,这样双方就有知识的互补。在国家数学与交叉科学研究中心建立起来后,这个过程就可以从研究生阶段开始了。”
马志明信心十足,他预期会在数学交叉科学研究中心建立后,取得很好的研究成果。“有了数学交叉科学研究中心这个科研平台,我们就可以把合作方的研究人员邀请作为我们的学术委员,很多工作可以一起开展,双方更能融合在一起了。”
附件下载: