May 20, 2004

Google的幽默漏洞!现在还能使!

刚收到的mail
全文如下:
>Subject: FW: 转发: Google的幽默漏洞!现在还能使!
>
>it is very funny!
>
>第一步the first step: open
>http://www.google.com/intl/en/
>
>第二步 the second step: search “weapons of mass destruction”,but don't press 'enter' 但是不要按enter键!
>
>第三步 the third step:click 点击“I’m Feeling Lucky”键
>  
>仔细看看出错信息是什么!我看google里面有些人还是很幽默的。 Then, have a look, haha......:)
>  
>快看!在google修改之前。

出错显示的文件如下:





Cannot find Weapons of Mass Destruction


These Weapons of Mass Destruction cannot be displayed

The weapons you are looking for are currently unavailable. The country might be experiencing technical difficulties, or you may need to adjust your weapons inspectors mandate.

Please try the following:

  • Click the refresh.gif (82 bytes) Regime change button, or try again later.
  • If you are George Bush and typed the country's name in the address bar, make sure that it is spelled correctly. (IRAQ).
  • To check your weapons inspector settings, click the UN menu, and then click Weapons Inspector Options. On the Security Council tab, click Consensus. The settings should match those provided by your government or NATO.
  • If the Security Council has enabled it, The United States of America can examine your country and automatically discover Weapons of Mass Destruction.
    If you would like to use the CIA to try and discover them,
    click Detect Settings Detect weapons
  • Some countries require 128 thousand troops to liberate them. Click the Panic menu and then click About US foreign policy to determine what regime they will install.
  • If you are an Old European Country trying to protect your interests, make sure your options are left wide open as long as possible. Click the Tools menu, and then click on League of Nations. On the Advanced tab, scroll to the Head in the Sand section and check settings for your exports to Iraq.
  • Click the Bomb button if you are Donald Rumsfeld.


Cannot find weapons or CIA Error
Iraqi Explorer

Bush went to Iraq to look for Weapons of Mass Destruction and all he found was this lousy T-shirt.

Posted by liyi at 5:22 PM | TrackBack

辞职报告交了

刚刚通过邮件发出,如释重负。

Posted by liyi at 1:05 AM | TrackBack

May 15, 2004

相信数学,还是相信计算机?

这是在“博客中国”上的文章的原题。我觉得这个问题的解决应该是不难的:首先我们数学上证明计算机所做的一切都是合乎逻辑的(这些证明我想应该都只用到整数计算,所以应该不会有误差),然后计算机证明的题目当然是可以接受的。

最早提出“开普勒猜想”的罗利爵士


假如在你面前放着一堆桔子,怎么摆放才能最节约空间?


别以为这只是困扰水果店老板的日常烦恼之一。虽然任何人都可以凭着经验或直觉断定,把上一层桔子交错着放到下一层桔子彼此相邻的凹处,显然要比直接一个叠一个的摆放更合理,也更节约空间。但是,谁能从数学上证明,的确不存在比这更合理的方法呢?


事实上,在400多年的时间里,由罗利爵士(Sir Walter Raleigh)最早提出的这个问题——“开普勒猜想”(Kepler’s Conjecture)——难倒了众多数学家。虽然最新一期的《数学年刊》(Annals of Mathematics)上刊登了匹兹堡大学数学教授托马斯·海尔斯(Thomas C Hales)1998年完成的证明论文,但此种权威数学界承认某一难题有了最终解答的通常形式,这一次似乎却引起了更大的争论。争论的中心便是,你信得过一台计算机的计算结果吗?


说起开普勒猜想的历史,要回到1590年的某一天。在为自己的船队出海远征前准备物资时,沃尔特·罗利爵士突然想到:能不能根据一堆摆放整齐的炮弹的高度,推算出这些炮弹的准确数目呢?他的助手、数学家托马斯·哈里耳特(Thomas Harriot)几乎毫不费力的就给出了答案。然而,当更深入地思考这个问题时,哈里耳特却发现,其中的奥秘并不那么简单。水手们惯常使用的摆放方式是否是最节约空间的方式?怎样摆放球体,才能使它们占用最少的地方?哈里耳特设想出了多种堆放模型,并在此基础上发展出了自己的原子理论。


几年后,在写给著名天文学家开普勒(Johannes Kepler)的信中,哈里耳特提到了这个问题。在经过一系列的试验之后,开普勒在1611年出版的小册子《新年礼物——论六出的雪花》中提出了自己对于问题正确解答的猜想:当大小相当的球体按照“面心晶体”——球心位于正方体各面的中心上——的形式,并且将第一层摆放成六角形时,它们占用的空间最小,对空间的利用率可以超过74%。虽然开普勒没有为自己的猜想给出证明,但他的影响力却使该问题自此被命名为“开普勒猜想”。


开普勒猜想被提出之后,许多数学家都试图为其给出证明。但直到200多年后,另一位伟大的数学家高斯(Carl Friedrich Gauss)才在1831年部分证明了开普勒猜想,即对于规则形状,开普勒猜想是正确的。但在此之后,开普勒猜想的证明工作再度停滞。在1900年的国际数学家大会上,数学家大卫·希尔伯特因此将其列入了著名的“二十三个未解数学难题”之一。


1953年,匈牙利数学家拉兹洛·费耶·托斯(Laszlo Fejes Toth)指出,无论对于规则和不规则形状,开普勒猜想的证明都可以减少到有限次数——但数目极为庞大——的计算。这就意味着,从理论上讲,一种穷尽所有可能的证明方式是可行的。而一台速度足够快的计算机就可以将这种设想变为现实。


从1992年开始,遵循着托斯的思路,当时在密歇根大学的海尔斯开始与自己的学生合作,使用计算机辅助证明开普勒猜想。在经过了6年的运算后,1998年8月,海尔斯宣布证明完成。他的全部证明包括250页笔记,3GB的计算机程序、数据和运算结果。


虽然海尔斯的证明是如此的有异于常态,但《数学年刊》还是同意发表这篇论文。为此,《数学年刊》还特意聘请了匈牙利科学院的加伯·费耶·托斯(Gabor Fejes Toth)——拉兹洛·费耶·托斯的儿子——担任评审委员会的负责人。


开普勒猜想并不是第一个依赖计算机获得证明的著名数学难题。1976年,伊利诺伊大学的两位数学家就使用计算机证明了著名的四色定理,即任何一幅地图,只需要使用四种颜色,就能确保相邻的两个地区颜色不会相同。这个证明发表后,数学家们不断地从中发现若干错误。虽然每一次有错误被发现时,研究人员都能迅速地改正这些错误,但这却给许多数学家留下了非常糟糕的印象。


为了避免重蹈四色定理证明的覆辙,《数学年刊》的工作人员决定对开普勒猜想的证明进行彻底而谨慎的检验。但是,在花了近6年的时间验证了海量的数据后,去年,评审委员会却无奈地宣布放弃全面验证开普勒猜想证明结果的计划。他们验证到的所有部分都丝毫无误,但要把全部数据都一一核查清楚,却是一件几乎不可能完成的使命。


《数学年刊》无奈之下,想出了一种变通的解决办法。他们打算在发表的论文之前加上一条免责条款:本证明大部分,但非全部,被验证过。但是,这个主意却遭到了许多数学家的批评。最后,在征求了另一位数学家的意见后,《数学年刊》做了一个所罗门王式的决定。把论文一切两半,刊登已经使用传统方式验证过的证明,舍去计算机运算的数据。


其实,围绕开普勒猜想证明的一系列争论,很大程度上是“数学课是否应该允许学生使用计算器”的高端版本,只不过争论的双方变成了专业的数学家,而价值判断的取舍也更为困难。问题的焦点在于,如果接受了海尔斯的证明,也就意味着,假定计算机在执行计算时完全无误,不会存在任何微小的程序错误。而是否真的是这样,人类很难凭借自己的能力做出判断。就像普林斯顿数学教授约翰·康威(John Conway)在接受《纽约时报》采访时说的:“我不喜欢它们(计算机证明),因为你感觉不知道究竟发生了什么。”


对于一向追求凭逻辑和运算即可判定真伪,并以明确简洁的证明为“好的数学”的原则的数学界而言,这无疑是让人非常难以接受的结果。更何况,计算机的运算也并非无可挑剔。英特尔公司就一直在使用校验工具软件检查其计算机芯片的运算法则,希望避免1994年奔腾芯片曾经出现过的数据运算错误再度发生。


不过,也有乐观的数学家指出,既然现在最好的计算机可以在比赛中打败世界象棋冠军,那么,未来的计算机也应该能够解出难倒了最伟大的数学家的数学难题。但问题的关键似乎不在于此。开普勒说过,数学是惟一好的形而上学。用计算机如此形而下的方式解答他留下来的猜想,多少总有些讽刺的味道罢。

Posted by liyi at 11:18 AM | TrackBack

May 14, 2004

新记录,哈哈

190845
record040514.jpg

Posted by liyi at 10:50 PM | TrackBack

终于出现黑珍珠了:D

pearl.jpg截图

Posted by liyi at 10:38 PM | TrackBack

May 12, 2004

总算安装好了Movable Type

汉化花了不少时间,movable type的用户手册好像有误。而且最后有些图片还是用的繁体中文版的:)

Posted by liyi at 9:58 PM | TrackBack

May 10, 2004

宝石拼图最新成绩66000!

hoho

Posted by liyi at 8:36 PM | TrackBack

May 9, 2004

发现antsight.com一个小漏洞

显然Land没有注意:D,还是跟我联系吧,呵呵。
这两天研究MovableType还是有心得的。俺本机的MovableType已经跑起来了。顺便说一下,那天所谓Apache的配置文件没有作用,其实是因为俺不停的反复重起Mysql。呵呵。糗大了。

Posted by liyi at 1:31 AM | TrackBack

May 6, 2004

网页作了小小更动

根据Movable Type新生手册对本站进行了简单的更动。原文是繁体中文,看得累死!:(

Posted by liyi at 11:12 PM | TrackBack

May 3, 2004

神奇的贝叶斯定理

看了下面的文章,你会感觉为什么说数学是科学之王! 实际上这东东在设计异常入侵检测系统也有用到,目前基于异常的入侵检测系统除了我们常见的基于统计异常的入侵检测外,基于贝叶斯推理异常检测、 基于贝叶斯网络异常检测和基于贝叶斯聚类异常检测应该都是根源于这个神奇的定理。

本文来自博客中国

18世纪的理论成为计算的新力量 作者:Michael Kanellos(CNET News.com) Thomas Bayes,一位伟大的数学大师,他的理论照亮了今天的计算领域,和他的同事们不同:他认为上帝的存在可以通过方程式证明,他最重要的作品被别人发行,而他已经去世241年了。

18世纪牧师们关于概率的理论成为应用发展的数学基础的一部分。

搜索巨人Google和Autonomy,一家出售信息恢复工具的公司,都使用了贝叶斯定理(Bayesian principles)为数据搜索提供近似的(但是技术上不确切)结果。研究人员还使用贝叶斯模型来判断症状和疾病之间的相互关系,创建个人机器人,开发能够根据数据和经验来决定行动的人工智能设备。

虽然听起来很深奥,而这个原理的意思--大致说起来--却很简单:某件事情发生的概率大致可以由它过去发生的频率近似地估计出来。研究人员把这个原理应用在每件事上,从基因研究到过滤电子邮件。

在明尼苏达州大学的网站上能够找到一份详细的数学概要。而在Gametheory.net上的一个Bayes Rule Applet程序让你能够回答诸如“如果你测试某种疾病,有多大风险”之类的问题。

贝叶斯理论的一个出名的倡导者就是微软。该公司把概率用于它的Notification Platform。该技术将会被内置到微软未来的软件中,而且让计算机和蜂窝电话能够自动地过滤信息,不需要用户帮助,自动计划会议并且和其他人联系。

如果成功的话,该技术将会导致“context server”--一种电子管家的出现,它能够解释人的日常生活习惯并在不断变换的环境中组织他们的生活。

“Bayes的研究被用于决定我应该怎样最好地分配计算和带宽,” Eric Horvitz表示,他是微软研究部门Adaptive Systems & Interaction Group的高级研究员和分组管理者。“我个人相信在这个不确定的世界里,你不能够知道每件事,而概率论是任何智能的基础。”

到今年年底,Intel也将发布它自己的基于贝叶斯理论的工具包。一个关于照相机的实验警告医生说病人可能很快遭受痛苦。在本周晚些时候在该公司的Developer Forum(开发者论坛)上将讨论这种发展。

虽然它在今天很流行,Bayes的理论并不是一直被广泛接受的:就在10年前,Bayes研究人员还在他们的专业上踌躇不前。但是其后,改进的数学模型,更快的计算机和实验的有效结果增加了这种学派新的可信程度。

“问题之一是它被过度宣传了,” Intel微处理器实验室的应用软件和技术管理经理Omid Moghadam表示。“事实上,能够处理任何事情的能力并不存在。真正的执行在过去的10年里就发生了。”

Bayes哑元
Bayes的理论可以粗略地被简述成一条原则:为了预见未来,必须要看看过去。Bayes的理论表示未来某件事情发生的概率可以通过计算它过去发生的频率来估计。一个弹起的硬币正面朝上的概率是多少?实验数据表明这个值是50%。

“Bayes表示从本质上说,每件事都有不确定性,你有不同的概率类型,”斯坦佛的管理科学和工程系(Department of Management Science and Engineering at Stanford)的教授Ron Howard表示。

例如,假设不是硬币,一名研究人员把塑料图钉往上抛,想要看看它钉头朝上落地的概率有多大,或者有多少可能性是侧面着地,而钉子是指向什么方向的。形状,成型过程中的误差,重量分布和其他的因素都会影响该结果。

Bayes技术的吸引力在于它的简单性。预测完全取决于收集到的数据--获得的数据越多,结果就越好。另一个优点在于Bayes模型能够自我纠正,也就是说数据变化了,结果也就跟着变化。

概率论的思想改变了人们和计算机互动的方式。“这种想法是计算机能够更象一个帮助者而不仅仅是一个终端设备,” Peter Norvig表示。他是Google的安全质量总监。他说“你在寻找的是一些指导,而不是一个标准答案。”

从这种转变中,研究获益非浅。几年前,所谓的Boolean搜索引擎的一般使用需要把搜索按照“if, and, or but”的语法进行提交,然后去寻找匹配的词。现在的搜索引擎采用了复杂的运算法则来搜索数据库,并找出可能的匹配。

如同图钉的那个例子显示的那样,复杂性和对于更多数据的需要可能很快增长。由于功能强大的计算机的出现,对于把好的猜测转变成近似的输出所必须的结果进行控制成为可能。

更重要的是,UCLA的Judea Pearl这样的研究人员研究出如何让Bayes模型能够更好地追踪不同的现象之间条件关系的方法,这样能够极大地减少计算量。

例如,对于人口进行大规模的关于肺癌成因的调查可能会发现它是一种不太广泛的疾病,但是如果局限在吸烟者范围内进行调查就可能会发现一些关联性。对于肺癌患者进行检查能够帮助调查清楚习惯和这种疾病之间的关系。

“每一个单独的属性或者征兆都可能取决于很多不同的事情,但是直接决定它的却是为数不多的事情,”斯坦佛计算机科学系(computer science department at Stanford)的助理教授Daphne Koller表示。“在过去的15年左右的时间里,人们在工具方面进行了改革,这让你能够描绘出大量人群的情况。”

和其他一些项目一样,Koller是使用概率论技术来更好地把病症和疾病联系起来,并把遗传基因和特定的细胞现象联系起来。

记录演讲
一项相关的技术,名为Hidden Markov模型,让概率能够预测次序。例如,一个演讲识别应用知道经常在“q”之后的字母是“u”。除了这些,该软件还能够计算“Qagga”(一种灭绝了的斑马的名称)一词出现的概率。

概率技术已经内置在微软的产品中了。Outlook Mobile Manage是一个能够决定什么时候往移动设备上发出一封内勤的电子邮的软件。它是从Priorities发展而来的,Priorities是微软在1998年公布的一个实验系统。Windows XP的故障检修引擎也依赖于概率计算。

随着该公司的Notification Platform开始内置在产品中,在未来的一年中会有更多的应用软件发布,微软的Horvitz这样表示。

Notification Platform的一个重要组成部分名为Coordinate,它从个人日历,键盘,传感器照相机以及其他来源收集数据,来了解某个人生活和习惯。收集的数据可能包括到达的时间,工作时间和午餐的时间长度,哪种类型的电话或电子邮件被保存,而哪些信息被删除,在某天的特定时间里键盘被使用的频率,等等。

这些数据可以被用来管理信息流和使用者收到的其他信息。例如,如果一位经理在下午2:40发送了一封电子邮件给一名员工,Coordinate可以检查该员工的日历程序,然后发现他在下午2:00有一个会议。该程序还可以扫描关于该员工习惯的数据,然后发现该员工通常会在有会议之后大约一个小时才重新使用键盘。该程序可能还能够发现该名员工通常会在5分钟之内回复该经理的电子邮件。根据上面这些数据,该软件能够估计出该员工可能至少在20分钟之内不可能回复该电子邮件,该软件可能会把这条信息发送到该员工的手提电话上。同时,该软件可能会决定不把别人的电子邮件也转发出去。

“我们正在平衡以打搅你为代价所获得信息的价值,” Horvitz表示。使用这个软件,他坚持道,“能够让更多的人跟上事情的发展,而不被大量的信息所淹没。”

Horvitz补充道,隐私和对于这些功能的用户控制是确定的。呼叫者并不知道为什么一条信息可能会被优先或推迟处理。

微软还把Bayes模型使用在其他的一些产品上,包括DeepListener 以及Quartet (语音激活),SmartOOF 以及TimeWave (联系控制)。消费者多媒体软件也获益非浅,Horvitz表示。

Bayes技术不仅仅被应用在PC领域。在University of Rochester,研究人员发现一个人的步伐可以在一步前发生改变。虽然这种改变对于人类来说太过于细微,一台和电脑连接在一起的照相机可以捕捉并跟踪这种动作。如果行走异常出现,计算机就能够发出警报。

一个实验用的安全照相机采用了同样的原理:大部分到达机场的人都会在停车以后直接走向目的地,所以如果有人停了车,然后走向另一辆车就不太正常,因此就可能引发警报。今年秋天一个创建Bayes模型和技术信息的基本引擎将会公布在Intel的开发者网站上。

理论冲突
虽然该技术听起来简单易懂,关于它的计算可能却比较慢。Horvitz回忆说他是斯坦佛20世纪80年代仅有的两个概率和人工智能的毕业生之一。其他所有的人学习的是逻辑系统,采用的是“if and then”的模式和世界互动。

“概率论那时候不流行,” Horvitz表示。但是当逻辑系统不能够预测所有的意外情况时,潮流发生了转变。

很多研究人员开始承认人类的决策过程比原来想象的要神秘的多。“在人工智能领域存在着文化偏见,” Koller表示。“人们现在承认他们并不知道他们的脑子是如何工作的。”

即便在他的时代,Bayes发现他自己置身于主流之外。他于1702年出生于伦敦,后来他成为了一名Presbyterian minister。虽然他看到了自己的两篇论文被发表了,他的理论很有效,但是《Essay Toward Solving a Problem in the Doctrine of Chances》却一直到他死后的第三年,也就是1764年才被发表。

他的王室成员身份一直是个谜,直到最近几年,新发现的一些信件表明他私下和英格兰其他一些思想家看法一致。

“就我所知,他从来没有写下贝叶斯定理,” Howard表示。

神学家Richard Price和法国的数学家Pierre Simon LaPlace成为了早期的支持者。该理论和后来George Boole,布尔数学之父,的理论背道而驰。George Boole的理论是基于代数逻辑的,并最终导致了二进制系统的诞生。也是皇室成员之一的Boole死于1864年。

虽然概率的重要性不容置疑,可是关于它的应用的争论却没有停止过。批评者周期性地声称Bayes模型依赖于主观的数据,而让人类去判断答案是否正确。而概率论模型没有完全解决在人类思维过程中存在的细微差别的问题。

“儿童如何学习现在还不是很清楚,”IBM研究部门的科学和软件副总裁 Alfred Spector这样表示。他计划把统计学方法和逻辑系统在他的Combination Hypothesis之中结合起来。“我最初相信是统计学的范畴,但是从某方面说,你将会发现不仅仅是统计学的问题。”

但是,很有可能概率论是基础。

“这是个基础,” Horvitz表示。“它被忽略了一段时间,但是它是推理的基础。”



开发者们使用古老的Bayes理论在信息时代大显身手

他们正在设计程序来自动地管理每天通过电子邮件,手提电话,即时信息和以其他方式涌向用户的大量信息。

这样的一个软件可能随着时间不断地收集数据,并为一个人过去的行为创建一个模型,以此来决定如何能够最好地处理新到达的信息。

一个简化的例子:

1)电子邮件到达
From: The boss
Subject: Read me
Sent: Thu 3:10 PM

程序访问日历软件
"Thursday, 2 PM: Meeting"

程序考虑习惯和目前状态

  • 如果用户在电脑前,通常会在1到5分钟内回应来自“The boss”的电子邮件。
  • 如果在星期四下午安排有会议,用户通常会在会议开始后一个半小时左右才会重新使用键盘。(因此,星期四的会议通常为时一个半小时。)

    程序做出结论

  • 会议下午两点钟开始。
  • 电子邮件于3:10分到达。
  • 收信人可能在3:30前不会回来。

  • 通常在1到5分钟内回应来自“The boss”的邮件。

    程序的动作
    把电子邮件转发到收件人的手提电话上,以便他尽快收到。


    2)电子邮件到达
    From: "The middle manager"
    Subject: Idea
    Sent: Thu 3:10 PM

    程序访问日历软件
    "Thursday, 2 PM: Meeting"

    程序考虑习惯和目前状态
    如果用户在电脑前,通常会在25分钟到1个小时左右回应来自“The middle manager”的电子邮件。

    程序做出结论
    会议下午两点钟开始。
    电子邮件于3:00到达。
    收信人可能在3:30前不会回来。
    通常在25分钟到1个小时左右回应来自“The middle manager”的邮件。

    程序的动作
    决定不转发该电子邮件,而根据返回的时间再做决定。



  • 【声明】博客中国刊载此文不代表同意其说法或描述,仅为提供更多信息,也不构成任何投资建议。转载请注明出处。
    Posted by liyi at 1:54 AM