关于作者

用户名:常耀忠
笔名:常耀忠
地区:

日历  

快速登录

+ 用户名:
+ 密 码:

我的博采 我的论坛 我的RSS

在线留言


留言后如果没有显示请刷新页面

访问统计:605



Powered by BlogDriver 2.1

学者

 

文章

关于google

      Google 的使命就是要为您提供网上最好的查询服务,促进全球信息的交流。Google 开发出了世界上最大的搜索引擎,提供了最便捷的网上信息查询方法。通过对 30 多亿网页进行整理,Google 可为世界各地的用户提供适需的搜索结果,而且搜索时间通常不到半秒。现在,Google 每天需要提供 2 亿次查询服务。

      两位斯坦福大学的博士生 Larry Page 和 Sergey Brin 在 1998 年创立了 Google。这家私人控股公司在 1999 年 6 月宣布,它已经集到了 2,500 万美元的资金。公司的投资夥伴包括 Kleiner Perkins Caufield & Byers 和 Sequoia Capital。Google 通过自己的公共站点 www.google.com 提供服务。公司还为信息内容供应商提供联合品牌的网络搜索解决方案。

关于 Google 的技术

      Google 富于创新的搜索技术和典雅的用户界面设计使 Google 从当今的第一代搜索引擎中脱颖而出。Google 并非只使用关键词或代理搜索技术,它将自身建立在高级的 PageRank(tm)(网页级别)技术基础之上。这项正在申请专利的技术可确保始终将最重要的搜索结果首先呈现给用户。

      网页级别可对网页的重要性进行客观的分析。用于计算网页级别的公式包含 5 亿个变量和 20 多亿个项。网页级别利用巨大的网络链接结构对网页进行组织整理。实质上,当从网页 A 链接到网页 B 时,Google 就认为“网页 A 投了网页 B 一票”。Google 还对投票的网页进行分析。

      Google 复杂的自动搜索方法可以避免任何人为感情因素。与其它搜索引擎不同,Google 的结构设计即确保了它绝对诚实公正,任何人都无法用钱换取较高的排名。作为您的忠实助手,Google 可以诚实、客观并且方便地帮您在网上找到有价值的资料。

Google 的释义

      Google 是由英文单词“googol”变化而来。“googol”是美国数学家 Edward Kasner 的侄子 Milton Sirotta 创造的一个词,表示 1 后边带有 100 个零的数字。Google 使用这个词代表公司想征服网上无穷无尽资料的雄心。

Google 管理团队

Eric E. Schmidt 博士,董事长兼首席执行官

      Eric Schmidt 博士Eric E. Schmidt 博士在担任 Google 董事长五个月之后,于 2001 年 8 月被任命为首席执行官。Schmidt 同时也是 Novell 的董事长,负责所有重要决策,他也是公司技术开发和管理的中心人物。

       Schmidt 是 1997 年从 Sun Microsystems, Inc. 加入 Novell 的,当时他是该公司的首席技术官和行政主管。Schmidt 在 Sun 工作了 14 年,担任过多项高层职务,他对发展网络以促进网上商业、政府、教育、科学及文化的贡献,广受国际肯定。他还在开发和推广 Java (Sun 的独立于平台的编程语言)的过程中发挥了不可或缺的作用。

在加入 Sun 之前,Schmidt 是 Xerox Palo 研究中心 (PARC) 计算机科学实验室的研究员。他还在贝尔实验室和 Zilog 工作过。

Schmidt 拥有加州伯克利大学的计算机博士学位和电气工程硕士学位,以及普林斯顿大学的电气工程学士学位。

Larry Page,创始人之一,主管产品的总裁

larry pageLarry Page 是密西根安娜堡大学的荣誉毕业生,拥有理工科学士学位。他还因其出色的领导才能获得过多项荣誉,以奖励他对工学院的贡献。他曾担任密西根大学 Eta Kappa Nu 荣誉学会的会长。目前他暂时从斯坦福大学计算机研究所博士班休学,其指导教授是 Terry Winograd 博士。Google 就是由 Page 在斯坦福大学发起的研究项目转变而来的。

他的工作经验包括在华盛顿的 Advanced Management Systems 公司及伊利诺斯州的 CogniTek 公司从事软件开发工作。受到他担任计算机系教授的父亲启蒙,Page 早在 1979 年就开始使用计算机了。他于 1998 年和 Sergey Brin 共同创办了 Google 公司。

Sergey Brin,创始人之一,主管技术的总裁

sergey brinSergey Brin 出生于莫斯科,是马里兰大学校本部的荣誉毕业生,拥有数学专业和计算机专业的理学士学位。已取得斯坦福大学计算机专业硕士学位,目前暂时从博士班休学。30 岁的 Sergey 是美国国家科学基金会的奖学金得主。他在斯坦福遇到了 Larry Page 并参与了后来成为 Google 的研究项目。他们于 1998 年共同创立了 Google。

Brin 的研究兴趣包括搜索引擎、从无序资源中提取信息,以及大型文字数据和科学资料的数据挖掘,等等。他在著名的学术期刊里发表了很多文献,其中包括 Extracting Patterns and Relations from the World Wide WebDynamic Data Mining: A New Architecture for Data with High Dimensionality(与 Larry Page 合著)、Scalable Techniques for Mining Casual StructuresDynamic Itemset Counting and Implication Rules for Market Basket DataBeyond Market Baskets: Generalizing Association Rules to Correlations

      各类国内和国际性学术、商业和科技论坛经常邀请 Brin 担任主讲人,其中包括 Academy of American Achievement、European Technology Forum、Technology, Entertainment and Design 以及“硅谷 2001”等。当他远离公司总裁的繁务时,他又是一个吊环和潜水爱好者,或者带着一群 Google 人在停车场上大打滑轮曲棍球。

Omid Kordestani,主管业务发展和销售的副总裁

omid kordestaniOmid Kordestani 拥有多年在高科技企业工作的经验,其中包括在互联网先驱 Netscape Communications 公司担任重要职位。作为 Netscape 公司的业务发展和销售副总裁,Kordestani 在 18 个月内使 Netscape 网站的收入从每年 8800 万美元上升到超过 2 亿美元。

Kordestani 作为 OEM 销售主管在 Netscape 公司工作了四年,他负责与大客户建立合作关系,这些客户包括 Citibank、AOL、Amazon、Intuit、Travelocity、Intel、@Home、eBay 和 Excite。在加入 Netscape 之前,Kordestani 曾经在 3DO Company、Go Corporation 以及 Hewlett-Packard 负责市场营销、产品管理和业务发展等方面的工作。

Kordestani 拥有斯坦福大学的 MBA 学位以及圣荷西州立大学的电气工程学士学位。

Wayne Rosing,主管工程的副总裁

      wayne rosingWayne Rosing 在硅谷的一些著名公司里拥有超过 30 年的工程和研究经验。加入 Google 之前,他是 Caere Corporation 的首席技术官兼工程副总裁。Rosing 负责管理 Caere 的光学字符识别 (OCR) 生产线的所有工程项目,并曾大力推动收购 Omniform 应用程序,后来该程序成为 Caere 的主要产品之一。

     在加入 Caere 之前,Rosing 曾担任 Sun Microsystems 全资子公司 FirstPerson, Inc. 的总裁。在 FirstPerson 工作期间,Rosing 领导开发了 Java 的基础技术。在此之前,他建立了 Sun Microsystems 实验室,在他的领导下,实验室发展到超过 100 名研究人员的规模。Rosing 在他职业生涯的早期曾担任过 Apple 计算机公司 LISA 和 Apple II 的工程主管,还在 Digital Equipment and Data General 公司担任过管理职务。

    出于对大自然的浓厚兴趣,他自己设计并制作了遥控天文望远镜,并潜入南太平洋深海拍摄海底生物。

Cindy McCaffrey,主管企业传播的副总裁

cindy mccaffreyCindy McCaffrey 在公关、集资、市场传播、员工和客户交流,以及报告和编辑等方面拥有 20 多年的经验。加入 Google 以前,McCaffrey 在数家硅谷最知名的公司负责企业的公关活动,这些公司包括 Apple Computer、E*TRADE、The 3DO Company 和 SmartForce (前身为 CBT Systems)。

McCaffrey 拥有内布拉斯加大学的新闻学学位,并曾在南密苏里州立大学攻读美国文学硕士学位。她曾在多家报社担任记者及编辑,其中包括 The Omaha World-HeraldSpringfield (Mo.) Leader & PressKansas City Business JournalThe Contra Costa Times,此外还包括一些高科技刊物,如 Macintosh Today。她还能够背诵 Strunk 和 White 的 The Elements of Style 全文。

Joan Braddi,主管搜索服务的副总裁

joan braddiJoan Braddi 在高科技产品的企业和个人用户市场上拥有十多年的市场营销经验。加入 Google 之前,她在 Netscape 的网站 Netcenter 担任业务发展和广告销售部门的主管。通过与 eBay、Network Solutions 和其它主要的广告赞助商发展良好的合作关系,她在 12 个月内使公司的广告收入从每季度 200 万美元上升到 1200 万美元。她同时还负责 Netcenter 电子商务的拓展。作为 Netscape 的资深 OEM 销售经理,她与 Hewlett Packard、Oracle、Computer Associates、SGI 和 Informix 等公司建立了合作夥伴关系。

      加入 Netscape 之前,Braddi 曾在 Silicon Graphics 公司服务器分部负责新兴市场、应用及 OEM 市场等工作。她毕业于圣荷西州立大学,拥有企业管理学位。Braddi 相信她能很快用Google找到一小时的休闲时间。

Tim Armstrong,主管广告销售的副总裁

tim armstrongTim Armstrong 离开 Snowball.com 后加入了 Google。作为 Snowball.com 负责销售和战略合作夥伴关系的副总裁,他管理着上百人的团队,在短短 16 个月内就使公司的收入水平达到了上市公司的要求。此外,Armstrong 还负责公司的战略合作夥伴关系,这包括由 New Line Cinema 投资的项目以及与 NFL 建立的独家合作夥伴关系。

       在加入 Snowball.com 之前,Armstrong 担任过 IDG 的首份互联网杂志 I-Way 的全国销售经理,并且还在 Starwave 和 Disney 的 ABC/ESPN 互联网风险投资公司担任过营销总监一职。

Armstrong 毕业于康涅狄格大学,主修经济学和社会学。Armstrong 热衷于马拉松长跑,是个精力旺盛、充满活力的人。

Urs Hölzle,Google 特别研究员

urs holzle      Urs Hölzle 在加入 Google 前是加州大学圣塔芭芭拉分校的计算机副教授。1988 年,他在苏黎世的 ETH 获得计算机科学硕士学位,同年得到 Fulbright 奖学金。他于 1994 年取得斯坦福大学的博士学位,专攻编程语言和有效实现。

       Hölzle 是动态编译(也称为“及时编译”)的开拓者之一,他发明的基础技术至今仍被大多数 Java 编译器采用。在加入 Google 前,Hölzle 还是 Animorphic Systems 公司的创始人之一,该公司开发了 Smalltalk 和 Java 编译器。Sun Microsystems 1997 年收购 Animorphic Systems 之后,Hölzle 协助开发了 Javasoft 高性能的 Hotspot Java 编译器。

      1996 年,美国国家科学基金会为 Hölzle 颁发了终生成就奖,以表彰他在面向对象语言编译器方面所作出的贡献。Hölzle 还是 DARPA 美国国家编译基础设施项目的主要参与者。他是多个程序语言编译委员会的成员,发表了大量的学术论文并拥有多项美国专利。

       Hölzle 在担任了公司首位工程副总裁之后被任命为 Google 特别研究员。他的职责是领导公司运营资源的开发,他以爱穿红袜子并且养了一只可以在公司自由闲逛的巨犬 Yoshka(Google 第一狗)而远近闻名。

Craig Silverstein,技术总监

                                       craig silversteinCraig Silverstein 目前暂时从斯坦福大学休学,他攻读的是计算机博士学位,研究领域为信息检索及数据挖掘。当 Google 还是斯坦福的一个研究项目时,Silverstein 就在其中发挥了他在压缩算法上的专长。他在学术研究上的其它成就还包括超高效基础数据结构(如散列表),以及使用 Scatter/Gather 的大型数据群集,和与群集相关的潜伏语义索引,这些都是他在 Xerox PARC 的研究成果。

       Silverstein 毕业于哈佛大学,获计算机科学学士学位,曾荣获 Phi Beta Kappa 的杰出贡献奖和 Microsoft 科技奖学金,并两次获得 Derek Bok 教育优秀奖。他是 Google 的第一位雇员。

       Silverstein 除了为公司提供技术指导外,还为 Google 人提供新鲜面包。他的三台烤箱采用 Linux 操作系统以并行运转模式烤制面包。


- 作者: 常耀忠 2004年09月13日, 星期一 21:14  回复(1) |  引用(0) 加入博采

数据恢复培训

November 09, 2003

网络搜索引擎与智能代理技术

摘 要: 分析搜索引擎与智能代理技术的原理,探讨二者对现在及未 来网络信息检索的重要意义。 〔关键词〕 智能代理 搜索引擎 智能信息检索


 互联网在全球范围内的迅速发展与成熟,促使社会各领域信息飞速膨胀,为人们查找、获取有用信息提供了丰富的信息源,但也给信息的准确定位提出了挑战。提供网上资源的检索是网络信息服务的重要内容之一,加之现代人也对信息把握的正确性和全面性提出了越来越高的要求,因此,当务之急是开发性能优越的网络信息检索工具。
1993年,第一批搜索引擎诞生后,发展至今已经逐渐走向成熟,伴随着计算机智能化研究的不断发展,具有适应性和学习性特征的智能代理技术也正从试验阶段过渡到实际应用。目前,搜索引擎(search engine)与智能代理(intelligent agent)已经成为网络信息搜索的关键技术与核心思想。


1 搜索引擎技术的发展现状


1.1 搜索引擎技术


目前,网络信息检索技术最主要的是搜索引擎技术,搜索引擎实际上是一个专用的WWW服务器,也可以说是因特网上的一类网站,这类网站与一般的网站不同,其主要工作是收集网络上成千上万的网站和网页信息,组成庞大的索引数据库。使用优秀的搜索引擎可以达到事半功倍的效果。目前网络上大约有3000多种搜索引擎,我们较为熟悉的提供中文搜索引擎的站点有sinasohuyahoonetease和中文Excite等。


一般来说,搜索引擎主要采取两种方式实现对网络信息资源的检索,一是采用分类主题目录形式,将网站进行树状的分类,所链接的网站必须至少归属于其中一个类别,形成类似图书馆目录一样的分类主题目录,用户通过逐级浏览这些目录来找寻自己需要的内容,采用这种检索方式的搜索引擎有yahoo、sohu等,由于使用了专家进行归纳和分类,为信息导航带来了极大的方便,但这种方式在分类和目录整理中需要大量的人力;二是使用关键词匹配方式,其处理对象主要是文本,它能够对大量文档建立由字(词)到文档的索引库,在此基础上,用户使用关键词对网页进行搜索时,系统将会显示含有该检索用词的所有网站、网页和新闻等匹配信息。关键词检索能解决对网页细节的检索问题,只要用户输入关键词,系统通过蜘蛛机器人自动在选定的范围内进行检索,并将所检索到的信息自动标引导入索引数据库中,匹配所检范围中的网页,就能得到检索结果。


1.2 搜索引擎使用的信息检索技术及其不足


目前搜索引擎使用的信息检索技术主要有:Robot技术、索引技术、翻译技术、转换技术、过滤技术、数据库技术、结果处理技术等。搜索引擎的最大优点是:信息的覆盖面较大,信息新颖,而且对搜索结果的相关性排列上,搜索引擎将其认为相关性高的检索结果排列在前。但由于搜索引擎使用的信息检索技术智能水平的限制,以及对自然语言理解的制约,对网络信息的检索存在许多不足之处。主要有如下几方面。


(1)现在的搜索引擎主要通过Robot将网页的全部或部分内容下载到自建索引库中,由于下载的页面许多是无用或暂时信息,既影响检索速度,也增加了用户检索负担。


(2)由于搜索引擎一般都采用关键词检索方式,但许多情况下,用户很难简单地用关键词或关键词之间的组配来准确地表达真正需要的信息内容,表达困难导致检索困难。


(3)每个引擎的覆盖面都相当有限。经考察研究发现,没有一个搜索引擎的索引量超过整个网页的1/6。


(4)搜索的结果不精确。搜索结果的精确性是由查询词与网页的相关性来确定的,常常输入一个单一的查询词能返回数万篇结果,或者零篇结果。


2 智能代理技术
2.1 智能代理
智能代理又称智能体,是人工智能研究的新成果,它是在用户没有明确具体要求的情况下,根据用户需要,代替用户进行各种复杂的工作,如信息查询、筛选及管理,并能推测用户的意图,自主制定、调整和执行工作计划。具有智能性,是可进行高级、复杂的自动处理的代理软件。智能代理可应用于广泛的领域,是人工智能领域近年来研究的一个热点,应用于信息检索领域之后,成为开发智能化、个性化信息检索的重要技术之一。


2.2 智能代理的特点


①智能性。具有丰富的知识和一定的推理能力,能揣测用户的意图,并能处理复杂的难度高的任务,对用户的需求能分析地接收,自动拒绝一些不合理或可能给用户带来危害的要求,而且具有从经验中不断学习的能力,适当地进行自我调节,提高处理问题能力。


②代理性。在功能上是用户的某种代理,它可以代替用户完成一些任务,并将结果主动反馈给用户。


③移动性。可以在网络上漫游到任何目标主机,并在目标主机上进行信息处理操作,最后将结果集中返回到起点,而且能随计算机用户的移动而移动。


④主动性。能根据用户的需求和环境的变化,主动向用户报告并提供服务。


⑤协作性。能通过各种通信协议和其他智能体进行信息交流,并可以相互协调共同完成复杂的任务。


3 搜索引擎技术与智能代理技术的结合


搜索引擎与智能代理技术有着各自的优势与不足,把这两种技术结合起来,将为开发新一代功能更强大的网上信息搜索系统提供广阔的天地。智能代理主要集成客户端特殊的环境,配合用户兴趣完成搜索。它对用户信息需求、偏好进行甄别、归纳、总结,分析用户的兴趣爱好,并借助学习好的规则,自动、独立地代理用户查找其感兴趣的信息。将搜索引擎与智能代理技术结合起来是建立新的检索模式的必然趋势。


3.1 服务器端的个性化服务的引入


在服务器端吸收智能代理技术的思想,引入个性化和人性化服务的思想。引入用户反馈机制来完善检索机制、提高检索命中率,同时也可以提供面向个人的特殊检索服务。这种方式可以通过帐号制形式来实现,即为每一位用户提供一个帐号(类似于个人邮箱),以记录该用户查询踪迹,从而在用户再次登录时结合以往的用户检索记录来配合提供相关的检索服务。这种模式体现了个性化服务的特色,对于用户一贯查询的信息就可以直接从用户的信息库中提取,避免了重复查询。另外,通过对用户的反馈意见进行跟踪,获取用户对结果的评价,据此提高检索质量。检索入口的自然语言化发展将有助于优化检索界面,提高界面的人性化。


3.2 客户端智能代理技术的拓展


以智能搜索代理技术为主,结合搜索引擎“面向主题”的检索模式,在密切关注个体需求、提高信息与用户需求相关系统,彼此间可以通过统一的传输协议进行沟通,交换信息,从而使更多的信息得以挖掘,以弥补智能代理信息搜索范围有限的缺陷。这种模式充分利用了智能搜索代理的流动性、交互性、智能性特点,同时又吸取了搜索引擎的主题相关的思想,为高质量的信息个性化检索服务提供了新的模式。


搜索引擎技术与智能代理技术在网络信息检索上的结合发展潜力是巨大的,要真正实现两者结合的各项优势,还有待在机器学习、相关度分析等方面进行逐渐的研究和改进。在知识经济时代,人们越来越需要个性化信息的提供,作为网络信息检索的前沿技术,智能代理技术将受广大用户的青睐,相信它的发展前景是非常广阔的。




- 作者: 常耀忠 2004年09月13日, 星期一 21:07  回复(1) |  引用(0) 加入博采

互联网发展史

  互联网的开发及发展史

  1961年:美国麻省理工学院的伦纳德·克兰罗克(Leonard Kleinrock)博士发表了分组交换技术的论文,该技术后来成了互联网的标准通信方式;

  1969年:美国国防部开始起动具有抗核打击性的计算机网络开发计划“ARPANET”;

  1971年:位于美国剑桥的BBN科技公司的工程师雷·汤姆林森(Ray Tomlinson)开发出了电子邮件。此后ARPANET的技术开始向大学等研究机构普及;

  1983年:ARPANET宣布将把过去的通信协议“NCP(网络控制协议)”向新协议“TCP/IP(传输控制协议/互联网协议)”过渡;

  1988年:美国伊利诺斯大学的学生(当时)史蒂夫·多那(Steve Dorner)开始开发电子邮件软件“Eudora”;

  1991年:CERN(欧洲粒子物理研究所)的科学家提姆·伯纳斯李(Tim Berners-Lee)开发出了万维网(World Wide Web)。他还开发出了极其简单的浏览器(浏览软件)。此后互联网开始向社会大众普及;

  1993年:伊利诺斯大学美国国家超级计算机应用中心(National Centre for Supercomputing Applications)的学生(当时)马克·安德里森(Mark Andreesen)等人开发出了真正的浏览器“Mosaic”。该软件后来被作为Netscape Navigator推向市场。此后互联网开始得以爆炸性普及。

  一般情况下,普遍认为于1969年开始的ARPANET为当今“互联网的雏形”。也有人认为“互联网诞生”于1983年开始采用TCP/IP协议之时。这是因为通过采用具有扩展性的通信协议TCP/IP,才能够将不同网络相互连接。因此,开发TCP/IP协议的UCLA(加州大学洛杉矶分校)的学生(当时)文顿·瑟夫(Vinton G. Cerf)等如今甚至被誉为“互联网之父”。

- 作者: 常耀忠 2004年09月9日, 星期四 19:01  回复(0) |  引用(0) 加入博采

欢迎加入博客公社
博客中国与您共创美好生活,现在就开始您精彩的博客之旅吧。

- 作者: 常耀忠 2004年09月9日, 星期四 18:55  回复(0) |  引用(0) 加入博采