《搜:通向世界的巨型引擎》TXT全集
搜:通向世界的巨型引擎
书籍作者:[美]约翰·巴特利
书籍类别:激励管理
书籍格式:TXT
授权方式:免费下载
书籍大小:解压后(3.84 MB)
书籍字数:112154 字
更新时间:2017-01-16 11:22:10
上传用户:寿幻梅
书籍来源:未知
已被围观:551
快捷下载:不看简介直接下载

内容简介

    搜:通向世界的巨型引擎txt下载 为什么要写搜索?
    几乎每一个对我很重要的人都问过我同一个问题:为什么你要写一部关于搜索的书呢?要是写一本关于作为商业企业的Google的书还是很容易理解的(千万别问我有多少人觉得我应该在Google公开发售股票的时候写这本书)。但是一本关于……搜索的书?还不如写关于电子邮件或是浏览器的书呢!它们也一样无人不晓,同样乏味。如果你想写出一本让读者感觉身临其境的书,你应该写写你在《连线》或者《产业标准》的经历,或者是让拉里·佩奇还有谢尔盖·布林和你坐到一起来写一本独家授权的商业传记。但是我想像不到更糟糕的题材了。关于我以前呆过的那两家公司的书已经有人写过了。事实上,这两本书我都读过了,它们使我处在一个很尴尬的位置。一直以来,都很难从拉里和谢尔盖口中挖到消息。他们相信他们的公司的发展还在呈上升趋势,而且这样的评价是恰当的。所以,对于一本号称包罗万象的关于这家公司的书,他们是持谨慎怀疑态度的。
    那么为什么要写搜索呢?环绕在Google周围的特别的文化光环说明搜索的四周弥漫着一股神秘而又神圣的气息。然而,更特别的是,因为透过搜索,我们可以了解现代因特网时代文化和商业方面的每一个细节--从它在20世纪90年代初的起步直到它潜力无穷的未来。
    通过Achie,Gopher和其他一些应用程序,搜索成为因特网最早提供的有用处的服务之一。话说回来,要是什么都找不到,要网络干什么?后来,搜索又发展成最早采取商业运营模式的网络应用手段,也就是网幅广告的形式。随着网景公司1995首次公开募股(IPO),搜索同它的伙伴浏览器一起鸣响了因特网泡沫时代起跑的发令枪。
    搜索,更恰当的说法是,网络跟踪,也就是搜索的近亲,推动了20世纪90年代末人们对所有与因特网有关的东西的狂热。尽管这泡沫破灭了,作为一种网络工具和商业模式的搜索继续蓬勃发展。许多投资者也许受到重创,但是因特网用户却从未停止过搜索。像Overture和Google这样的公司就在.com经济几乎全军覆没的最黑暗的时候挖到了第一桶金。
    搜索兴起于网络带来第二波冲击的时候。Google,易趣,亚马逊,雅虎,和微软这些公司成为网络科技公司二度崛起的中坚力量。这些公司为了争夺将来的市场展开全面激烈的斗争,因为这个市场潜藏着数千亿美元的价值。仅这一条就足以解释我们为什么需要了解搜索。这些都是很容易给出的答案。搜索曾经推动了网络的发展,而且现在还在继续发挥作用。是搜索造就了Google这个无疑是因特网时代最具魅力、最成功的企业之一的公司。然而,现在就写一本只是以Google为主角的书,还是为时过早,因为这个故事仅仅有了缘起和发展,却还远未结束。
    所以,虽然这本书以Google的故事为核心,但是我相信搜索的概念比任何一家公司都重要,而且搜索对文化的影响也惊人深远。比如说,除了推动了因特网的商业化这个显而易见的作用,搜索最终可以加速盛传一时的电视同个人电脑的合并。话说回来,有线电视节目指南不就是一个应该免费提供的二流的搜索应用程序吗?
    搜索同用户界面
    人工智能是目前人类面临的最棘手的难题之一。搜索是有希望解决这个难题的许多尝试的催化剂。实质上,搜索是整个计算机科学领域最具挑战性、最有趣的问题。许多专家宣称更进一步地探索搜索的奥秘,我们就能发现一条万灵咒语,解决目前人工智能研究在商务和学术领域里遇到的各种难题,从而使我们可以创造出无论以任何标准衡量,其行为模式都与人类别无二致的计算机。
    简而言之,搜索的发展很可能会引发超级电脑哈尔(Hal)的出现。哈尔是斯坦利·库布里克(StanleyKubrick)的电影《2001:太空漫游》中那个高智能但是行动迟缓的电脑幽灵。或者,如果这个可能性不能使你夜不能寐的话,就把搜索想像成《终结者》系列电影,或者假想一下反乌托邦的《黑客帝国》三部曲中管理世界的人工智能体系的基础。我们被人类同机器对话这个创意深深吸引;而它则主导了我们的文化景观。要把上述这些可能性中的任何一个变成现实,搜索是最有前途的途径。你大可以把我叫成妄想狂(至少有许多人和我想的一样),但是,仅凭这一点,搜索就值得我们去了解。
    搜索还会改变我们同政府之间的关系。这确实是个引人侧目的说法,但是在这个说法背后有足够的证据支持。在我还没有把话题扯得太远之前,我需要先声明,尽管我已经这样描绘了人类意图数据库,它其实并不存在于现实世界。尽管约翰·波因德克斯特(JohnPoindexter)曾试图构建这样一个数据库4,但天空中并没有一个巨大数据库来追踪我们在网络上所有的行动。我们的点击流,也就是我们全部的线上生活,分散在一片由形形色色的互联网网站和个人电脑构成的广袤的领域内。其中的绝大多数都没有被收集和整理,一直保持沉默。
    第5节:为什么要写搜索?2
    但是,这个局面正在迅速改变。就在十年之前,带宽还是稀缺资源,信息存储的成本非常高。因特网的使用还远未普及,文件还很小,大部分网络公司也不会保存他们的工作记录文档,因为保存数据太贵了。在过去几年间,我们的大部分以数字为媒体的行为都转移到了网络上,不管是电子邮件,搜索,还是我们与他人的关系。
    为什么会这样呢?储存每兆比特的成本已经迅速大幅下降,而且会继续降到几乎不需要什么成本的地步。与此同时,带宽也大大加宽,人们的因特网使用率也大幅增加。现在,因特网已经成为大多数美国家庭和各种工作场所必备的设施。本质上,我们已经把过去生活中暂时的、日常的部分都变成了永恒的行为,比如,平时我们习惯同谁谈话,我们寻找什么,购买什么这些行为。这就好像我们每天都在描摹一张像乔伊斯小说那样复杂的图,记录下我们世俗而又特别的人生轨迹。而绘图的行为是在我们与因特网的互动过程中完成的,不管我们使用个人电脑,电话还是音乐播放器。这种互动还包括我们同商业机构进行的在线或店堂内交易。(毕竟,杂货店的会员卡信息一定得存储在什么地方,不是吗?)
    让我们回头看看前网络时代,也就是1985~1995年的个人电脑时代。在那个计算机革命的时期,对于通过计算机键盘进行的交流和发现的行为,我们形成了一些习惯性的假设。我们(也许正确,也许错误地)以为,我们在计算机上的行为是不会被长期记录的。我们认为我们在硬盘,或者后来的局域网和广域网上仔细搜查的时候我们留下的数字足迹,也就是我们的点击流,就像电话谈话一样转瞬即逝。不然又能怎么样呢?除了通过它们而实现的行为之外,点击流毫无价值,不过是为了实现找到某个文档或者传递某个信息这些目的而采取的手段罢了。
    对于电子邮件,我们也抱有同样的想法。确实,我们知道邮件会短暂停留于服务器上。但是,多年以来,我们始终相信它们都是我们的电邮,无论是网络服务提供商还是我们赖以传递它们的网络都无权检查和利用它们,更不用说拥有它们了。(事实上,1986年通过的电子通信隐私法案也已经把这种观点纳入法律保护,至少对私人电子邮件来说是这样的)。目前,我们当中一些更世故的电子邮件用户渐渐认识到,在一个公司国家的环境下,这样的臆测是多么的愚昧。然而,电子邮件是瞬时性的媒介这个想法仍然受到普遍认可。弗兰克·夸特罗内(FrankQuattrone)是技术领域最有影响的银行家之一,肯定不能说是个计算机盲。可是,2003年,他却被这种自以为是地想法害了--在一场受到广泛关注的官司里,暗示他有罪的电子邮件被当做对他不利的证据使用。
    然而,对我们大多数人来讲,出现这样的负面后果的几率微乎其微;我们仍然相信电子邮件是一种极端隐私和暂时性的通讯方式。即使当这些电邮储存在雅虎,hotmail或者Gmail网站的服务器上时,情况也是如此。
    最后,在个人电脑时代,我们自以为是地认为,毫无疑问,我们同他人的关系(我们的社会关系网)或者我们同商品和服务之间的关系(我们的商业活动网)都是短时性的。没有因特网的存在,又怎么会有别的可能性呢?的确,长期来讲,偶然有人可能会得到你的电话卡,你的备忘录,或是你的信用卡交易凭条。只有在这些时候,你的隐私和安全才会受到威胁。但是如果使用电子邮件,出现类似情况的机会就少到完全可以忽略不计。在像LinkedIn或者Frindster这类基于因特网的人际关系服务兴起之前,人际关系网仅仅是你的个人联系数据库中的记录。5
    简而言之,在网络出现之前,我们以数字为媒介的行为,比如查找硬盘,查收电子邮件,或者检查合同,都是短时性的,仅为我们自己所知的。(而且,很快就被忘记)。
    但是如今,我们生活的许多细节都被记录和保留在各种东西中,它们中大部分都是商业性的。产生这种转变的原因很简单:充满创意的公司通过解释点击流的样式,找到了提供基于网络的优质服务的方法(碰巧,这些服务都很赚钱)。像大多数物质文明产物一样,点击流正在成为一种资产。对个人而言是这样,对网络行业来说就更是如此了。
    有些公司,通过计算点击流的样式来开发这项资产,比如Google的页面序列等级(PageRank)算法6;另外一些公司采取的是更直接的方式,比如支持亚马逊公司推荐体制的算法体系。最显而易见的一点,就是所有的搜索引擎都试图通过显示与你表达出来的意图相匹配的广告而利用点击流赚钱。
    从一个消费者的角度来看,这样的转化也有很简单却令人信服的理由--搜索,推荐系统,还有电子邮件都使我们的生活变得更加简单,快捷和方便。至少到目前为止,我们还很愿意用我们的隐私来交换便利,服务和力量。
    亚马逊A9搜索引擎的首席执行官尤迪·曼比(UdiManber)指出:"作为一项课题,目前只有百分之五的搜索问题得到了解决。"只有区区百分之五,但是搜索业务已经发展成为价值数十亿美元的产业。搜索引发点击流;而点击流推动利润的产生。这是点击流被永久保留的最重要的原因。
    当我们发掘全球化信息空间的时候,搜索就成为我们手中的铁锹,成为我们探寻和发现的利器。空白的搜索框和闪烁的光标预设了你的搜索产生的数字产品。你的鼠标在众多新蓝色的链接上游移不定,而这些链接都在等待你的点击将它转化成这个时代的永恒索引中的一笔。
    第6节:搜索所牵涉的社会问题
    搜索所牵涉的社会问题
    什么被日本十几岁的青少年认为是这一周最酷的事情?哪位流行巨星的专辑卖得最好?谁的排名又正在排行榜上处于下滑状态?那位政治人物在衣阿华,新罕布什尔州,或是加利福尼亚州最受欢迎?为什么受欢迎?谁访问了同恐怖分子有联系的网站?谁又访问了色情站点?访问者是怎么找到它们的?拉丁裔美籍男子都买哪些种类的保险?为什么买?中国的大学生是如何获取新闻的?……几乎一个人能够想到的任何问题都可以以这样或那样的方式得到解答,而答案就在因特网上一秒接一秒累积起来的不变的人类意图数据库里。
    那么,这样一种人工品的出现又预示了什么呢?它会对蕴藏数十亿美元商机的营销和传媒产业产生什么影响呢?为什么中国、德国和法国的政府威胁要关停雅虎和Google这些搜索引擎?为什么我们的国家安全取决于对这些公司数据库的深入研究?最后,关于我们自己和大家共同在网络上创造出的全球化的文化,搜索到底可以告诉我们些什么?
    这些问题的答案并不容易给出,但是我希望至少我可以在后文中,讲述搜索故事的时候尝试解答它们。搜索所牵涉的领域越来越错综复杂,其中包括市场营销、传媒、技术、流行文化,甚至国际法和公民权力。搜索技术不仅要解决数量惊人的技术难题(想一想每周数十亿词查询请求产生的数据量),而且还会遇到几乎使它寸步难行的社会责任问题。Google及其同类公司掌握了这个世界的需求,所以有权威的部门会对他们产生浓厚的兴趣,而没有自保能力的个人则把他们视为威胁。刻进Google15万台服务器芯片中的很可能是下面这些东西--罹患爱滋病的同性恋男子痛苦的宣泄;试图制造炸弹的恐怖分子的无声的阴谋;也可能是连环杀手遗漏于数字空间的蛛丝马迹。Google这样的公司和他们提供的服务使个人的数字身份永不磨灭,并且,在有请求出现时还可以调用它们。目前,Google的创办人之一谢尔盖·布林向我保证,从未有人提出这样的请求,更没有这样的请求被满足过。但是搜索的威力如此巨大,这种情况还能坚持多久呢?
    即使现在还没有出现这样的事,总有一天,这样的请求会浮出水面。搜索工具拥有令人难以置信的强大力量,用它来达到不正当目的的危险是实实在在的。9·11事件之后,布什政府很快就启动了一个立法程序,重新定义国家对公民的监视权。在当时情况下,国会很快被说服,不经辩论就通过了美国爱国法案7。根据这部法案,美国政府可以迫使Google这样的公司根据政府机构的要求为他们提供信息,而且是秘密的。
    斯图尔特·贝克尔是原美国国土安全局(NSA)顾问,他指出搜索牵连的社会问题是非常广泛的。他告诉纽约时报的记者,根据爱国法案,政府可以要求如下信息:"你所发送的每封电子邮件的收件人是谁?你是在何时发送的?谁回复了你的邮件?邮件篇幅多长?是否添加了附件?还有,你是在哪里上网发送的邮件?"联邦调查局(FBI),国土安全局以及国防部(DepartmentofDefense),所有的部门都决心加强对因特网的监控,决不会放过像美国在线,Google,或者雅虎这些网站所拥有的内容丰富的数据库。这些公司在法律上应负有的保密责任,它们却有可能应政府要求而交出本应保密的那些信息。因此,他们的数百万用户的利益同政府的利益存在着不可调和的矛盾。当我谈到这个话题的时候,Google的一名管理人员告诉我:只要一个不体面的故事,我们就会被看作专制国家的爪牙。
    这样的事实在隐私、安全以及我们同政府和公司的关系这些方面提出许多有趣的问题。当我们的数据储存在我们的台式机里的时候,我们确信它们是属于我们自己的。这是Entourage邮件工具管理着的我的地址簿,这是我的电子邮件附件,这是我的苹果PowerBook笔记本电脑硬盘。当我在自己的本地目录里查找文档或是某一条电邮信息的时候(也就是我在本地磁盘中搜索的时候),我认为,无论他是出于善意或者恶意,第三方决不会以任何理由监控和分析我搜索、查找和使用数据时移动和点击鼠标的行为。(在很多工作的场合,情况已经不再是这样了,不过我们现在先把这个问题放在一边)
    当计算机产业的中心转移到网络上之后,因为它显然具备了诸如社会关系网络、搜索和电子商务之类的第二代功能,法律变得更加模棱两可。比如,在使用这些功能时,互动过程中会发生数据产出和存储行为。那么,谁拥有这些数据的所有权呢?我们用户对这些数据有什么样的权力?事实上,目前我们还无法回答这些问题。
    当我们把我们的数据放到亚马逊,Hotmail,雅虎和Gmail的服务器上的时候,我们都同服务商做了一个没有明确说出来的协定。大部分的民众要么满足于这个协定,要么根本就没怎么注意到这一点,而且,后者可能性更大8。
    这个协定是:我们相信你们不会用这些信息来做坏事。我们相信你们能够保证这些信息的安全,使它们免受来自政府和个人的非法搜查和攫取并且保证它们随时处于我们的完全控制之下。我们可以理解你们需要集合我们的数据以便能够为我们提供更优质更有用的服务,但是我们相信你们不会通过我们的数据来确认我们的个人身份和相关信息,相信你们不会利用我们的私人数据来做出使我们感觉自己的隐私和自由受到侵犯的举动。
    各个公司应我们的要求把这些条款纳入公司运作的准则,会有助于建立彼此之间的互相信任。无论是对他们还是我们,在面临这样一个转变可能带来的一系列后果时,都无法保证自己完全确定该怎么办。只是想一下搜索可能导致的后果,就会使一个理智的人觉得很伤脑筋。
    不过,要是你感觉到搜索拥有了自我意识,并且可以在你同它互动的时候监视你的时候,迷惘的感觉会更加强烈吧?
    第7节:搜索成为人工智能?
    搜索成为人工智能?

40
0
+++本文作者[美]约翰·巴特利的其它电子书下载+++

下载地址


扫描二维码下载本书

用户评论

自古评论出人才,欢迎您发表您的精彩评论!
《搜:通向世界的巨型引擎》最新评论