诸城信息港城市论坛

 找回密码
 注册

查看: 1633|回复: 0

揭密维基百科幕后:数百款自主程序进行维护

[复制链接]
     

1279

主题

5115

帖子

4万

积分

贵宾

与人为善

Rank: 4

积分
44857

注册纪念日论坛贡献奖新年送“福”调侃乱语2011苹安果马年大吉勋章年味勋章喜气羊羊

发表于 2012-7-28 15:53:07 | 显示全部楼层 |阅读模式 IP:山东潍坊
  腾讯科技讯(观海)北京时间7月28日消息,据国外媒体报道,维基百科由全球数万名志愿者编写和维护,反过来,这些志愿者则由数百个自主计算机程序来协助,以保证百科全书的运作。

  维基百科的一个页面显示:“阴茎是男性的性器官。”

  这一陈述是无可争辩的事实,因此可能值得列入维基百科之中,但它并不属于网站有关美国最高法院及其法律职责的条目范围。

  当南卡罗莱纳州一名匿名维基百科读者上周提供这一条目时,该条目仅用了几秒钟就被发现并被删除。这种恶意破坏的行为不是被读者发现,而是被一款被称为bot(robot的缩写)的简单人工智能程序所发现。

  ClueBot NG程序存在于电脑之中,对百科全书的大量内容进行检查,在破坏发生时,及时对破坏进行清理。维基百科随时都会有数百款程序对内容进行检查,而ClueBot NG只是其中的一款。ClueBot NG对于有关美国最高法院文章的修复,展示了bot已经成为维基百科项目中不可缺少的组成部分。

  维基百科网站上一位被称为赫思福德(Hersfold)管理者在电子邮件中表示:“如果没有了bot,维基百科将会是一团糟。”

  仅英语版维基百科的条目在本月就已经超过了400万条,这包括了约25亿个单词,相当于数百万的页面,比《大英百科全书》(Encyclopaedia Britannica)大50倍。维基百科通过数万名编辑,对所有语言内容进行维护,其中约7.7万名编辑每月编辑的次数超过5次。

  但该项目过于庞大,其维护属于劳动密集型工作,因此不可能依靠管理员和编辑的力量,来保证项目运作的井井有条。这就需要bot的帮助。

  澳大利亚佩思市一名19岁的学生克里斯·格兰特(Chris Grant)表示:“我们这里有个笑话说,有一天,所有的bot都罢工了,只是为了让我们知道,它们做了多少的工作。”克里斯在维基百科委员会,负责对bot进行管理。

  格兰特指出:“网站将要求我们所有人做更多的工作,编辑的疲倦率将会更离。”

  bot执行了大量的编辑和管理工作,这些工作繁琐、重复和费时,但却又非常重要。它们删除恶意破坏性的条目和粗言秽语、组织和目录条目,处理大量的幕后工作,保证百科全书平稳、有效的运转,保持网站的外观整洁和风格统一。

  与实体图书馆比较,bot类似于学生,将图书放在书架上、把图书从一个系列转向另一个系列、为书籍添加条形码,以及执行其他简单任务,这允许训练有素的管理员,专注于政策和收购。

  北卡罗莱纳州计算机程序员布莱德·乔什(Brad Jorsch)表示:“维基百科已经壮大到如此的规模,我不知道如果所有的bot都走光了,人们将会如何进行应对。”布莱德负责运行一款bot,以对标签进行追踪,提醒编辑为条目添加引文。
Bot几乎与维基百科存在的时间一样长。

  维基百科成立于2001年,第二年,一款rambot针对美国一个城镇创建了3万个条目(以每天数千条的速度)。bot直接从美国统计数据中导出数据,条目读起来好像是由机器人编写的一样。这些条目短小、公式化,仅仅包括了统计数字的字符串。

  但一旦这些条目被创建,编辑就将接手,填补有关条目的历史详情、当地管理信息和旅游景点等信息。在2008年,另一款bot通过从在线的美国国家航空和航天管理局数据库抓取一些数据条款,创建了数千条有关小行星的条目。

  维基百科社区现在仍旧依靠bot编写条目的价值来进行划分。一些管理员称,仅罗列了一些数据点的条目价值不大,而另一些管理员则认为,任何新的内容都很不错。

  这一争论的结果就是不再允许bot编写整个条目。但bot执行机械化维护的能力,则解放了编辑,使他们能够进行研究,编写条目,查看其他人的工作,以确保准确性。

  格兰特表示:“我并不认为,人们清楚维基百科上维护的工作量有多大。”

  一些管理员担心,一款叛变了的bot有一天会给维基百科带来灾难性的破坏。

  格兰特指出,这些担心毫无根据。

  例如,一个bot并非像是一部汽车,如果在运营中,一个部件失灵,它将关闭,而不是失去控制,撞上什么东西。
格兰特表示,有权删除页面、屏蔽编辑和进行其他严厉举措的bot,只是由具有管理权限的编辑来掌管。

  如果bot遇到一个程序无法解释的情况,它们确实也会犯错。

  管理员表示,由于维基百科对编辑状况密切追踪,因此当错误发时后,将会被很快修复。负责管理bot的人士表示,人类编辑不用担心,有一天他们将会被bot所取代。

  布莱德表示:“对一个条目的编写,一个条目的校验,甚至是对语法和拼写的整理,都需要人类的判断。”
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于本站 广告服务 联系我们 网站导航 诚聘英才 免责声明 帮助中心
Copyright © 2005 诸城信息港 版权所有 | 增值电信业务经营许可证:鲁B2-20051026号 | 备案/许可证号:鲁ICP备12015127号-7 | 电子公告许可:电信业务审批[2008]字第262号函
投稿信箱:webmaster@zcinfo.net   总机:0536-6017778    新闻、业务热线:0536-2165588   法律顾问:山东东武律师事务所 刘清波、秦丽律师
快速回复 返回顶部 返回列表