您一定听说过 Wikipedia (维基百科全书),但是您是否知道还有一些与 Wikipedia 相关的站点,它们可以提供同样有价值的由用户生成的内容?大量隶属于 Wikipedia 的相关站点对 Web 开发人员非常有用。了解如何通过 Wikipedia 以外的资源丰富您的信息空间,包括应用这些站点的数据的小部件示例。
Wikipedia 一直被认为是最流行的和最知名的 Web 站点之一。从想要完成家庭作业的学生,到希望利用用户生成内容的 Web 开发人员等等,都可以通过 Wikipedia 满足需求。但是就提供有用信息而言,Wikipedia 仅仅是一个更庞大资源的一部分。Wikimedia Foundation (维基媒体基金会)组织不仅运营 Wikipedia,并且还运行很多其他站点。它在主页中这样声明:“想像这样一个世界,它让每个人都可以自由分享所有的知识。这就是我们的承诺。”这是一个伟大的宣言,它不是一个庞大的百科全书就可以实现的。您可能已经了解到 Wikipedia 拥有大量不同语言的版本。(令我感到吃惊和欣慰的是,我发现了大量有关 Igbo 语的 Wikipedia 文章,这是我的母语)。但是您是否知道多长时间才会出现使用其他语言表示的有用信息(未翻译为英语)?您以前是否听说过 Wiktionary、Wikinews、Wikibooks、Wikisource、Wikiversity 以及类似内容?您是否知道可以通过利用这个庞大的信息源为您的 Web 项目获得一些好处?我将在本文中向您展示更优秀的 Wikimedia,并给出一些代码帮助您的站点的用户 “自由地分享所有知识”。
下面将简单介绍除知名的 Wikipedia 以外,Wikipedia 家族中涵盖的其他一些站点。
Wiktionary 是与 Wikipedia 相对应的字典站点。很多人对这个开放内容的百科全书的实用性表示怀疑,并且不受关注的字典编纂工作似乎是一项更加艰难的任务。在 “有效” 条目的数量方面,法语版本的站点规模最大,紧随其后的是英语版本的站点,后者拥有目前为止最全面的条目和编辑。排在第三位的土耳其语版本与前两者差距比较大,但是有 9 个语言版本的站点至少具有 1000,000 个 “有效条目”,大量其他语言版本也接近这个规模,这些站点联合起来就形成了一个令人吃惊的规模。其中一些站点通过使用自动程序从一些免费的信息源导入条目来进行扩展。例如 French Wiktionary,它包括大量来自 Dictionnaire de l'Académie française 这种旧式的、免费的字典的条目。很多 Wiktionary 条目包括到其他语言的翻译,因此另一个特性就是大量导入其他语言版本中列出的翻译。条目类型众多,从无实际内容的存根(尤其是那些没有被分类为 “有效” 条目的内容),到包含丰富内容的条目,比如词源、用例、发音(包含音标字母和声音文件)、交叉参考、不同语法形式、翻译,甚至包含对重要文本(例如 Project Gutenberg)的外形分析。
Wikinews 是获得有关新闻和时事文章的站点,它的理念是具有某些知识或参与某些事件的人士可以帮助填充相关页面的内容。其原则是必须秉持中立的观点撰写文章。Wikinews 可以包含新闻报道、多媒体报道、采访等内容。随后出现了 Wikimedia Radio,并最终发展为一个固定的流式音频广播站点,包括各种节目和新闻,并且这些内容大部分来自 Wikinews 和其他 Wikimedia 项目。通常,Wikinews 覆盖范围往往倾向于那些拥有大量贡献者的地区和主题,这限制站点本身发展为综合性站点。此外,Wikipedia 的流行意味着它经常及时地更新站点的文章,甚至按照匹配新闻报道的速度进行更新,因为它经常从 Wikinews 项目获得内容。
对百科全书文章进行的最大扩展就是将它的主题变成一本完整的书籍,而这正是 Wikibooks 的领域。它包含了 Wikijunior,一个面向儿童和儿童教育的文本集合,它可能很快将成为独立的完整项目。Wikiversity 曾经也是 Wikibooks 的一部分,它成为了一个完整的 Wikimedia 站点。Wikiversity 鼓励以小组或社区的方式进行学习,参与者编辑学习项目页面并进行有助于理解的实践。它被编排成各种学科,主要侧重于所有结合了教科书的支持资源。Wikibooks 托管教科书并且还支持协作式社区开发,Wiki 页面将扩充后的零碎内容并入到完整的书籍中。书籍和学科涵盖了各种内容,包括学习语言、计算机科学、有机化学和法律等。从事生物科学的教育者还应关注 Wikispecies,这是一个有关生命形式的分类字典,类似于一个有关生物学的、具有适当结构的 Wikipedia。
Wikisource(也称为 The Free Library)将所有这些二次信息处理为原始文档,用于收集源文本、注释、翻译和辅助材料。文本可以是小说或非小说作品、历史记载、公共文档或任何重要的并且不受版权限制的内容。
Wikiquote 是一个开放的参考资料站点,包括各种语言的引用自历史和文化方面的语录。对于 Wikiquote 最近存在争议,一些人考虑到内容的合适性和版权侵犯,认为应该撤销这个网站。有人认为应该将语录添加到 Wikisource 中。然而,还有很多人认为如果 Wikisource 存在任何内容问题,社区在采取关闭 wiki 这种过激举措之前,首先应该尝试解决这些问题。当然,这种行为在短时间内是不可能发生的。
Wikimedia Commons 是 Wikimedia 家族的姊妹站点,托管图像、视频、音频和其他任何免费的媒体文件。它是一个非常大型的资源库,包含数百万个文件。它的目标是成为这类媒体文件的文化资源库,并试图通过对重要的图像进行分类和认定进一步实现这个目标。
Wikimedia 空间的行为的广度和高度为相互交流和 Wikimedia 以外的有用应用程序提供了众多机遇。这就是 Web 2.0 的精髓。用户可以获取目前尚未集成的开放数据流,并超越原始发布者的最初意图,将它们转换为全新的应用程序。
目前,有关如何跨各种 Wikimedia 属性进行搜索并不明确。一些独立的项目提供了一种聚合搜索,但是其实用性分为多个级别,因此,完全有理由实现自己的搜索。Google 的其中一个计划 Google Co-op 提供了一个自定义搜索引擎(CSE)工具,它允许您根据自己的规范定义并创建搜索工具,甚至可以通过详细的注释维护。我创建了一个自定义搜索 “Wikimedia plus”,包含了所有受支持的语言,以及其他一些有趣的相关站点。清单 1 显示了搜索的主要条件。
清单 1. 自定义搜索条件
|
注意通配符形式,这是 CSE 的特性之一。Google 为 CSE 提供了一个小部件表单。清单 2 展示了用例。
清单 2. “Wikimedia plus” 搜索引擎部件的用法示例
<?xml version="1.0" encoding="UTF-8"?> |
为了进行格式化,我将 Google 的长 URL 分解为多个行。在试用或修改该清单前,只需删除 script
元素中的换行符。图
1 展示了结果页面的截图。Google 的 JavaScript 使用包含搜索表单的 iframe 替换了该元素。当输入搜索时,将在一个独立的窗口打开结果页面。
图 1. 使用 Google Wikimedia plus 部件的示例页面
本文转自IBM Developerworks中国
来源:CSDN
作者:ibmjournal
链接:https://blog.csdn.net/ibmjournal/article/details/3549753