架设Wikipedia的本地镜像

您所在的位置:网站首页 维基百科镜像站点 架设Wikipedia的本地镜像

架设Wikipedia的本地镜像

2023-08-20 20:33| 来源: 网络整理| 查看: 265

本文试图总结架设Wikipedia镜像的过程。

 

准备工作

首先需要安装Mediawiki软件,以及Mediawiki所依赖的软件,Apache,Php5,Mysql等,这里就不详细讲解了。对于懒人,有两个选择:

第一是安装Debian[1],这样apt-get install mediawiki就可以完成软件的安装。

第二是下载VMWare Player[2]和一个预安装Mediawiki的虚拟机[3]。

其次需要安装Java[4],因为导入数据的工具[5]是用Java实现的。

然后是硬盘,如果是英文wikipedia[6],需要准备大概10G的空间,如果是中文[7],需要1G左右的空间。注意Mysql数据库文件(典型的安装会使用/var/lib/mysql这个目录)所在的分区应具有足够的空闲空间。

最后,也是最重要的是,想办法下载wikipedia的数据文件,由于数据文件的网站[8],和导入数据文件的工具及其使用说明[9]都被封锁,这个就得自己想办法,各显神通了。由于数据文件很多,记得我们需要的文件名字看起来像是:

enwiki-20061130-pages-articles.xml.bz2 [10],或zhwiki-20061130-pages-articles.xml.bz2 [11]

另外,在制作镜像的过程中,需要对Apache的配置[12]、Mysql的管理[13]和Php[14]有一个简单的了解。

假设我们想要镜像英文Wikipedia,那么准备工作完成之后,我们有一个安装好了Mediawiki,以及下面两个文件:

数据文件:enwiki-20061130-pages-articles.xml.bz2

导入工具:mwdumper.jar [5]

初始化Wikipedia


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3