不需要一定要掛在網路上
<嗯 , 硬碟空間要夠大 , 如果妳想要下載英文版的 維基百科 , 如果是中文版的也不小 維基百科>
合不合法? 當然合法 , 在合理的使用範圍內
環 境的準備: (以下是以在 Ubuntu 環境下作說明 , Windows其實應該也適用)
請參閱我的
說 明 ,並且將 Mediawiki 安裝設定完成
注意:
在要繼續往下作之前 , 如果你已經在你的 Mediawiki上有編輯一些頁面了 ,請你自己想辦法把它備份下來 , 因為接下的動作可能清掉你原有的頁面....
八道程序完成下 載安裝好你的離線版維基百科....<不過你的硬碟空間要留夠...>
(1)下載離線版維基百科
下 載 維基百科備份檔
到官方網站頁面 http://download.wikipedia.org/
選 擇 連結 Database backup dumps (http://download.wikipedia.org/backup-index.html)
在 此頁面中 ,
如果是中文版維基百科 , 尋找 zhwiki
如果要英文版維基百科 , 尋找 enwiki
這裡我們使 用 中文版維基百科 作範例
到此頁面中
http://download.wikipedia.org/zhwiki/20071119/
All pages, current versions only.
pages-meta-current.xml.bz2 239.6 MB
( http://download.wikimedia.org/zhwiki/20071119/zhwiki-20071119-pages-meta-current.xml.bz2)
將 它下載下來 ,下載完成後, 千萬不要把它解壓縮...
(2)清除相關既有頁面資料
使 用 MySQL QueryBrowser 連線 MySQL
Server Hostname: localhost
UserName: root
Password: XXXX
然後資料庫選擇 wikidb
輸入以下指令 , 並執行
delete from page;
delete from revision;
delete from text;
(3) 準備匯入工具所需要的環境
在這裡 ,你必須要安裝好 JDK , (Ubuntu下套件管理程式選擇 sun-java5-jdk ,如果套件管理程式有附件套件提示需要選擇 ,也請選要安裝)
而且 MySQL JDBC Driver 也需要安裝(Ubuntu下套件管理程式選擇 libmysql-java (這是JDBC Driver for MySQL) ,如果套件管理程式有附件套件提示需要選擇 ,也請選要安裝)
(4)下載匯入工具
請 下載此工具 , 到你的機器上 , 假設下載到你的桌面上
http://download.wikimedia.org/tools/mwdumper.jar
(5) 匯入動作前的注意事項
在這裡因為是只匯入中文部份的維基百科條目(檔案只有幾百MB) , 所以有些相關的參數設定 ,都只需要預設值就可以執行
如果你是要匯入英文版的維基百科 , 那包含 MySQL , 跟Java的參數都需要再微調
(6) 執行匯入動作
以下動作 ,會跟你的電腦速度有關 , 可能至少要作一兩個小時 , 不過在同時間 ,你還是可以使用電腦
現 在開啟一個命令列視窗 , (我們假設下載下來的資料檔跟匯入工具都放在桌面上)
輸入以下指令(下面這是一行指令)
java -jar mwdumper.jar --format=sql:1.5 zhwiki-20071119-pages-meta-current.xml.bz2 | mysql -u root -p wikidb
接 著會出現 Enter Password , 請輸入你的 MySQL 的 root 的密碼
接著 就會開始進行匯入流程 , 有點久 , 所以請有點耐心
在匯入完成後....
(7)下載 Mediawiki需要的 extensions
ㄟ 還不能好好的看到離線版的維基百科 ,
我們還需要下載Mediawiki的相關 extensions
我們需要透過 SVN去取回相關的 extensions , 當然透過 Firefox 從Web介面也可以取回
到這個網址
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions
請 對應以下 目錄結構 , 在你的本機的/var/lib/mediawiki1.10下的手動建立四個子目錄
extensions\
+->ParserFunctions
+->Cite
+->CategoryTree
+->wikihiero
然後到上述網址
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions/ParserFunctions/
把之下的 php檔下載並放到對應的目錄下
extensions\
+->ParserFunctions\
(以下類推 , 自己作)
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions/Cite/
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions/CategoryTree
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions/wikihiero
如 果你想要使用 SVN 一次把目錄跟檔案拉回來也是可以 , 請參考最下方的參考文件說明
(8)修改 LocalSettings.php
執行以下指令sudo gedit /etc/mediawiki1.10/LocalSettings.php
加上以下幾行
require_once("$IP/extensions/ParserFunctions/ParserFunctions.php");
$wgUseTidy=true;
require_once("$IP/extensions/Cite/Cite.php");
$wgUseAjax = true;
require_once("$IP/extensions/CategoryTree/CategoryTree.php");
require_once("$IP/extensions/wikihiero/wikihiero.php");
然 後存檔離開
*注意事項:
在Windows 上修改 LocalSettings.php 要小心 ,特別是如果你用記事本(NOTEPAD.exe)修改存檔的話 ,
小心出現存檔後 ,你的 Mediawiki 會出現 甚麼 header 已輸出的錯誤訊息 ,
那是因為php 會預設使用 UTF-8編碼存檔 , 但是Windows上的UTF-8據說有些古怪 ...,
如 果你不幸碰到了 ,請下載 UltraEdit試用版 , 來重新開啟 Localsettings.php
然後透過 UltraEdit的轉碼功能 轉換 ,然後存檔
(9)開啟你的Mediawiki , 就可以看到離線版的中文維基百科
http://localhost/mediawiki
使 用心得, 發現有些分類還是沒有在本機上 , 而且發現簡體中文的條目數竟然多過繁體中文 , 所以像是有些公司的介紹 ,即便是全球化公司 , 上面的內容也只提到大陸的據點 ,而不會提到台灣
*參考資料
官方網頁參考資 料
http://meta.wikimedia.org/wiki/Data_dumps
< 這一篇 , 有十分詳盡的參數修改說明 , 包含 MySQL參數的修改 , 如果你要匯入英文版的維基百科, 建議照著作>
這裡 就提到為甚麼要提供維基百科的 dump 出來
Wikimedia provides public dumps of our wiki's content:
我參考的 另一邊大陸網友的說明文章(架設Wikipedia的本地鏡像)
http://www.xxlinux.com/linux/article/network/server/20070904/9623.html
終 於把它寫完了, 我的步驟基本上都是測試過的 , 包含 MySQL沒有像參考網頁那樣去異動任何參數 ,也可以成功完成(剛好因為 中文維基的檔案比較小 幾百MB)
好吧...好好享受你的離線版維基百科
<其實, 我只是想要離線看 編輯手冊....>
<嗯 , 硬碟空間要夠大 , 如果妳想要下載英文版的 維基百科 , 如果是中文版的也不小 維基百科>
合不合法? 當然合法 , 在合理的使用範圍內
環 境的準備: (以下是以在 Ubuntu 環境下作說明 , Windows其實應該也適用)
請參閱我的
在UBuntu 7.10 上安裝設定 UBuntu Mediawiki
http://tw.myblog.yahoo.com/jw!9b0o7zqYEQTp3BKYq3oYpZO.gQ--/article?mid=578&prev=583&next=567說 明 ,並且將 Mediawiki 安裝設定完成
注意:
在要繼續往下作之前 , 如果你已經在你的 Mediawiki上有編輯一些頁面了 ,請你自己想辦法把它備份下來 , 因為接下的動作可能清掉你原有的頁面....
八道程序完成下 載安裝好你的離線版維基百科....<不過你的硬碟空間要留夠...>
(1)下載離線版維基百科
下 載 維基百科備份檔
到官方網站頁面 http://download.wikipedia.org/
選 擇 連結 Database backup dumps (http://download.wikipedia.org/backup-index.html)
在 此頁面中 ,
如果是中文版維基百科 , 尋找 zhwiki
如果要英文版維基百科 , 尋找 enwiki
這裡我們使 用 中文版維基百科 作範例
到此頁面中
http://download.wikipedia.org/zhwiki/20071119/
All pages, current versions only.
pages-meta-current.xml.bz2 239.6 MB
( http://download.wikimedia.org/zhwiki/20071119/zhwiki-20071119-pages-meta-current.xml.bz2)
將 它下載下來 ,下載完成後, 千萬不要把它解壓縮...
(2)清除相關既有頁面資料
使 用 MySQL QueryBrowser 連線 MySQL
Server Hostname: localhost
UserName: root
Password: XXXX
然後資料庫選擇 wikidb
輸入以下指令 , 並執行
delete from page;
delete from revision;
delete from text;
(3) 準備匯入工具所需要的環境
在這裡 ,你必須要安裝好 JDK , (Ubuntu下套件管理程式選擇 sun-java5-jdk ,如果套件管理程式有附件套件提示需要選擇 ,也請選要安裝)
而且 MySQL JDBC Driver 也需要安裝(Ubuntu下套件管理程式選擇 libmysql-java (這是JDBC Driver for MySQL) ,如果套件管理程式有附件套件提示需要選擇 ,也請選要安裝)
(4)下載匯入工具
請 下載此工具 , 到你的機器上 , 假設下載到你的桌面上
http://download.wikimedia.org/tools/mwdumper.jar
(5) 匯入動作前的注意事項
在這裡因為是只匯入中文部份的維基百科條目(檔案只有幾百MB) , 所以有些相關的參數設定 ,都只需要預設值就可以執行
如果你是要匯入英文版的維基百科 , 那包含 MySQL , 跟Java的參數都需要再微調
(6) 執行匯入動作
以下動作 ,會跟你的電腦速度有關 , 可能至少要作一兩個小時 , 不過在同時間 ,你還是可以使用電腦
現 在開啟一個命令列視窗 , (我們假設下載下來的資料檔跟匯入工具都放在桌面上)
輸入以下指令(下面這是一行指令)
java -jar mwdumper.jar --format=sql:1.5 zhwiki-20071119-pages-meta-current.xml.bz2 | mysql -u root -p wikidb
接 著會出現 Enter Password , 請輸入你的 MySQL 的 root 的密碼
接著 就會開始進行匯入流程 , 有點久 , 所以請有點耐心
在匯入完成後....
(7)下載 Mediawiki需要的 extensions
ㄟ 還不能好好的看到離線版的維基百科 ,
我們還需要下載Mediawiki的相關 extensions
我們需要透過 SVN去取回相關的 extensions , 當然透過 Firefox 從Web介面也可以取回
到這個網址
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions
請 對應以下 目錄結構 , 在你的本機的/var/lib/mediawiki1.10下的手動建立四個子目錄
extensions\
+->ParserFunctions
+->Cite
+->CategoryTree
+->wikihiero
然後到上述網址
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions/ParserFunctions/
把之下的 php檔下載並放到對應的目錄下
extensions\
+->ParserFunctions\
(以下類推 , 自己作)
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions/Cite/
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions/CategoryTree
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions/wikihiero
如 果你想要使用 SVN 一次把目錄跟檔案拉回來也是可以 , 請參考最下方的參考文件說明
(8)修改 LocalSettings.php
執行以下指令sudo gedit /etc/mediawiki1.10/LocalSettings.php
加上以下幾行
require_once("$IP/extensions/ParserFunctions/ParserFunctions.php");
$wgUseTidy=true;
require_once("$IP/extensions/Cite/Cite.php");
$wgUseAjax = true;
require_once("$IP/extensions/CategoryTree/CategoryTree.php");
require_once("$IP/extensions/wikihiero/wikihiero.php");
然 後存檔離開
*注意事項:
在Windows 上修改 LocalSettings.php 要小心 ,特別是如果你用記事本(NOTEPAD.exe)修改存檔的話 ,
小心出現存檔後 ,你的 Mediawiki 會出現 甚麼 header 已輸出的錯誤訊息 ,
那是因為php 會預設使用 UTF-8編碼存檔 , 但是Windows上的UTF-8據說有些古怪 ...,
如 果你不幸碰到了 ,請下載 UltraEdit試用版 , 來重新開啟 Localsettings.php
然後透過 UltraEdit的轉碼功能 轉換 ,然後存檔
(9)開啟你的Mediawiki , 就可以看到離線版的中文維基百科
http://localhost/mediawiki
使 用心得, 發現有些分類還是沒有在本機上 , 而且發現簡體中文的條目數竟然多過繁體中文 , 所以像是有些公司的介紹 ,即便是全球化公司 , 上面的內容也只提到大陸的據點 ,而不會提到台灣
*參考資料
官方網頁參考資 料
http://meta.wikimedia.org/wiki/Data_dumps
< 這一篇 , 有十分詳盡的參數修改說明 , 包含 MySQL參數的修改 , 如果你要匯入英文版的維基百科, 建議照著作>
這裡 就提到為甚麼要提供維基百科的 dump 出來
Wikimedia provides public dumps of our wiki's content:
- for archival/backup purposes
- for offline use <-- 為了可以離線使用
- for academic research
- for republishing (don't forget to follow the license terms)
- for fun! <-- 為了高興 ,好吧...
我參考的 另一邊大陸網友的說明文章(架設Wikipedia的本地鏡像)
http://www.xxlinux.com/linux/article/network/server/20070904/9623.html
終 於把它寫完了, 我的步驟基本上都是測試過的 , 包含 MySQL沒有像參考網頁那樣去異動任何參數 ,也可以成功完成(剛好因為 中文維基的檔案比較小 幾百MB)
好吧...好好享受你的離線版維基百科
<其實, 我只是想要離線看 編輯手冊....>