Wikipedia:FAQ テクニカル
編集 | テクニカル |
---|---|
|
ウィキペディアを稼働させるのに使っているソフトウェアはなんですか
一番初めはクリフォード・アダムズによる一般的なウィキのスクリプト、UseModWikiを使っていました。2002年1月、PHPスクリプトに移行しました。これは問題点が多かったため次々と修正がなされ、同年7月に現在MediaWikiと呼んでいるものが作られ、完全に置き換えられました。
データベースのバックエンドにはMySQLが使われており、またウェブサーバにはApacheが使われています。ウィキペディアのサーバのOSはLinuxです。
すばらしいソフトウェアですね!私のサイトでも使いたいのですけど
ウィキペディアを動かしているメディアウィキというソフトウェアの入手方法はm:メディアウィキをご覧ください。その他のウィキスクリプトについてはウィキソフトウェアをご覧になって下さい。
ウィキペディアが使っているマークアップ言語はなんですか
ウィキは非常にシンプルなマークアップを一つの特徴としており、このマークアップ言語を「ウィキテキスト言語」「ウィキ記法」などと呼んでいます。またウィキテキスト言語を用いて書かれているソースを「ウィキテキスト」と呼んでいます。マークアップの詳細については、Help:ページの編集を参照してください。
HTMLを使わないのはなぜでしょう
HTMLを使わない理由は、一言で言えば、シンプルさと安全性のためです。
もう少し詳しく説明しましょう。ウィキペディアを含むウィキは、一般的に速いスピードで編集されていきます。記事をさっさと書こうと言うときに、HTMLはあまり簡単ではありません。リンクを張る、というのが良い例でしょう。「HTML」という項目にリンクを張るのに、HTMLでは下記のようにしなくてはいけません。
<a href="http://ja.wikipedia.org/wiki/HTML">HTML</a>
ウィキペディアのマークアップでは、これがずっと簡単になります。
[[HTML]]
それから、安全性の問題があります。いくつかのWebブラウザはHTMLの記述が原因のバグを持っています。もしウィキペディアでHTMLタグをすべて許可すると、悪意あるユーザーはJavaScriptのポップアップウィンドウやページのリダイレクトを使って色々な悪さをすることでしょう。いくつかのウィキをはじめ、完全なHTMLによる編集を許可したいくつかの「実験的な」サイトがこういった攻撃を受けています。
ということは、HTMLは全く使えないのですか
いえいえ。いくつかのHTMLの記述は使えます。また、HTMLのtableタグは表のためのマークアップが実装された今でも有効な手立てです。Help:ウィキテキストにおけるHTMLやHelp:表の作り方を参照してください。
非ASCII文字や特殊記号については
HTML4.0でコードが定義されているというだけで、実際にすべてのブラウザで使用できるというわけではありません。何が普通は安全で、何がそうでないのかという詳細な議論はHelp:特殊文字のページをご覧ください。このページは、より多くのブラウザがより多くの機能に対応するようになるのにともなって更新されていくでしょう。
多くの特殊記号やフォントや図を必要とする数学については
TeXを使いましょう。m:ヘルプ:数式の書き方を見てください。
ウィキペディアはCookieを使用していますか
ウィキペディアを読んだり編集したりするためにはCookieを必要としません。しかし、ログインしあなたの編集をアカウントと関連づけるためにはCookieを使用します。
ログインした時に、ログインセッションを識別するための一時的なCookieが生成されます。これはブラウザを終了させると消去され、一切残ることはありません。
もう1つ、その後のログインを容易にするために保存されるCookieがあります(実際は2つで、ユーザー名とアカウント番号です。この2つは対になっています)。こちらのCookieは30日間保存されます。不安ならば終了後に消しておくといいでしょう。
もしログイン時に"セッションをまたがってパスワードを保持する。"というチェックボックスをチェックしていたなら、後者のCookieに加えてパスワードのハッシュ値(パスワードそのものではありません)が記録されます。この機能を使えばログインの操作を省略することができます。これも30日間保存されますが、それ以外にもログアウトすることで消去することができます。不安ならこのオプションを使わないで下さい(公共の端末ではこのオプションを使わないこと!!)
パスワードのセキュリティは大丈夫ですか
ログインする時に、パスワードはインターネット上にそのまま送信されます。そのため、その系路上であれば、例えばLANやプロバイダに、パスワードを傍受される可能性はあるでしょう。
ウィキペディア自体はパスワードのMD5ハッシュ値(ただし乱数要素を含む)を保持しています。つまり、もし外部の人間が当サーバーに保存されたパスワードのデータを読んだとしても、あなたのパスワードを解読するのには数週間とも数ヶ月ともいえる長い時間を要するでしょう。もちろん、単語や人名などの解読されやすいパスワードを使用している場合は別でしょうが。
2人以上の人が同時に同じページを編集してしまうとどうなりますか
あとから「ページを保存」しようとした人は、"編集競合"というメッセージを受け取ります。そして、最近保存された版と自分の編集とをくっつける機会が与えられます。MediaWikiは編集中にプレビューを実行する際にも競合をチェックしています。競合が指摘され、ちょっと違ったメッセージが表示されます。これは、ソフトウェアのバージョン管理でよく使われているCVSと同様です。小さな競合であればMediaWikiが自動で解消してくれることもあります。
これはバグでしょうか
ここのサイトだけフォントがおかしい
Windows ME、98(SEを含む)で、ブラウザにInternet Explorer (IE) を使用している場合、日本語の文字が□で表示されたり、行書体などの飾り文字で表示されることがあります。これは、"font-family"に"sans-serif"を指定しているサイトで発生するIEのバグです。確実な解決法には次の3つがあります。
- OSをバージョンアップする。
- IE以外のブラウザを使用する→Help:メディアウィキに適応するブラウザ参照。
- 【中・上級者向け】ユーザースタイルシートを使ってフォント名を指定する。
その他、以下の方法で直るケースもあるようです。
- 「インターネットオプション」の「フォント」でフォント指定を変更する。
- 「インターネットオプション」の「ユーザー補助」で「Webページで指定されたフォントスタイルを使用しない」にチェックを入れる(ウィキペディア以外のサイトを閲覧する場合にまで影響が及ぶという欠点があります)。
- フォントキャッシュ (ttfCache) を削除後、再起動する。詳細は[1]を参照してください。
サイドバーがいつもと違う
オプションで外装(スキン)を変更していない場合、画面左側にサイドバーが表示されています。上から、ナビゲーション、ヘルプ、検索、ツールボックスに分類され、それぞれから井戸端などの各ページへのリンクが並んでいます。
しばしば、このサイドバーの部分が英語表記になったり、井戸端へのリンクなどが消えたりします。これはウィキペディアで使用しているソフトウェア (MediaWiki) のバージョンアップによる一時的なものです。通常は数時間で元に戻りますので、バグの報告は不要です。しばらくお待ち下さい。
目次・内部リンクの異常
下記の状態が起こる場合があります。
- 目次が一部欠ける
- 節(見出し)へのリンクが出来ない
もしNorton Internet Securityを使用されているのであれば、Norton Internet Security の設定にて「広告ブロック」を無効にしてみてください。
(外部参照)
バグを見つけました。どうやって報告すればよいでしょう?
開発者はバグを追跡するために Bugzilla のトラッカーを使っています。詳細は、バグの報告を参照してください。
新しい機能を考え付きました。どうすれば良いでしょう
機能追加依頼も Mediazilla(ウィキメディア・プロジェクトのための Bugzilla) で行われています。Bugzillaをクリックしてください。Bugzilla の使い方に関しては、バグの報告を参照してください。
ハードウェアはどうなってるんでしょう
m:ウィキメディアのサーバなどを参照してください。日本語版も他の言語版と同じサーバに置かれています。
接続回線はどうなっているのでしょう
2007年2月現在、アメリカ合衆国フロリダ州タンパにあるサーバ (pmtpa) は、コロケーション・プロバイダーである PowerMedium に10 Gbit/s 回線1本、 1 Gbit/s 回線1本で、Time Warner Telecom に1 Gbit/s 回線1本で接続しています。アムステルダムの設備 (knams) は、Kennisnet に 700 Mbit/s 回線1本、大韓民国の設備 (yaseo) は、Yahoo に 1 Gbit/s 回線1本で接続しています。平均した接続スピードは、ピーク時でおよそ 3.0G bit/s です。
データベースの大きさはどのくらいでしょう
当然ながら、常に増え続けており、最新の数値は把握しにくいですが、以下のデータが知られています。
- 2003年2月時点で約4ギガバイトでした。
- 2003年8月時点で、データベースが約16ギガバイト、これと別に画像やメディアファイルが約1ギガバイトでした。
- 2004年4月11日時点で約57ギガバイト、増える速さは毎週1~1.4ギガバイトでした。
- 2004年10月9日時点で約170ギガバイトでした。この数字はサポートの部分や全ての他の言語を含みますが、画像やマルチメディアを含みません。
- 2006年6月後半時点でアップロードされたファイルの容量は約372ギガバイトでした(サムネイルを除く)。
- 2006年8月後半時点でデータベースのストレージ容量は約1.2テラバイトでした。この数字はストレージ・ファイルの空き容量やインデックスも含んでいます。おおまかな内訳は以下の通りです。
- 英語版ウィキペディアのコア・データベース:163G
- その他のフロリダ設置のコア・データベース: 213G
- その他の大韓民国設置のコア・データベース:117G
データベースの圧縮ダンプは、http://download.wikipedia.org/ から落とすことができます。
ウィキペディアのコンテンツをダウンロードすることはできますか
はい、すべてのウィキペディアのページの、完全なテキストと編集履歴がダウンロードできます。Wikipedia:データベースダウンロードを見てください。
データベースのダンプをダウンロードすることは、サイト全体をスパイダーする(Web巡回プログラムによってページをくまなく探す)より、はるかに好ましいことに注目しましょう。サイトをスパイダーすると、非常に時間がかかり、サーバに多くの負荷をかけます。(特に、robots.txtを無視したり、差分や何かの組み合わせを10億以上スパイダーしたりすると。)大量のスパイダー行為は、あなたのスパイダーあるいはあなたのIPがサイトへのアクセスから閉め出される原因となることがあります。正当なスパイダー(例えばサーチエンジンのインデックス作成プログラム)は、要求の間に数分待ち、robots.txtに従い、できれば負荷が少ない時間帯(2:00-14:00 UTC が1日のうちで軽いほうの半分)にだけ動くように奨励されています。
アップロードされた画像やその他のファイルも、ひとつのアーカイブにまとめられた形で取得することができます。詳しくはWikipedia:データベースダウンロードを見てください。
ウィキペディアにデータを送るCPANモジュールはありますか
エッド・サマーズがWWW::Wikipediaを書き上げてくれました。
ただ単にページのデータを取得するだけであれば、以下のPerlのサンプルコードでうまくいきます。これは、Main_Pageを取得して表示しますが、変数$urlを変更すれば別のページを取得することもできます。ソースを取得してしまえば、Perlの正規表現でウィキリンクを探すことができます。
#!/usr/bin/perl use LWP; $browser = LWP::UserAgent->new(); $url = "http://en.wikipedia.org/wiki/Main_Page"; $webdoc = $browser->request(HTTP::Request->new(GET> $url)); if ($webdoc->is_success) # is_successはページの読込み完了判定用のメソッドです { print $webdoc->title, "\n\n"; # ページタイトル(<title>) print $webdoc->content, "\n\n"; # ページ内容(<body>) }
全ての日本語のウィキペディアにある項目はまず"http://ja.wikipedia.org/wiki/"と入れ、その後ろに題名(スペースは_(下線)を使ってください)を入れればアクセスできます。
参照: m:Machine-friendly wiki interface
このリストにない問題で困っています。どこで訊ねたらよいでしょう
Wikipedia:トラブルシューティングをご覧ください。そこでも示されていない技術的問題については、井戸端でお尋ね下さい。