「Wikipedia:FAQ テクニカル」の版間の差分
m →接続回線はどうなっているのでしょう: 修正 |
|||
(4人の利用者による、間の5版が非表示) | |||
18行目: | 18行目: | ||
もう少し詳しく説明しましょう。ウィキペディアを含む[[ウィキ]]は、一般的に速いスピードで編集されていきます。記事をさっさと書こうと言うときに、HTML はあまり簡単ではありません。リンクを張る、というのが良い例でしょう。「HTML」という項目にリンクを張るのに、HTML では下記のようにしなくてはいけません。 |
もう少し詳しく説明しましょう。ウィキペディアを含む[[ウィキ]]は、一般的に速いスピードで編集されていきます。記事をさっさと書こうと言うときに、HTML はあまり簡単ではありません。リンクを張る、というのが良い例でしょう。「HTML」という項目にリンクを張るのに、HTML では下記のようにしなくてはいけません。 |
||
<pre><a href=" |
<pre><a href="https://ja.wikipedia.org/wiki/HTML">HTML</a></pre> |
||
ウィキペディアのマークアップでは、これがずっと簡単になります。 |
ウィキペディアのマークアップでは、これがずっと簡単になります。 |
||
<pre>[[HTML]]</pre> |
<pre>[[HTML]]</pre> |
||
87行目: | 87行目: | ||
{{MediaWiki:proxyblockreason}} |
{{MediaWiki:proxyblockreason}} |
||
Google Accelarator は Google のキャッシュサーバーをプロキシとして使用するため、ウィキペディアでは |
Google Accelarator は Google のキャッシュサーバーをプロキシとして使用するため、ウィキペディアでは公開プロキシとしてブロックしています([[:en:Wikipedia:Google Web Accelerator]]参照)。編集するためには、ウィキペディアを利用する際には Google Accelarator を停止するようにしてください。その他の高速化ソフトでも、類似の現象が起こりえますので、注意してください。 |
||
== バグを見つけました。どうやって報告すればよいでしょう? == |
== バグを見つけました。どうやって報告すればよいでしょう? == |
||
開発者はMediaWikiのバグを追跡するために [[ |
開発者はMediaWikiのバグを追跡するために [[Phabricator]] という専用サイトを使っています。詳細は、[[Wikipedia:バグの報告]]を参照してください。 |
||
== 新しい機能を考え付きました。どうすれば良いでしょう == |
== 新しい機能を考え付きました。どうすれば良いでしょう == |
||
機能追加依頼も [[ |
機能追加依頼も [[Phabricator]] で行われています。Phabricator の使い方に関しては、[[Wikipedia:バグの報告|バグの報告]]を参照してください。 |
||
== ハードウェアはどうなってるんでしょう == |
== ハードウェアはどうなってるんでしょう == |
||
99行目: | 99行目: | ||
== 接続回線はどうなっているのでしょう == |
== 接続回線はどうなっているのでしょう == |
||
2007年2月現在、アメリカ合衆国フロリダ州[[タンパ]]にあるサーバ (pmtpa) は、コロケーション・プロバイダーである [http://www.powermedium.com PowerMedium] に10 Gbit/s 回線1本、 1 Gbit/s 回線1本で、Time Warner Telecom に1 Gbit/s 回線1本で接続しています。アムステルダムの設備 (knams) は、Kennisnet に 700 Mbit/s 回線1本、大韓民国の設備 (yaseo) は、Yahoo に 1 Gbit/s 回線1本で接続しています。平均した接続スピードは、ピーク時でおよそ 3. |
2007年2月現在、アメリカ合衆国フロリダ州[[タンパ]]にあるサーバ (pmtpa) は、コロケーション・プロバイダーである [http://www.powermedium.com PowerMedium] に10 Gbit/s 回線1本、 1 Gbit/s 回線1本で、Time Warner Telecom に1 Gbit/s 回線1本で接続しています。アムステルダムの設備 (knams) は、Kennisnet に 700 Mbit/s 回線1本、大韓民国の設備 (yaseo) は、Yahoo に 1 Gbit/s 回線1本で接続しています。平均した接続スピードは、ピーク時でおよそ 3.0 Gbit/s です。 |
||
== データベースの大きさはどのくらいでしょう == |
== データベースの大きさはどのくらいでしょう == |
||
119行目: | 119行目: | ||
はい、すべてのウィキペディアのページの、完全なテキストと編集履歴がダウンロードできます。[[Wikipedia:データベースダウンロード]]を見てください。 |
はい、すべてのウィキペディアのページの、完全なテキストと編集履歴がダウンロードできます。[[Wikipedia:データベースダウンロード]]を見てください。 |
||
データベースのダンプをダウンロードすることは、サイト全体を[[クローラ|スパイダー]]する(Web巡回プログラムによってページをくまなく探す)より、'''はるかに'''好ましいことに注目しましょう。サイトをスパイダーすると、非常に時間がかかり、サーバに多くの負荷をかけます(特に、[ |
データベースのダンプをダウンロードすることは、サイト全体を[[クローラ|スパイダー]]する(Web巡回プログラムによってページをくまなく探す)より、'''はるかに'''好ましいことに注目しましょう。サイトをスパイダーすると、非常に時間がかかり、サーバに多くの負荷をかけます(特に、[https://ja.wikipedia.org/robots.txt robots.txt]を無視したり、差分などの組み合わせを10億以上スパイダーしたりすると)。大量のスパイダー行為は、あなたのスパイダーあるいはあなたのIPがサイトへのアクセスから閉め出される原因となることがあります。正当なスパイダー(例えばサーチエンジンのインデックス作成プログラム)は、要求の間に数分待ち、robots.txtに従い、できれば負荷が少ない時間帯にだけ動くように設計されています。 |
||
アップロードされた画像やその他のファイルも、ひとつのアーカイブにまとめられた形で取得することができます。詳しくは[[Wikipedia:データベースダウンロード]]を見てください。 |
アップロードされた画像やその他のファイルも、ひとつのアーカイブにまとめられた形で取得することができます。詳しくは[[Wikipedia:データベースダウンロード]]を見てください。 |
||
126行目: | 126行目: | ||
エッド・サマーズが[https://metacpan.org/pod/release/ESUMMERS/WWW-Wikipedia-1.2/lib/WWW/Wikipedia.pm WWW::Wikipedia]を書き上げてくれました。 |
エッド・サマーズが[https://metacpan.org/pod/release/ESUMMERS/WWW-Wikipedia-1.2/lib/WWW/Wikipedia.pm WWW::Wikipedia]を書き上げてくれました。 |
||
ただ単にページのデータを取得するだけであれば、以下の[[Perl]]のサンプルコードでうまくいきます。これは、[[メインページ |
ただ単にページのデータを取得するだけであれば、以下の[[Perl]]のサンプルコードでうまくいきます。これは、[[メインページ]]を取得して表示しますが、変数'''$url'''を変更すれば別のページを取得することもできます。ソースを取得してしまえば、Perlの正規表現でウィキリンクを探すことができます。 |
||
<syntaxhighlight lang="perl"> |
|||
<pre><nowiki> |
|||
#!/usr/bin/perl |
#!/usr/bin/perl |
||
use LWP; |
use LWP; |
||
$browser = LWP::UserAgent->new(); |
$browser = LWP::UserAgent->new(); |
||
$url = " |
$url = "https://en.wikipedia.org/wiki/Main_Page"; |
||
$webdoc = $browser->request(HTTP::Request->new(GET> $url)); |
$webdoc = $browser->request(HTTP::Request->new(GET> $url)); |
||
if ($webdoc->is_success) # is_successはページの読込み完了判定用のメソッドです |
if ($webdoc->is_success) # is_successはページの読込み完了判定用のメソッドです |
||
140行目: | 140行目: | ||
print $webdoc->content, "\n\n"; # ページ内容(<body>) |
print $webdoc->content, "\n\n"; # ページ内容(<body>) |
||
} |
} |
||
</syntaxhighlight> |
|||
</nowiki></pre> |
|||
全ての日本語のウィキペディアにある項目はまず"https://ja.wikipedia.org/wiki/"と入れ、その後ろに題名(スペースは_(下線)を使ってください)を入れればアクセスできます。 |
全ての日本語のウィキペディアにある項目はまず"https://ja.wikipedia.org/wiki/"と入れ、その後ろに題名(スペースは_(下線)を使ってください)を入れればアクセスできます。 |
2022年5月18日 (水) 12:05時点における最新版
新しい質問はWikipedia:利用案内へどうぞ。
ウィキペディアを稼働させるのに使っているソフトウェアはなんですか
[編集]一番初めはクリフォード・アダムズによる一般的なウィキのスクリプト、UseModWiki を使っていました。2002年1月、PHPスクリプトに移行しました。これは問題点が多かったため次々と修正がなされ、同年7月に現在MediaWikiと呼んでいるものが作られ、完全に置き換えられました。
データベースのバックエンドには MySQL が使われており、またウェブサーバには Apache が使われています。ウィキペディアのサーバのOSは Linux です。
すばらしいソフトウェアですね!私のサイトでも使いたいのですけど
[編集]ウィキペディアを動かしているMediaWikiというソフトウェアの入手方法は MediaWiki.org をご覧ください。その他のウィキスクリプトについてはウィキソフトウェアの記事をご覧になって下さい。
ウィキペディアが使っているマークアップ言語はなんですか
[編集]ウィキは非常にシンプルなマークアップ(軽量マークアップ言語 )を一つの特徴としており、このマークアップ言語を「ウィキテキスト言語(Wikitext language)」「ウィキ記法(Wiki markup)」などと呼んでいます。またウィキテキスト言語を用いて書かれているソースを「ウィキテキスト」と呼んでいます。マークアップの詳細については、Help:ページの編集を参照してください。
HTMLを使わないのはなぜでしょう
[編集]HTML を使わない理由は、一言で言えば、シンプルさと安全性のためです。
もう少し詳しく説明しましょう。ウィキペディアを含むウィキは、一般的に速いスピードで編集されていきます。記事をさっさと書こうと言うときに、HTML はあまり簡単ではありません。リンクを張る、というのが良い例でしょう。「HTML」という項目にリンクを張るのに、HTML では下記のようにしなくてはいけません。
<a href="https://ja.wikipedia.org/wiki/HTML">HTML</a>
ウィキペディアのマークアップでは、これがずっと簡単になります。
[[HTML]]
それから、安全性の問題があります。いくつかのWebブラウザは HTML の記述が原因のバグを持っています。もしウィキペディアでHTMLタグをすべて許可すると、悪意ある利用者が JavaScript のポップアップウィンドウやページのリダイレクトを使って色々な悪さをすることでしょう。いくつかのウィキをはじめ、完全なHTMLによる編集を許可したいくつかの「実験的な」サイトがこういった攻撃を受けています。
ということは、HTMLは全く使えないのですか
[編集]いえいえ。いくつかのHTMLの記述は使えます。また、HTMLのtableタグは表のためのマークアップが実装された今でも有効な手立てです。Help:ウィキテキストにおけるHTMLやHelp:表の作り方を参照してください。
非ASCII文字や特殊記号については
[編集]Unicode や HTML4.0 によって多くの言語体系の文字が扱えるようになってきましたが、コードが定義されているというだけで、実際にすべてのブラウザで使用できるというわけではありません。どのような文字が扱えるか、扱うためにどのような準備が必要かといったことについてはHelp:特殊文字のページをご覧ください。
多くの特殊記号やフォントや図を必要とする数学については
[編集]TeXを使いましょう。ヘルプ:数式の書き方を見てください。
ウィキペディアは Cookie を使用していますか
[編集]ウィキペディアを読んだり編集したりするためには Cookie を必要としません。しかし、ログインしあなたの編集を利用者名で記録するためにはCookieを使用します。
ログインした時には、ログインセッションを識別するための一時的な Cookie が生成されます。これはブラウザを終了させると消去され、一切残ることはありません。
もう1つ、その後のログインを容易にするために保存される Cookie があります(実際は2つで、利用者名と利用者IDの2つを対にして記録しています)。こちらのCookieは30日間保存されます。不安ならば終了後に消しておくといいでしょう。
もしログイン時に「ログイン状態を保持する」というチェックボックスをチェックしていたなら、後者の Cookie に加えてパスワードのハッシュ値(パスワードそのものではありません)が記録されます。この機能を使えばログインの操作を省略することができます。これも30日間保存されますが、それ以外にもログアウトすることで消去することができます(いますぐログアウトする)。不安ならこのオプションを使わないで下さい。
公共あるいは共用の端末(無償提供されている宿の利用料無料のパソコン、図書館の外部接続端末、複数人で共有されることが前提のパソコンなど)では、セキュリティの関係でこのオプションを使うべきではありません。
パスワードのセキュリティは大丈夫ですか
[編集]ログインする時に、パスワードはインターネット上にそのまま送信されます。そのため、その経路上であれば、例えばLANやプロバイダに、パスワードを傍受される可能性はあるでしょう。
ウィキペディア自体はパスワードのMD5ハッシュ値(ただし乱数要素を含む)を保持しています。つまり、もし外部の人間が当サーバーに保存されたパスワードのデータを読んだとしても、あなたのパスワードを解読するのには数週間とも数ヶ月ともいえる長い時間を要するでしょう。もちろん、単語や人名などの解読されやすいパスワードを使用している場合は別でしょうが。
2人以上の人が同時に同じページを編集してしまうとどうなりますか
[編集]あとから「ページを保存」しようとした人は、「編集競合」というメッセージを受け取ります。そして、最近保存された版と自分の編集とをくっつける機会が与えられます。MediaWikiは編集中にプレビューを実行する際にも競合をチェックしています。競合が指摘され、ちょっと違ったメッセージが表示されます。これは、ソフトウェアのバージョン管理でよく使われているCVSと同様です。小さな競合であればMediaWikiが自動で解消してくれることもあります。
これはバグでしょうか
[編集]サイドバーがいつもと違う
[編集]個人設定で外装(スキン)を変更していない場合、画面左側にサイドバーが表示されています。上から、ナビゲーション、ヘルプ、検索、ツールボックスに分類され、それぞれから井戸端などの各ページへのリンクが並んでいます。
しばしば、このサイドバーの部分が英語表記になったり、井戸端へのリンクなどが消えたりします。これはウィキペディアで使用しているソフトウェア (MediaWiki) のバージョンアップによる一時的なものです。通常は数時間で元に戻りますので、バグの報告は不要です。しばらくお待ち下さい。
目次・内部リンクの異常
[編集]下記の状態が起こる場合があります。
- 目次が一部欠ける
- 節(見出し)へのリンクができない
もしノートン・インターネットセキュリティを使用されているのであれば、ノートン・インターネットセキュリティの設定にて「広告ブロック」を無効にしてみてください。
(外部参照)
画像が正しく表示されない
[編集]画像が正しく表示されなかったり、ウィキペディアのロゴ画像が代わりに表示される場合、セキュリティの設定が原因の場合があります。ウィキペディアは高度な Cookie の機能を使う必要があります。ファイアウォールやプライバシー保護機能(IEのプライバシー設定やノートン・インターネットセキュリティ、ZoneAlarm(ゾーンアラーム)といったソフト)で、ウィキペディアからの Cookie を受け入れるよう設定してください。とくに、ゾーンアラームの設定では、プライベートヘッダーインフォメーションとともに Cookie を受け入れる必要があります。
編集が反映されていないように見える
[編集]記事の編集が反映されてないように見えたり、最近更新したページが正しく更新されていないように見えたりする場合、ブラウザのキャッシュが原因の場合が少なくありません。特にインターネットエクスプローラー (IE) では問題が発生することがあります。
Ctrlキーを押しながらブラウザの「更新」を選ぶことで、強制リロード(再読み込み)させることもできます。一時的に回避する方法としては、IEの「ツール-インターネット オプション-全般-ファイルの削除」を選択する方法がありますが、キャッシュが多い場合時間がかかります。しかし、いずれも抜本的な対策ではなく、完全に動作することは保証できません。
以下のことを試してみてください。
- 更新
- Ctrl+更新
- ⇧ Shift+更新
- ⎇ Alt+更新
- ブラウザのキャッシュを削除する
編集できない
[編集]Google Accelarator を使用している場合、次のエラーメッセージが表示され、ウィキペディアを編集できません。
This IP address has been blocked because it is believed to be an open proxy or zombie computer. To prevent abuse, these proxies may be blocked from editing Wikipedia. Please contact your Internet service provider or tech support and inform them of this serious security problem. このIPアドレスは公開プロキシであるか、またはゾンビマシンと推測されるため、投稿ブロックされています。不正利用を防ぐため、これらのプロキシからの投稿は禁止されています。あなたの利用しているインターネット・サービス・プロバイダ、もしくはネットワークの担当者に連絡を取り、これが深刻なセキュリティ問題であることを伝えてください。 詳しくは公開プロキシとして投稿ブロックされた方へをご覧ください。
|
Google Accelarator は Google のキャッシュサーバーをプロキシとして使用するため、ウィキペディアでは公開プロキシとしてブロックしています(en:Wikipedia:Google Web Accelerator参照)。編集するためには、ウィキペディアを利用する際には Google Accelarator を停止するようにしてください。その他の高速化ソフトでも、類似の現象が起こりえますので、注意してください。
バグを見つけました。どうやって報告すればよいでしょう?
[編集]開発者はMediaWikiのバグを追跡するために Phabricator という専用サイトを使っています。詳細は、Wikipedia:バグの報告を参照してください。
新しい機能を考え付きました。どうすれば良いでしょう
[編集]機能追加依頼も Phabricator で行われています。Phabricator の使い方に関しては、バグの報告を参照してください。
ハードウェアはどうなってるんでしょう
[編集]m:ウィキメディアのサーバなどを参照してください。日本語版も他の言語版と同じサーバに置かれています。
接続回線はどうなっているのでしょう
[編集]2007年2月現在、アメリカ合衆国フロリダ州タンパにあるサーバ (pmtpa) は、コロケーション・プロバイダーである PowerMedium に10 Gbit/s 回線1本、 1 Gbit/s 回線1本で、Time Warner Telecom に1 Gbit/s 回線1本で接続しています。アムステルダムの設備 (knams) は、Kennisnet に 700 Mbit/s 回線1本、大韓民国の設備 (yaseo) は、Yahoo に 1 Gbit/s 回線1本で接続しています。平均した接続スピードは、ピーク時でおよそ 3.0 Gbit/s です。
データベースの大きさはどのくらいでしょう
[編集]当然ながら、常に増え続けており、最新の数値は把握しにくいですが、以下のデータが知られています。
- 2003年2月時点で約4ギガバイトでした。
- 2003年8月時点で、データベースが約16ギガバイト、これと別に画像やメディアファイルが約1ギガバイトでした。
- 2004年4月11日時点で約57ギガバイト、増える速さは毎週1~1.4ギガバイトでした。
- 2004年10月9日時点で約170ギガバイトでした。この数字はサポートの部分や全ての他の言語を含みますが、画像やマルチメディアを含みません。
- 2006年6月後半時点でアップロードされたファイルの容量は約372ギガバイトでした(サムネイルを除く)。
- 2006年8月後半時点でデータベースのストレージ容量は約1.2テラバイトでした。この数字はストレージ・ファイルの空き容量やインデックスも含んでいます。おおまかな内訳は以下の通りです。
- 英語版ウィキペディアのコア・データベース:163G
- その他のフロリダ設置のコア・データベース: 213G
- その他の大韓民国設置のコア・データベース:117G
データベースの圧縮ダンプは、https://dumps.wikimedia.org/ から落とすことができます。
ウィキペディアのコンテンツをダウンロードすることはできますか
[編集]はい、すべてのウィキペディアのページの、完全なテキストと編集履歴がダウンロードできます。Wikipedia:データベースダウンロードを見てください。
データベースのダンプをダウンロードすることは、サイト全体をスパイダーする(Web巡回プログラムによってページをくまなく探す)より、はるかに好ましいことに注目しましょう。サイトをスパイダーすると、非常に時間がかかり、サーバに多くの負荷をかけます(特に、robots.txtを無視したり、差分などの組み合わせを10億以上スパイダーしたりすると)。大量のスパイダー行為は、あなたのスパイダーあるいはあなたのIPがサイトへのアクセスから閉め出される原因となることがあります。正当なスパイダー(例えばサーチエンジンのインデックス作成プログラム)は、要求の間に数分待ち、robots.txtに従い、できれば負荷が少ない時間帯にだけ動くように設計されています。
アップロードされた画像やその他のファイルも、ひとつのアーカイブにまとめられた形で取得することができます。詳しくはWikipedia:データベースダウンロードを見てください。
ウィキペディアにデータを送るCPANモジュールはありますか
[編集]エッド・サマーズがWWW::Wikipediaを書き上げてくれました。
ただ単にページのデータを取得するだけであれば、以下のPerlのサンプルコードでうまくいきます。これは、メインページを取得して表示しますが、変数$urlを変更すれば別のページを取得することもできます。ソースを取得してしまえば、Perlの正規表現でウィキリンクを探すことができます。
#!/usr/bin/perl
use LWP;
$browser = LWP::UserAgent->new();
$url = "https://en.wikipedia.org/wiki/Main_Page";
$webdoc = $browser->request(HTTP::Request->new(GET> $url));
if ($webdoc->is_success) # is_successはページの読込み完了判定用のメソッドです
{
print $webdoc->title, "\n\n"; # ページタイトル(<title>)
print $webdoc->content, "\n\n"; # ページ内容(<body>)
}
全ての日本語のウィキペディアにある項目はまず"https://ja.wikipedia.org/wiki/"と入れ、その後ろに題名(スペースは_(下線)を使ってください)を入れればアクセスできます。