17. サーバー生産台数・世界3位
New York Times 2006年7月3日
Dell、Hewlett-Packard、IBMに
続いて「台数ベースで世界4位」
日本の経営雑誌
「FACTA」2009年9月号
「スマートグリッド」でも出し抜
かれる日本
New York Times 2006年7月3日 --傍聴し続けるグーグルは自社
「A Search Engine That's Becoming an
Inventor」
サーバーを内製化している。生産
Google was the world's fourth-largest maker 台数で見ればグーグルは世界3位の
of computer servers, after Dell, Hewlett- サーバーメーカーになる
Packard and I.B.M.
18. Googleは異形のメーカー
英Financial Timesの
Richard Waters記者が公開した
3月6日のブログ
------------------
米Microsoft Researchのトップである
Rick Rashid氏によれば、全世界で出荷
されるサーバーの20%を、ごく少数の企
業が購入している。Microsoft、Google、
Yahoo!、Amazon.comだ。
------------------
4社で150万台のサーバーを1年で購入?
20. Googleのトップエンジニゕによる
The Datacenter as a Computer
Luiz André Barroso氏
http://www.barroso.org/
GoogleのDistinguished Engineer
Urs Hölzle氏
Googleのデータセンター運営担当副社長
「Google's First vice presidenf ot
engineering」
21. Googleは
異形のメーカー
Googleが4月1日に開催した
Efficient Data Center Summit
・2005年11月からコンテナ利用
・コンテナは水冷
・冷却に使った水は、
「冷却塔」(チラー)で再冷却
・2009年4月にベルギーで
「チラーレスデータセンター」
運用開始
・サーバーは自作
・12Vのバッテリー内蔵
・UPS(無停止電源装置)は
使用しない
http://www.google.com/corpor
ate/green/datacenters/summit.
html
49. クラウドは
Googleが定義した
ゕプリケーションサービス
Google
Web検索 ログ解析 Gmail
Maps
論文:
プログラミング言語 Bigtable: A
論文: Sawzall Distributed Storage
Interpreting the Data: System for Structured
Parallel Analysis with Data(2006年)
Sawzall(2005年) 並列プログラミングモデル キー・バリュー型データストゕ
MapReduce BigTable 論文:
論文: The Google File
MapReduce: System(2003年)
Simplified Data 分散フゔルシステム
Processing on Large Google File System(GFS) 論文:
Clusters(2004年)
The Chubby lock
分散ロックシステム service for loosely-
ホワトペーパー: coupled distributed
The Datacenter as a Chubby systems(2006年)
Computer. An
Introduction to the
Design of Warehouse- 独自に建造したデータセンター 論文:
Scale Machines(2009 Failure Trends in a
年) Large Disk Drive
グーグルプラットフォーム Population(2007年)
50. Datacenter as a Computer
名言集
自前主義
• 巨大なクラスタ(システム)を保有し
ないサードパーテゖ・ソフトウエゕ・
プロバダが、ソフトウエゕのテスト
やチューニングを十分な水準で行うの
は困難だ」
51. Datacenter as a Computer
名言集
自前主義
• OSレヤーがあるとすれば、それは「Cluster-Level
Infrastructure」のことだ
• Datacenter must be a general-purpose computer
system.
• There is substantial risk that by the time a
specialized hardware solution is implemented, it
is no longer a good fit
52. Datacenter as a Computer
名言集
スケールゕウト
• ProLiant is about four times more cost-
efficient than the Superdome.(ストレージ
も含むと20倍)
• (我々の)ワークロードはあまりに巨大なので、
どんな大きなSMPサーバーでも1台ではまかな
いきれない(レテンシはLANに集約される)
53. Datacenter as a Computer
名言集
スケールゕウト
• 価格性能比を考えると、安いCPUしか
使わない
• プロセッサ使用率は高いほど消費電力
効率が良い → 安い・遅い方が良い
54. Datacenter as a Computer
名言集
メニーコゕ
• メニーコゕが進めば、サーバーが数十台入る「ラック」に、
現在のデータセンターに匹敵するマシンが収まることにな
る。「Warehouse Scale Computinge(WSC)」は全デー
タセンター運営者の現実となる
WSC
• Computation is moving into the cloud, and thus into
WSCs
55. Datacenter as a Computer
名言集
データセンターの基本
• データセンターの建造コストは「10~20ドル
/W」(建造コストは消費電力で測れ)
• Tier IIは「99.7%」、Tier IIIは「99.98%」、
Tier IVは「99.995%」
• データセンターの最適温度は「摂氏25~27度」
• 「サーバーPUE」も測れ
56. Datacenter as a Computer
名言集
Corrupted (喪失)
•データが再生成できない、失われた、喪失した状態
Unreachable (未到達)
•サービスがダウンしている、ユーザーがサービスに到達できない
Degraded (劣化)
•サービスは利用できるが、状態が劣化している
Masked (隠蔽)
•障害は発生しているが、ソフトウエゕ/ハードウエゕによる耐障害対策によって
ユーザーから完全に見えない状態になっている
57. Datacenter as a Computer
名言集
ソフトウエゕベースの耐障害性対策
• MTBF(平均故障間隔)が30年というサー
バーがあったとしても、それが1万台あれば1
日に1台は故障が起きる
• いくらRAIDでデゖスクを冗長化しても、電源
装置やストレージOSなどが「単一障害点」と
して残る
58. Datacenter as a Computer
名言集
ソフトウエゕベースの耐障害性対策
• もっともECC付きDRAMは使っている。2000
年までECCを使っていなくて酷い目にあった
• In summary, near perfect reliability is not
universally required in Internet services.
62. Datacenter as a Computer
名言集
故障に対する接し方
• 故障予測はコストに合わない。Diskのような小さなサブ
セットに関してのみ故障予測を行っている
• サーバーが故障しても、急いで修理しない。「リペゕ」
バッチでしか行わない。その方が管理コスト抑制になる
結論
• We must treat the datacenter itself as one massive
computer
63. Googleの中の人曰く
ケン・トンプソン氏
• some sort of – not Cloud
Computing but a Cloud Computer;
something that is always there and
always be accessed and always
store data and always give it back.
64. Googleの中の人曰く
ケン・トンプソン氏
• I think that is very hard. There is two types
of jobs; one where you want to do something
huge, (略) one job that takes thousands of
computers to do or you want to do thousands
of little jobs and never fail. And those are
almost like two separate problems, like
MapReduce(略)
65. Googleの中の人曰く
ケン・トンプソン氏
• I am actually more interested in the second, in trying to
get small jobs, the kind of jobs that a user at home will
be restore a file, look at his date book, or pull a video,
little small jobs that are much more reliable than anything
he can do at home.
要約
• スループット指向の処理とレスポンス指向の処理を、両方でき
なくてはならない