Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
これは何かGoogleの Material Design Guideline - Data Visualization がとても良くまとまっていたので、自分なりに和訳・編集してまとめたものです。 ※ 注意事項 こちらはあくまで、もとのドキュメントを参考に筆者が和訳・編集したものになります。原文の完全な和訳ではなく、抜粋の範囲や、英=>和の際の意訳を筆者が恣意的に行っています。 筆者の意訳・編集による曲解や元のドキュメントでのオリジナルの文意が気になる方は原文を読むことを強くおすすめします。 和訳の公開の可否についてはGoogle社に直接問い合わせています。1 / 原理原則(Principles) データの可視化は、複雑で内容の多い情報をグラフィカルな形式で表現するコミュニケーション手段である。 可視化の結果、データを比較しストーリーを伝えることが容易になり、データの利用者の意思決定の助け
カトオ @ktsn0 ひろゆき(@hiroyuki_ni )氏が「若者が選挙に行けば政治が変わると言ってる人は全て嘘つき。2〜30代の投票率が100%になっても40代以上が40%投票するだけで同数。40代以上の投票率は常に50%近い。これは僕の考えとかじゃなくて単に事実」と言っていたので調べたらマジだったのでご査収ください。 pic.twitter.com/RKkp4hEuAH カトオ @ktsn0 とはいえ、選挙は若者vs高齢者の戦いではなく政党の戦いですし、40代以上でも若者の未来を考えて投票に行く人もいますので、若者は投票に行ってもいいんじゃないかなと思います。一番無駄なのはTwitterで政権批判を繰り返し、クソリプバトルをすることです。意見は選挙箱へどうぞ。 カトオ @ktsn0 「若者よ、選挙に行くな!」という少し過激な動画が日本でもバズりました。あれはアメリカで話題になった動
1.一般的なチャート (1)RAWGraphs RAWGraphs はクラウド型、オープンソースのデータ視覚化ツールであり、 Excelのデータを処理するためによく使われます。RAWGraphsにデータをアップロードし、ほしいグラフを設計して、 SVGかPNGの画像に出力すれば済みます。RAWGraphsにアップロードされたデータは Web側でのみ処理されるので、 データの安全を保証できます。 (2)ChartBlocks ChartBlocks はグラフ作成のオンラインツールであり、スマートデータインポートガイドに従えば、データのインポートとグラフの設計を簡単に完了します。グラフを SVG、PNG、JPEGの画像や PDFへの出力が可能です。また、 Facebook やTwitter などのSNSで作ったグラフを共有するだけではなく、生成したグラフのソースコードを Webサイトに埋め込む
SRE所属の @siroken3 です。最近はもっぱらパートナー会社様とのデータ連携環境構築を主に、時々プロダクションのMySQL環境と分析基盤との連携インフラの構築が多いです。 本記事は、メルカリに出品された過去すべての商品をBigQueryへ同期するにあたって取り組んだ時のお話です。 背景 当社では分析目的などでBigQueryを以前から使用しており、プロダクションのMySQLからBigQueryへデータを同期して分析に活用してきました。特に商品を表すテーブルは重要です。 しかし、後述する課題によりBigQueryにアップロードすることができなかったため、分析用のMySQLDBのスレーブとBigQueryを併用せざるを得ませんでした。とはいえ不便なので以前からBigQueryのみで商品テーブルも分析対象としたい要望がありました。 課題 メルカリでは販売済み商品を物理削除していないため、
はじめまして。Zucks Affiliateでエンジニアをしている宗岡です。 今回は、リアルタイム性は求めないけど、簡単に大量のデータをどこか別の場所に転送したい。 という要望に答えてくれるEmbulkを紹介したいと思います。 実際に導入に至ったきっかけや、運用上よくある課題なども触れていきたいと思います。 同じ境遇の人が「簡単そうだしEmbulk使ってみようかな」となっていただければ幸いです。 目次 目次 背景 Embulk以外にも出てきた案 実際のEmbulkの導入と使い方 1. Embulkのインストールとセットアップ 2. 必要なプラグインのインストール 3. 設定ファイルを書く 実務でcodecommitを使った例 設定ファイルの書き方 4. まずはpreviewで問題なさそうか確認 5. 問題なさそうなのでrunして実行 Embulkの運用上、よくぶつかる課題 1. 重複に気付
MongoDB、データベース内のデータをマウス操作で簡単にグラフ化できる「MongoDB Charts」発表。MongoDB World 2017 MongoDB社は、6月20日、21日にシカゴで同社の年次イベント「MongoDB World 2017」を開催。基調講演でMongoDB内のデータを簡単にグラフ化できるツール「MongoDB Charts」を発表しました。 MongoDB Chartsは、MongoDBに統合されたツール。「とてもシンプルに、ドキュメントセントリックで美しいチャートを作るためのツールだ。MongoDBに保存されているどんな統計的データも視覚化できる」(同社CTO兼共同創業者 Eliot Horowitz氏。
はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、
出現確率1%のガチャを100回引いても,4割近くの人は全部はずれる。“本当の確率”を読み解いてみよう ライター:宮里圭介 まったく確率表示をしていなかったり,レア度別の確率のみ表示したりと,タイトルによって対応はさまざまだ スマートフォン向けゲームに欠かせない存在となっている「ガチャ」。お目当てのキャラやアイテムを引き当てたときの嬉しさは格別だし,結構な額のリアルマネーを使ったあげく,ハズレばかりだったときの悔しさもまたかなりのものだ。 すべては運にかかっているので,プレイヤーが頼りにできるデータといえば,公開されている出現確率ぐらいだろう。以前はその確率が公開されていないゲームが多かったが,最近は業界として確率表示を進める動きが強まっており,人気タイトルの「グランブルーファンタジー」でも,本日(2016年3月10日)から装備品個別の出現確率が表記されるようになる。 だが,確率が明らかにな
@soraです。 リズムケアは、この種類のアプリの中で、おそらくナンバーワンだと思えるほど使えるアプリです。 ともかくシンプルで使いやすく、柔軟性があるので、あらゆる事の管理や記録に使えます。 オススメなので是非試してみて下さい。 特徴 シンプルで柔軟 毎日の様々な情報・出来事を自由に記録・管理できます。 体重、体脂肪率、血圧、睡眠時間、体温、お通じ、腹筋回数などなど、必要なものを好きなように残せます。 カスタム度100% 「何を」「どう」記録するかを自分で決められます。 例えばウォーキングを記録する場合、残したいのは歩数なのか、距離なのか、時間なのか。 ニーズは異なると思います。リズムケアならどれでもOKです。 オリジナルのデータBOX(データの入れ物)を作って自由に配置できます。 数値、時間、テキスト、チェックボックスなど、いろいろな「データタイプ」に対応。 ヘルスケアから読み取ること
metrogramは東京の地下鉄に関するデータ(路線/位置/時刻表などの情報)をもとに、普段見る事の出来ない人と電車の流れを視覚的にとらえるプロジェクトです。 ※ 当コンテンツは、WebGLという技術を用いております。最新のブラウザ環境でご覧ください。 metrogram is a Metro-based information visualized project. Including the metro lines, location and so on that normally the object which can not be visualized such as people and metro flow. ※ This work is using the WebGL web technology. Please use the latest version of your
by Personal Creations 総務省統計局が公開している平成25年住宅・土地統計調査の中には「世帯の年間収入階級(5区分)」というデータがあり、「300万円未満、300万円〜500万円、500万円〜700万円、700万円〜1000万円、1000万円以上」の世帯がどのくらいあるかが調査されているのですが、そのデータを地図上にマッピングしたのが「世帯の年間収入マップ」です。「年収1000万円以上の世帯が5%を超える地域」など指定することで、どの地域にどういう年収の世帯が多いのかが一目でわかるようになっています。 世帯の年間収入マップ http://shimz.me/datavis/mimanCity/ ウェブサイトはこんな感じ。 画面左下から世帯年収を「300万円未満」「300万円~500万円」「500万円~700万円」「700万円~1000万円」「1000万円以上」に設定可能で
追記(2017年7月) こちらのスキル要件ですが、2017年版を新たに書きましたので是非そちらをご覧ください。 「データサイエンティストというかデータ分析職に就くためのスキル要件」という話題が某所であったんですが、僕にとって馴染みのあるTokyoR界隈で実際に企業のデータ分析職で活躍している人たちのスキルを眺めてみるに、 みどりぼん程度の統計学の知識 はじパタ程度の機械学習の知識 RかPythonでコードが組める SQLが書ける というのが全員の最大公約数=下限ラインかなぁと。そんなわけで、ちょろっと色々与太話を書いてみます。なお僕の周りの半径5mに限った真実かもしれませんので、皆さん自身がどこかのデータサイエンティスト()募集に応募して蹴られたとしても何の保証もいたしかねますので悪しからず。 統計学の知識は「みどりぼん以上」 データ解析のための統計モデリング入門――一般化線形モデル・階層
「Programming Language Network」は世界中のプログラミング言語や開発者の関連をグラフ化したサービスです(GitHub、Reddit)。 丸いノードが、プログラミング言語、コンピューターサイエンティスト、Foundation、方言、実装などをあらわしていて色で区別されています。ノードの間の線も色によって意味が区別されています。詳しくはサイト左側にある説明を参照してください。 例えば日本人に馴染み深いプログラミング言語Ruby付近を拡大するとこんな感じに。Rubyはまつもとゆきひろ氏によって開発されたことが分かります。 あまりにも膨大すぎてちょっと分かりづらいかもしれませんが、さまざまなプログラミング言語間のつながりを知ることができる興味深いグラフとなっています。ちなみにRedditによると、このデータはWikipediaから抽出していて、抽出するためのソースコードが
今日は、マーケティングや企画に携わる社会人なら知っておきたい、というよりは、知らないと恥ずかしい、無料で利用できる公的統計データのポータルサイト「e-Stat」の情報と、新しい統計データが自動的に飛んでくる「統計メールニュース」の情報をお届けします。 すでに6月も下旬。新入社員の方も配属部署が決まってバリバリ働いていることだと思います。 マーケティングや企画の仕事をする人にとって、調査データというのは大切なもの。 ネット上で発表される「○○のサービスのユーザー数が○○万人」なんて調査データ、みんな好きですよね。Googleトレンドのような検索ボリュームの情報や、どのブラウザがどれぐらい使われているかといった調査データも人気です。 どれも無料で入手できるデータですが、実は税金でちゃんとした手法でつくられている、質の高い調査データというのが、あるのです。 それが、政府の出している統計データ。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く