統計数理研究所TOP 統計数理研究所は高度な知識とスキルを持ったデータサイエンティストを育成するプログラムを積極的に推進しています。 統計科学の最先端理論・手法から基礎的なものまでを学べる多様な一般講座の他、系統的な講座編成により現代的な統計科学の姿を示すリーディングDAT講座を実施します。また、医療健康データ科学研究センターの講座も開講します。 リーディングDAT講座と一般講座は受付が始まったら統計数理研究所公開講座のX(旧Twitter)でお知らせいたします。 過去の公開講座は こちら からご覧いただけます。 リーディングDAT講座 ※2024年度の詳細は決定次第公開いたします。2023年度の情報はこちら 2017年度までの「統計学概論」は発展的にこの講座に吸収されました。 一般講座 日程等変更となる可能性があります。お申込前に必ず確認して下さい。 医療健康データ科学に関わる人材育成事
2021/9/10 追記: 改めて更新された話を統合して整理して書き直しました. 以降はこちらを参考にしてください: ill-identified.hatenablog.com 2021/1/15 追記: RStudio 1.4 がリリースされたのでなるべくアップデートしましょう 2020/12/06 追記: Japan.R で今回の話の要約+新情報を『Mac でも Windows でも, PNG でも PDF でもRのグラフに好きなフォントで日本語を表示したい (2020年最終版)/Display-CJK-Font-in-Any-Gpraphic-Device-and-Platform-2020 - Speaker Deck』として発表した. ハイライトは「近々出るRStudio 1.4 があれば fontregisterer はほぼいらなくなる」 2020/10/31 追記: geom
就職活動や転職活動の際に心配なのが、うっかり「ブラック企業」に入社してしまうこと。入る前はいいところだと思っても、実はパワハラが横行していたり、異常な量の残業が課されたり…なんて目には遭いたくない。 でも企業は、入社前に自社の悪い面まで教えてくれないので、見分けるのが難しい。事前に判断できれば、わざわざ入らないのに…。 そこで、「ブラック企業アナリスト」として日々ブラック企業と戦う新田龍さんに取材を実施。 そもそものブラック企業の定義や、ブラック企業の見分け方(「ブラック企業マップ」や「ブラック企業大賞」は参考になるのか?など)、ブラック企業に入ってしまった際の対処法などを教えてもらいました! 〈聞き手=森かおる〉 【新田龍(にった・りょう)】ブラック企業アナリスト。働き方改革総合研究所株式会社代表取締役。労働環境の改善や企業防衛のコンサルティングなどをおこない、多数のメディアで労働問題を
機械学習の数理100問の改訂版 (2019年2月24日)。 2018年度の講義も残りわずかになった。 私が着任した昨年度から、基礎工学部情報科学科数理科学コース3年「計算数理B」で、機械学習の数理に関する講義を行っている。その中で、計算数理B100問 を学生に解かせている。 線形回帰 ロジスティック回帰と判別分析 クロスバリデーションとブートストラップ 情報量基準 スパース推定 非線形 決定木 サポートベクトルマシン 教師なし学習 機械学習の演習と言うと、参加費が◯十万円の企業のセミナーなどでも、中身を理解させないで、データを流し込むだけのものが多い。そういうのをみると、頭を使わない勉強方法を奨励しているように思えてならない。この100問は、理論(簡単な数式の証明)だけでなく、R言語でかかれたソースプログラムを理解するようにしている。 データサイエンスの人材が◯万人不足すると指摘する声は多
MCMC(*´Д`)ハァハァ — MrUnadon (@MrUnadon) 2017年9月1日 ちょっと前ですが、TokyoRでベイズ特集回をやった事があります。 その際に、ベイズ統計の基礎という大げさなタイトルでトークをしました。 トークは基礎的(理論的)な話だけでしたので、これはRとstanを使った実践編という感じです。 環境設定 # libraryにattachしておく library(tidyverse) # データ加工 library(rstan) # MCMCハァハァ library(patchwork) # 図を並べる library(lme4) # おまけ # rstanのchainを並列計算させる呪文 rstan_options(auto_write=TRUE) options(mc.cores=parallel::detectCores())
機械学習・データサイエンスのチートシート集、便利なものがたくさん出回っていますが、ちまちまブラウザからダウンロードしていたりしませんか?そんな貴方にお勧めなのがこちらのレポジトリ。 FavioVazquez/ds-cheatsheets https://github.com/FavioVazquez/ds-cheatsheets はい、クリックあるいはコマンド一つで100を超えるチートシートが一括でダウンロードできちゃいますね。以上、釣りタイトル失礼しました。 と、これだけではなんなので、個人的に有用性が高いと感じたものを、大きなサムネイル付きでまとめてみました。ソースとして、DataCamp及びRStudio公式ページの情報量は圧倒的なので、一読をお勧めします。 科学計算・データ操作・可視化 Python (NumPy/SciPy/Pandas/matplotlib/bokeh) Pyt
データの繰り返し処理やapply族を使ったデータフレームの処理などはデータ解析をする上では欠かせませんよね。 そんな時に役に立つのが{purrr}パッケージです。このパッケージは、今までfor-loopさせていた処理や、apply族を使っていた処理をスマートに処理することができます。 慣れるまでに少し時間がかかりますが、使いこなせるようになれば処理の幅が広がることは間違い無いです! 今回はその使い方をまとめていきます。 {purrr}とは map map2,pmap よく使うpurrrの活用法 まとめ 参考 {purrr}とは そもそも{purrr} とは、リストやベクトルを受け取って反復処理をするパッケージです。for文やapply族を使う場合が多いかと思いますが、{purrr}は色々な機能をそなえたモダンなパッケージとなっております。 全部は紹介しきれないので、よく使いそうな関数だけを
都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト はじめに 私は基本的にデータ分析を生業としていますが、どうしても分析の案件が足りない時期は分析以外のものに手を染めることもあります。主に、RPAやクローリング、APIを用いたソーシャルリスニングなどです。今後も分析以外のことをやる時があるとしたら、レパートリーを増やしたいですよね。なので、ORについて調べてみることにしました。 ORとは 公益社団法人日本オペレーションズ・リサーチ学会による定義によると、 「現象を抽象化した数理モデルを構築し, モデル分析に基づいて種々
※「Bリーガー」ではなく「Bリーグアール」と読みます ※この記事は随時更新される予定です bleaguerって何? bleaguerはプログラミング言語Rのパッケージ(拡張機能)です。このパッケージを使うと、B.LEAGUEのデータ分析をするのに便利なデータと機能が簡単にRで利用できます。 bleaguerは私が普段分析作業に使っているデータや関数などを便利にまとめたもので、ここ最近の分析作業はこのパッケージを自分で使いながら行っています。少なくても私の効率はこれで大分上がりました。 何ができるの? 各種B.LEAGUEのデータをRに簡単にロードできます。現時点でサポートされているデータは以下の様なものです。 ゲームの日付 開催アリーナ名称 観客動員数 ゲームの種類(レギュラーシーズン、プレシーズン、ポストシーズン) ホームチームとアウェイチーム チームごとのスタッツ(基本的にはこのページ
携帯電話やスマートフォンが使えなかったころは、何かちょっとした情報を持ち歩こうとするとノートに書き留めておくことが多かった。どこかに行く必要がある場合は、地図帳や印刷した地図を使っていた。今では、持ち歩きたい情報はスマートフォンに入れておけるし、地図など好きなときに確認できる。 それでも、情報を印刷して持っていたい場面もある。そこで、現在クラウドファンディングサービス「Kickstarter」で支援募集中の、ノートなどの表面に直接プリントできる携帯用カラープリンタ「PrintBrush XDR」を紹介しよう。 PrintBrush XDRは、台座を含むサイズが111.2×76.5×72.7mmで、重さが260gの、携帯型インクジェットプリンタ。スマートフォンなどと無線LAN(Wi-Fi)で通信し、各種画像データをノートの紙面やテーブルの表面といった平らな場所に印刷できる。バッテリ駆動するた
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く