株式会社ブレインパッドの2023年新卒研修資料です。基礎統計学について扱っています。

世界の地熱発電能力 国別ランキング・推移 :2025.01.16世界の電力消費量 国別ランキング・推移 :2025.01.16世界の1人当たり電力消費量 国別ランキング・推移 :2025.01.16世界の送電ロス率 国際比較 :2025.01.16世界の送電ロス 国際比較 :2025.01.16世界の電力発電量 国別ランキング・推移(EIA) :2025.01.16世界の火力発電量 国別ランキング・推移(EIA) :2025.01.16世界の水力発電量 国別ランキング・推移(EIA) :2025.01.16世界の原子力発電量 国別ランキング・推移(EIA) :2025.01.16世界の水力発電割合 国別ランキング・推移 :2025.01.16世界の原子力発電割合 国別ランキング・推移 :2025.01.16世界の再生可能エネルギー発電量 国別ランキング・推移(EIA) :2025.01.1
生存権の最後の砦の生活保護ですが,時代と共に受給世帯は増えてきています。 厚労省『被保護者調査』によると,1995年度の受給世帯数(月平均)は約60万世帯でしたが,10年後の2005年度に100万世帯を超え,2014年度には160万世帯に達しました。平成の「失われた20年」にかけて,生活に困窮する世帯が増えたためです。 しかしそれ以降は横ばいです。コロナ禍の昨年は増えただろうと思われるかもしれませんが,2019年度は162万7724世帯,20年度は162万9522世帯で,ほんの微増にとどまっています。困り果てている人は間違いなく増えているはずですが,生活保護の受給世帯数はほとんど変わっていない。2019年7月から2021年7月までの受給世帯数のグラフ(月単位)を描くと,ほぼ真っ平です。最近の生活保護の機能不全については,先週のニューズウィーク記事で書きました。 ここで書くのは,その続きです
先日、学生から「Octaveではrandn()で正規分布に従う乱数が作れるが、C/C++にはそのようなものが用意されていないようで困っている」との相談がありました。聞いてみると、厳密に正規分布に従う必要はなく、ゼロ近傍の発生確率が高く、ゼロから離れるに従って発生確率が低くなればいいとのこと。試行錯誤して、sin(rand())など、乱数を生成した後に非線形の関数で変換してやればなんとかなりそうだ、というアイデアもすでに持っていたので、こんな方法もあるよと、二つの方法を紹介しました。(学生はC++のコードを書いていましたが、ここではMatlabコードで書いています。) まずは一様乱数ふたつをかけ算するもの。これは-log(x)に従う乱数になります。(図の上側パネル参照) N = 10000; x = rand(N,1) .* rand(N,1); hist(x, sqrt(N)); 次に一様
Other indicators visualized on maps: (In English only, for now) AIDS estimated deaths (UNAIDS estimates) Adolescent fertility rate (births per 1,000 women ages 15-19) Age at first marriage, female Age at first marriage, male Age dependency ratio (% of working-age population) Antiretroviral therapy coverage (% of people living with HIV) Antiretroviral therapy coverage for PMTCT (% of pregnant women
47都道府県を対象とする「人口10万人あたりの自殺者数」についての都道府県ランキングです。 公的機関の調査などでも秋田県は自殺率が日本で一番高いなどと言われていますが、秋田県民は自殺で死亡する割合が多い地域というイメージは正しくありません。秋田県は住民の平均年齢が日本一高く、人口割合で自殺しやすい中高年が多いため、このランキングのような結果になっている可能性があります。 事実、死亡者に占める自殺を死因とする死亡者数は、一番ではありません。死亡者1千人あたりの自殺者数をご覧ください。 最上位から、1位は秋田県の31.86人、 2位は岩手県の27.82人、 3位は宮崎県の27.48人です。 最下位から、47位は奈良県の17.28人、 46位は福井県の18.11人、 45位は徳島県の18.59人です。 日本地図の色分け(ランキング地図)により、「人口10万人あたりの自殺者数」の偏差値を地理的に確
対応のない 2 群間の量的検定手法として、最も有名なのは Student の t 検定でしょうか。 以前、Student の t 検定についての記事を書きました。 小標本問題と t検定 - ほくそ笑む しかし、Student の t 検定は、等分散性を仮定しているため、不等分散の状況にも対応できるように、Welch の t 検定を使うのがセオリーとなっています。 ただし、これら 2つの検定は分布の正規性を仮定しているため、正規性が仮定できない状況では、Mann-Whitney の U検定というものが広く使われています。 Mann-Whitney の U検定は、正規性を仮定しないノンパラメトリック検定として有名ですが、不等分散の状況でうまく検定できないという問題があることはあまり知られていません。 今日は、これらの問題をすべて解決した、正規性も等分散性も仮定しない最強の検定、Brunner-
今までは、おもに「確率論(Probability Theory)」の話題が中心でした。事象の集合から確率変数に置き換えて、確率密度関数として分布の形状を見ることによって、物事の起こりやすさを定量化することが、確率論の主な目的と考えることができます。元々、ギャンブルに有利に勝つ方法を数学を使って見つけるための手段として確率というものが誕生したわけですが、今では様々な分野で応用されている重要な学問の一つとなっています。 ここからは「統計学(Statistics)」の話題が中心となります。統計学は、たくさんのデータから意味のある情報を抽出するための手法を研究する学問です。そのための道具として確率論が取り入れられていることから、確率と統計はペアで紹介されることが多いわけです。まずはデータを集める手法から始めて、そのデータの性質を調べるための方法について紹介したいと思います。 1) 標本の抽出 対象
正規分布(せいきぶんぷ、英: normal distribution)またはガウス分布(英: Gaussian distribution)は、確率論や統計学で用いられる連続的な変数に関する確率分布の一つである[1]。データが平均の付近に集積するような分布を表す。主な特徴としては平均値と最頻値、中央値が一致する事や平均値を中心にして左右対称である事などが挙げられる[1][2]。 中心極限定理により、独立な多数の因子の和として表される確率変数は正規分布に従う。このことによって正規分布は統計学や自然科学、社会科学の様々な場面で複雑な現象を簡単に表すモデルとして用いられている[1]。 たとえば、実験における測定の誤差は正規分布に従って分布すると仮定され、不確かさの評価が計算されている。 正規分布の確率密度関数のフーリエ変換は再び正規分布の密度関数になることから、フーリエ解析および派生した様々な数学
ツイッターをしていたら「健康寿命」について知らない人がいた。この話は自著にも書いたのになあと思ったが、だからみなさんが知っているというわけはないよな、当然。 「健康寿命」にはそれなりに定義はあるが、ざっくり言って健康に生きていられるまでの年齢というような考えである。いわゆる平均寿命より10年くらい短い。男性だとだいたい70歳くらいまで。 自分も気がつくとけっこう年を取ってしまったので、まあ普通に生活できたとしても、不自由なく動けるのはあと12年といったところ。個人的にやだなあと思うのは、そのくらいまで生きていても、文字の読み書きがまともにできなくなるんだろうな、というあたり。失明はするだろうなあ。 ちなみに平成22年時点の日本人の健康寿命はこんな感じ。厚生労働科学研究費補助金「健康寿命における将来予測と生活習慣病対策の費用対効果に関する研究」より。 最新の統計だったかなと、先日発表された2
すくらむ国家公務員一般労働組合(国公一般)の仲間のブログ★国公一般は正規でも非正規でも、ひとりでも入れるユニオンです。 2年間で約2万個のおにぎり作り集中のため、最難関校受験の選抜クラスから普通クラスに転籍したという「おにぎりマネージャー」の件ですが、いちばん大きな問題は、高等学校という教育の場において、性別役割分担の固定化を助長し男女共同参画社会に逆行するものだということが指摘できます。それは、政府が公表している国際比較を見ても明らかです。 上のグラフは、内閣府「男女共同参画社会に関する国際比較調査(2002年度調査)」から私が作成したものです。(2002年度の調査なので古いですが、この件の国際比較は直近ではこれしか見つけられませんでした)「食事のしたくを主にするのは誰か?」を調査したものですが、グラフにあるように日本は9割が女性と他国と比較し突出しています。内閣府もあきれ気味で、「夫」
本記事の編集方針 ※この記事に興味をもたれた方は、 A/Bテスト カテゴリーの記事一覧 - 廿TT も、必要に応じてご覧いただければと思います。 本記事はもともとは、「A/Bテストの数理」への批判:「有意」とはなにか の続き的なエントリでした。 しかし、予想外に反響があったため Request for Comments(ご意見求む)の精神で、随時更新している部分もあります。 ただし、ベースとなる主張、Web系施策のA/Bテストに、仮説検定は向かないという部分は変化していません。 もしぼくの考えが変わり、「やっぱ仮説検定、いいかも」となった場合、本記事の存在価値はほぼ消滅します。 そのようなことがあれば、ページ最上部に「考えが変わりました」と明記します。 また、他の修正箇所も区別して明記し、差分がわかるようにします。 ただし細かい言い回しや、誤字脱字等はだまって修正します。 目次: そもそも
厚生労働省は4日、4月に生活保護を受給した世帯が前月より4488世帯少ない163万5280世帯だったと発表した。2カ月ぶりの減少。65歳以上の高齢者世帯が増えた一方、失業者のいる世帯など高齢者以外の世帯が大きく減少した。雇用情勢の改善が影響したとみられる。 一時的な保護停止を除く受給世帯の内訳を見ると、65歳以上の「高齢者」は87万9041世帯。うち単身世帯が80万779世帯で受給世帯全体の約半数を占める。高齢者以外では、「母子」が8万7464世帯、失業者を含む「その他」は24万9717世帯だった。
世界各国の経済水準・所得水準(1人当たり実質GDP)を超長期的に推計していることで著名なアンガス・マディソン氏のデータにより、日本と主要国の所得水準の歴史的な変遷をグラフにした。 統計が整備されていなかった古い時代の数値に現代と同じ厳密さを要求しても無理であるが、ともかくデータを推計している点に意義があるといえる(5.参照)。 日本の1940年以降の1人当たり実質GDPの年次推移については図録4440参照。 日本の所得水準は紀元前後には400ドルであったのが、江戸時代には500ドル台に達している。20世紀に入って1000ドルを越え、1940年に2,800ドルとなったが、戦後の混乱の中で1950年には再度2000ドル以下となった。この後、経済の高度成長で一貫して成長が続き2000年には2万ドルを超過している(下記の付表参照)。 世界倍率を見ると、1950年まではほぼ世界水準と同水準で推移した
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く